〔DeepSeek〕 빅테크 한 방 먹인 ‘딥시크 쇼크’…전세계 AI 시장 흔들었다
中 AI기술 경쟁력 과시, 저비용·고성능 실현가능성에 관심
美 주정부 차원서 이용금지 명령, 개발비 5억 달러 투입가능성 분석도
중국발 인공지능(AI) 혁신에 대한 관심이 뜨다. ‘딥시크(DeepSeek)’라는 중국의 AI스타트업이 저비용 고성능 AI를 발표하면서 전세계적인 주목을 받은 것이다.
딥시크는 크게 알려지지 않은 AI스타트업이다. 챗GPT로 AI 열풍을 불러일으킨 오픈AI를 비롯해 미국이 전세계 AI 시장을 호령하는 상황에서 중국의 스타트업은 아무래도 관심의 외곽에 있을 수밖에 없었기 때문이다.
이에 더해 중국에 대한 AI 반도체 수출을 제한하는 등 미국의 견제는 중국의 AI기술에 대한 미래까지도 불투명하게 만드는 요인 중 하나였다.
허나 설 연휴가 시작된 지난달 27일 상황은 반전했다. 딥시크가 선보인 R1이 오픈AI o1에 필적하는 추론 성능을 발휘할 뿐 아니라 기존 비용의 단 5% 수준에서 이를 구현했다는 사실이 알려졌기 때문이다.
주요 외신보도에 따르면, 딥시크 R1의 훈련 비용은 약 560만달러 수준으로 알려지는데, 이는 오픈AI, 메타 등이 AI 모델 개발에 쏟아 붓는 투자 금액의 10%에도 미치지 못하는 수준이다. 중국 스타트업이 저비용·고성능 AI 개발에 성공한 것이다.
더 놀라운 사실은 딥시크의 성과가 지난 3년간 중국으로의 최신 반도체 수출을 3번이나 제한하는 미국의 규제 속에서 이뤄졌다는 점이다.
AI 경쟁이 격화되면서 더 향상된 모델 구현을 위해 더 강력한 AI 반도체 수급 경쟁이 이뤄지는 상황에서 딥시크는 엔비디아의 구형 칩인 H800 GPU 기반으로 한 컴퓨팅 시스템으로 이를 구현한 것으로 알려지면서 충격을 배가시켰다.
딥시크의 성공은 빅테크를 중심으로 성장해 온 기존 AI 시장에 대한 의구심을 불러일으켰다. 대표적으로 AI 수요 폭증에 따른 강한 성장 기대를 갖던 AI반도체 기업에게 치명타로 다가왔다.
대표적으로 최신 블랙웰이 불러일으킬 수요에 대한 기대감이 높아진 엔비디아의 경우 27일(미국시간) 엔비디아의 주가는 무려 18% 넘게 급락했는데, 2022년 출시된 H800으로 이뤄낸 딥시크의 성과가 블랙웰 수요 기대감에 불안감을 준 까닭이다.
엔비디아 뿐 아니라 ASML의 주가가 8% 하락하는 등 전반적으로 AI 관련주의 동반하락이 발생하면서 기술주 중심의 나스닥 시장이 3%의 하락이 이뤄지는 등 대혼란 상황이 발생했다.
반론도 있다. 저비용 AI는 장기적으로는 더 많은 AI 애플리케이션을 등장시키고 AI 시장 개화의 시기를 앞당길 것으로, 이는 더 많은 AI 반도체의 수요를 불러일으킬 수 있다는 해석도 존재한다. 엔비다아는 대폭락 다음날인 28일에는 8% 상승을 기록하는 등 반전을 이뤄내기도 했다.
◆소프트웨어 아키텍처 중요성 부각
딥시크의 성과는 AI 시장의 중심을 소프트웨어로 이동시키게 될 것으로 예상된다. 소프트웨어 최적화를 통해 AI 성능을 비약적으로 끌어올릴 수 있음을 딥시크가 증명한 것으로, 이는 AI 개발에서 하드웨어 성능만이 아닌, 최적화 기술이 핵심 경쟁력이 될 수 있음을 시사한다.
지금까지 AI 경쟁이 더 많은 자본력과 더 많은 AI칩을 확보해 성능을 끌어올리는 것이 중심이 되던 AI 시장 경쟁이 소프트웨어 최적화 경쟁으로 이동할 수 있다는 의미다.
반대로 AI반도체의 중요성은 과거보다 희석될 수 있으며, 이를 반영하듯 AI반도체의 대표주자인 엔비다아의 주가는 30일(현지시간) 종가 기준으로 전주대비 10% 넘는 하락을 기록하는 등 고전 양상을 보이고 있다.
다른 한편에서는 미국발 AI 규제가 딥시크와 같은 중국 AI스타트업에게 소프트웨어 최적화에 더욱 주력하게 해 혁신을 이뤄냈다는 평가도 나온다.
엔비디아의 최신 칩을 활용할 수 없게 된 환경에서 시스템 성능에 집착하기보다 소프트웨어 아키텍처 최적화에 힘을 주력함으로써 저비용·고성능이라는 AI 혁신을 이뤄내는 의도치 않은 결과가 나오도록 했다는 것이다.
딥시크 외에도 알리바바클라우드, 바이트댄스 등도 AI반도체 규제라는 제한된 환경에서 ‘큐원2.5-맥스’, ‘두바오1.5프로’ 등 경쟁력 있는 AI 모델을 선보이면서 미국발 AI반도체 규제를 극복하는 양상을 보이고 있다.
딥시크의 경우, 통신오버헤드를 줄이는 로드 밸런싱과 여러 토큰의 동시 예측 등의 기법을 통해 AI 추론 시 필요한 메모리를 크게 줄이는데 성공한 것으로 알려졌다.
다른 한편에서 딥시크의 성과는 ‘증류(distillation)’라는 기법에 대한 문제를 부각시킨다. 딥시크가 이뤄낸 AI 혁신 이면에 선도기업의 데이터 무단활동이라는 그림자가 존재할 가능성이 제기되는 것이다.
증류는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용해 유사한 기능을 개발하는 기법이다. 쉽게 말해 선행된 AI 모델의 이해를 추출해 적용함으로써 개발에 들이는 노력을 줄일 수 있는 방식이다.
AI 기업은 자사 모델을 증류 기법에 활용하지 않도록 금지하고 있지만, 실질적으로는 암암리에 AI 업계 전반에서 광범위하게 활용되고 있다고 추정되는데, 딥시크 역시 증류 방식을 활용해 비약적 혁신을 이뤄낼 가능성이 제기되는 것이다.
실제로 블룸버그통신, 월스트리트저널(WSJ) 등은 오픈AI, 마이크로소프트(MS)가 딥시크의 증류 문제를 조사하고 있다고 전하기도 했다.
오픈AI의 데이터가 딥시크, 혹은 딥시크와 관련된 그룹에 의해 허가 없이 무단으로 획득됐는지에 대한 조사에 착수했다는 것인데, 이들 매체의 보도에 따르면 MS 보안 연구원들은 지난해 가을 오픈AI 애플리케이션프로그래밍인터페이스(API)를 사용한 증류 의심사례를 발견해 이에 대해 조사를 진행하고 있다.
◆美주정부, 다운로드 급증에 이용금지 명령도
한편, 미국에서 딥시크 앱 다운로드가 급증하고 있는 가운데 텍사스주가 주정부 소유 기기에서 딥시크 이용을 금지하고 나서 눈길을 끈다.
2일(현지시간) 텍사스주정부에 따르면, 공화당 소속인 그레그 애벗 주지사는 최근 주정부가 지급한 기기에서 딥시크와 중국판 인스타그램(레드노트), 중국 바이트댄스의 틱톡 자매앱인 레몬8 등을 금지하는 명령을 내렸다.
애벗 주지사는 “텍사스는 중국 공산당이 데이터 수집 AI와 SNS 앱을 통해 주의 중요한 인프라에 침투하는 것을 허용하지 않을 것”이라며 “주정부 기관과 중요 인프라, 지적재산(IP), 개인정보를 다루는 직원들은 중국 공산당의 악의적인 스파이 활동으로부터 보호돼야 한다”고 밝혔다.
앞서 CNBC는 지난달 28일 미 해군이 딥시크 앱에 대해 “모델의 근원과 사용에 관한 잠재적 보안 및 윤리적 우려”가 있다며 전체 해군 장병을 대상으로 이용 금지령을 내렸다고 보도한 바 있다.
미국 외에서는 대만 디지털부가 공공부문 직원들에게 안보 위험을 이유로 딥시크를 금지했고, 이탈리아 개인정보 보호기관도 개인 정보 사용의 불투명성을 들어 딥시크 사용을 차단했다.
딥시크가 당초 낮은 비용으로 개발됐다고 알려진 것에 비해 더 큰 비용이 투입됐다는 분석도 나온다.
1일(현지시간) CNBC에 따르면, 반도체 연구·컨설팅업체인 세미애널리시스는 보고서를 내고 딥시크의 AI 모델 개발에 필요한 하드웨어 지출이 “현재까지 투입된 비용만 5억달러를 웃돌 것”이라고 추정했다.
하드웨어 지출은 AI 모델 구동에 필요한 AI칩과 서버 비용 등으로, 이는 딥시크가 당초 주장한 총훈련 비용의 약 90배에 달한다.
세미애널리시스는 “R&D 비용과 운영 및 유지보수에도 상당한 비용이 들어가고 AI 모델 훈련을 위한 합성데이터(Synthetic Data) 생성에도 엄청난 컴퓨팅 자원이 필요하다”고 지적했다.
보고서는 “앤스로픽의 최신 AI 모델인 클로드 3.5 소네트 훈련 비용이 수천만달러에 달한다”며 “하지만 앤스로픽은 아마존과 구글로부터 수십억달러의 투자금을 유치했는데, 이는 AI 모델 운영과 기업 운영에 얼마나 많은 자금이 필요한지 보여주는 사례”라고 설명했다.
2025.02.03 09:00
오현식 기자 hyun@itbiznews.com
'Trend & Issue > @AI & Data' 카테고리의 다른 글
〔DeepSeek〕 '딥시크 돌풍' 배경엔 中정부 지원 (0) | 2025.02.06 |
---|---|
〔DeepSeek〕 전세계 딥시크 차단에도, 본국서 열풍 지속 (0) | 2025.02.06 |
〔Data Labeling〕 월급은 포인트…데이터 라벨링 가혹노동 실태 (0) | 2024.07.18 |
〔Data Labeling〕 데이터셋 산업 현황 보고서 (0) | 2024.07.18 |
〔Data Labeling〕 사투리·국내 주요도로 등 AI 학습용 데이터 170종 개방 (0) | 2024.07.17 |