〔DeepSeek〕 딥시크 深度求索
분류 : LLMs 언어 모델
국가 : 중국
개발사 : 항저우 심도구색 인공지능 기초기술 연구 유한공사
설립일 : 2023년 7월 17일
사용자 : 121만명(2025년 1월 4주차 국내 앱 사용자 기준)
최신 버전 : V3, R1
설립자 : 량원펑 (梁文锋)
DeepSeek(深度求索)는 중국의 헤지펀드 회사 환팡퀀트(幻方量化) 소속 인공지능 연구 기업의 이름이자 같은 회사에서 개발한 오픈 웨이트(Open-Weights) 언어 모델 제품군의 모델명이다. 량원펑이 창업한 회사다.
2024년 12월 발표된 DeepSeek-V3 모델은 서구권에서 개발된 LLM 모델과 경쟁할 수 있을 정도의 성능을 보여 많은 주목을 받았는데, 특히 V3를 개발하는 데 있어 고작 80억 원 수준에 불과한 적은 비용이 들었다는 사실이 알려지면서, 수천억 원의 비용을 들여 엄청난 연산 자원을 축적해야만 고성능 AI를 개발할 수 있다고 굳게 믿어왔던 시장의 고정관념을 깨뜨리는 계기가 되었다.
OpenAI 같은 기존의 선두 그룹들이 조 단위의 천문학적인 자금을 AI 개발에 투입하는 상황에서 이 발표는 워낙 충격적이라 학습에 필요한 자금을 축소하여 발표한 것이 아니냐는 의혹이 제기되었는데, 발표한 논문에서 학습 방법을 공개했기 때문에 학습 비용을 속이는 게 불가능하다는 의견도 있다. 실제로, 비교적 적은 비용으로 논문의 결과가 재현된다는 것이 홍콩대 연구진에 의해 확인되었으며 학습 과정을 복제하려는 프로젝트들도 생겨나고 있다.
뒤이어 2025년 1월에 발표된 추론 모델, DeepSeek-R1은 supervised fine-tuning 기법을 건너뛰고 오로지 강화학습 기법만으로도 뛰어난 추론 성능을 얻어낼 수 있음을 증명했다는 높은 평가를 받았다. 특히 OpenAI o1 모델과 비교하여 수학, 영어, 코딩 부문에 있어 경쟁할 수 있는 수준의 성능을 갖추면서도, 최대 95%까지 더 저렴한 가격을 내세워 전 세계의 관심을 끌었다.
DeepSeek R1이 가져온 엄청난 파급력으로 인해, 일각에선 OpenAI가 ChatGPT 무료 사용자들에게도 o3-mini 모델을 제한적으로 제공하기 시작한 것에 DeepSeek R1이 영향을 주었을 것이라는 시각도 있다.
DeepSeek CEO 량원펑(梁文锋)은 R1 공개일인 2025년 1월 20일에 리창 총리와 면담을 가졌다.
"전 세계에 AGI를 오픈 소스로 제공하는 것이 목표"라고 밝힌 만큼, 실제로 DeepSeek에서 개발된 각종 모델들과 관련 논문들은 오픈 소스로 배포되고 있다.
'Trend & Issue > @AI & Data' 카테고리의 다른 글
〔DeepSeek〕 세계는 딥시크와 전쟁 중…'反딥시크' 커진다 (0) | 2025.02.07 |
---|---|
〔DeepSeek〕 주요국 딥시크 이용 제한 현황 (0) | 2025.02.06 |
〔DeepSeek〕 '딥시크 돌풍' 배경엔 中정부 지원 (0) | 2025.02.06 |
〔DeepSeek〕 전세계 딥시크 차단에도, 본국서 열풍 지속 (0) | 2025.02.06 |
〔DeepSeek〕 빅테크 한 방 먹인 ‘딥시크 쇼크’…전세계 AI 시장 흔들었다. (0) | 2025.02.06 |