Trend & Issue/@AI & Data

〔DeepSeek〕 딥시크 深度求索

Paul Ahn 2025. 2. 6. 16:56

DeepSeek 딥시크 深度求索

DeepSeek

 

분류 : LLMs 언어 모델

국가 : 중국

개발사 : 항저우 심도구색 인공지능 기초기술 연구 유한공사

설립일 : 2023 7 17

사용자 : 121만명(2025 1 4주차 국내 앱 사용자 기준)

최신 버전 : V3, R1

설립자 : 량원펑 (梁文)

 

DeepSeek(深度求索)는 중국의 헤지펀드 회사 환팡퀀트(幻方量化) 소속 인공지능 연구 기업의 이름이자 같은 회사에서 개발한 오픈 웨이트(Open-Weights) 언어 모델 제품군의 모델명이다. 량원펑이 창업한 회사다.

 

 

2024 12월 발표된 DeepSeek-V3 모델은 서구권에서 개발된 LLM 모델과 경쟁할 수 있을 정도의 성능을 보여 많은 주목을 받았는데, 특히 V3를 개발하는 데 있어 고작 80억 원 수준에 불과한 적은 비용이 들었다는 사실이 알려지면서, 수천억 원의 비용을 들여 엄청난 연산 자원을 축적해야만 고성능 AI를 개발할 수 있다고 굳게 믿어왔던 시장의 고정관념을 깨뜨리는 계기가 되었다.

 

OpenAI 같은 기존의 선두 그룹들이 조 단위의 천문학적인 자금을 AI 개발에 투입하는 상황에서 이 발표는 워낙 충격적이라 학습에 필요한 자금을 축소하여 발표한 것이 아니냐는 의혹이 제기되었는데, 발표한 논문에서 학습 방법을 공개했기 때문에 학습 비용을 속이는 게 불가능하다는 의견도 있다. 실제로, 비교적 적은 비용으로 논문의 결과가 재현된다는 것이 홍콩대 연구진에 의해 확인되었으며 학습 과정을 복제하려는 프로젝트들도 생겨나고 있다.

 

뒤이어 2025 1월에 발표된 추론 모델, DeepSeek-R1 supervised fine-tuning 기법을 건너뛰고 오로지 강화학습 기법만으로도 뛰어난 추론 성능을 얻어낼 수 있음을 증명했다는 높은 평가를 받았다. 특히 OpenAI o1 모델과 비교하여 수학, 영어, 코딩 부문에 있어 경쟁할 수 있는 수준의 성능을 갖추면서도, 최대 95%까지 더 저렴한 가격을 내세워 전 세계의 관심을 끌었다.

 

DeepSeek R1이 가져온 엄청난 파급력으로 인해, 일각에선 OpenAI ChatGPT 무료 사용자들에게도 o3-mini 모델을 제한적으로 제공하기 시작한 것에 DeepSeek R1이 영향을 주었을 것이라는 시각도 있다.

 

DeepSeek CEO 량원펑(梁文) R1 공개일인 2025 1 20일에 리창 총리와 면담을 가졌다.

 

"전 세계에 AGI를 오픈 소스로 제공하는 것이 목표"라고 밝힌 만큼, 실제로 DeepSeek에서 개발된 각종 모델들과 관련 논문들은 오픈 소스로 배포되고 있다.