〔생성AI〕2023년 AI 업계의 최대 관심사는 'GPT-4'
2022년 IT 업계에서 인공지능(AI)의 발전은 눈부셨습니다. 오픈 AI의 '달리2(DALL-E2)'가 엄청난 퀄리티의 그림을 그려냈습니다. 오픈소스 인공지능인 '스테이블 디퓨전(Stable Diffusion)' 역시 인공지능 그림의 수준을 한 단계 높였고, 하루 사용자가 1000만명에 달합니다.
내년에는 더 많은 데이터가 생성되고 그림뿐만 아니라 음악, 영상, 글 등 다양한 분야에서 활용될 전망입니다. 더욱이 2023년에는 새로운 인공지능이 선보일 예정입니다. 바로 GPT-4의 등장입니다.
◇GPT가 뭐길래
GPT(Generative Pre-trained Transformer)는 대표적인 텍스트 생성 딥러닝 인공지능 모델입니다. 인공지능이 수많은 데이터를 학습하면 다양한 질문과 답변이 가능해 대화형 인공지능 서비스에 활용합니다. 번역, 텍스트 요약 등 할 수 있는 일도 많습니다.
2018년 처음 GPT-1이 공개됐습니다. GPT-1은 처음엔 1억1700만개의 매개변수를 활용했습니다. (인공지능은 학습하는 데이터양은 물론 매개변수의 수에 따라 성능이 크게 달라집니다.) 2019년 공개된 GTP-2는 무려 약 10배 이상인 15억개 이상의 매개변수를 활용하기 시작했습니다. 다시 1년 후 2020년 공개된 GPT-3는 무려 1750억 개의 매개변수를 활용합니다.
GPT는 특정 데이터를 조정하면 더 나은 결과를 생성합니다. GPT 모델의 데이터를 활용하면 자연어 처리나 텍스트 처리 프로젝트를 다양하게 시도할 수 있습니다. 비용과 시간을 절약하면서 거대한 데이터를 활용해 인공지능을 발전시킬 수 있는 장점이 있습니다.
현재까지 공개된 GPT-3는 인간이 사용하는 언어와 유사한 결과를 보입니다. '사피엔스'로 잘 알려진 세계적인 베스트 셀러 작가 유발 하라리는 자신의 글을 GPT-3에 학습시키고 출판 10주년 서문을 GPT-3가 작성하도록 했습니다. 유발 하라리는 GPT-3가 작성한 서문을 읽고 충격에 빠졌습니다. 인공지능이 자신의 글과 다름없는 수준의 글을 작성했기 때문입니다.
이미 GPT-3는 여러 작가와 함께 글을 쓰거나 이미 완성된 글을 수정하는 수준에 이르렀습니다. GPT-3가 그 자체로 이미 인공지능의 엄청난 발전을 증명했지만, 많은 이들은 이제 곧 세상에 모습을 드러낼 GPT-4가 GPT-3를 훌쩍 뛰어넘을 것으로 예상합니다.
달리1과 달리2가 그린 그림. 사진 오픈 AI
◇인간을 넘어설까 GPT-4
GPT를 개발하는 오픈 AI는 내년 초 GPT-3의 다음 버전인 GPT-4를 공개할 예정입니다. GPT-4에 대한 구체적인 사항은 아직 베일에 싸여 있습니다. 하지만, 인공지능 업계 관계자들은 GPT-4에 100조 개의 매개변수를 사용할 수 있다고 예측합니다.
오픈 AI의 CEO인 샘 알트만(Sam Altman)은 이러한 소문에 대해 부인한 바 있습니다. 다만, 매개변수가 GPT-3보다 아주 크지 않을 것이라고 언급한 점에 비추어 볼 때 약 1조개 수준이 아닐까 예측합니다.
정확한 사양은 알 수 없지만 GPT-4가 튜링 테스트를 통과했다는 소문은 어느 정도 사실인 것 같습니다. 튜링 테스트는 인공지능이 인간과 다름없는 지능이 있는지를 판단하는 일종의 시험입니다.
과거 튜링 테스트를 통과한 인공지능이 있었지만, 예외 사례라 만약 GPT-4가 튜링 테스트를 통과했다면 인간과 비슷한 지능 수준의 인공지능 등장이라고 해도 과언이 아닙니다. 게다가 GPT-4는 GPT-3의 학습에 필요한 비용보다 훨씬 저렴한 비용으로 이용할 수 있을 것으로 알려졌습니다. GPT-4에 대한 기대감이 높아지는 이유입니다.
튜링 테스트 방식
또한, GPT-4는 GPT-3가 지닌 한계를 뛰어넘을 것으로 보입니다. GPT-3는 인류 역사상 가장 뛰어난 인공지능으로 불리어도 손색없지만, 텍스트 데이터만 학습했다는 한계가 있습니다. 마치 세상 모든 일을 글로만 배운 것과 같습니다.
인간은 글로 세상을 이해하지 않습니다. 소리, 영상, 사진, 촉각 등 다양한 형태의 정보를 입력하고 사고합니다. 인공지능의 최대 화두는 바로 단편적인 데이터가 아닌 다양한 형태의 데이터를 인공지능이 학습하는 것입니다.
이미 GPT-3에서 이러한 시도가 이루어졌습니다. 달리2는 GPT-3에 이미지 인식을 더 해 글과 사진 정보를 학습하고 조합해 새로운 이미지를 창조했습니다. 이제 GPT-4의 핵심은 이러한 데이터를 학습하고 결과물을 만들어내는 멀티모달(Multimodal)에 있습니다.
멀티모달은 다양한 모달리티(Modality)를 동시에 받아들이고 학습합니다. 여기서 모달리티는 양상이라는 뜻으로 생체신호, 표정, 움직임 등 다양한 입력을 의미합니다. 텍스트나 이미지 외에 다양한 형태의 데이터를 통해 새로운 결과물을 만들어 낼 수 있습니다.
GPT-4가 텍스트, 이미지, 오디오 등의 데이터 입력과 학습이 가능하다면 마치 인간이 정보를 받아들이고 뇌가 사고하는 방식과 거의 동일합니다. 튜링 테스트를 통과할만한 지능을 갖췄다고 볼 수 있을 것입니다.
더글러스 에크(Douglas Eck), 구글 리서치 수석 과학자 겸 구글 브레인(Google Brain) 연구 책임자는 다음 인공지능의 혁신으로 멀티모달을 언급했습니다. 이제 인공지능은 주변 환경을 이해하고 다음 단계로 나아갈 수 있다고 말합니다.
여기에 더해 GPT-4는 희소 모델(Sparse Model)을 활용해 적은 데이터와 저렴한 컴퓨팅 비용으로 높은 수준의 결과물을 만들어 낼 것으로 기대합니다. 희소 모델은 정확도를 떨어뜨리지 않으면서도 처리량을 늘릴 수 있습니다. 인공지능의 희소성이 유지되면 다양한 인공지능 작업에도 정확성은 유지되고 비용은 줄일 수 있습니다.
멀티모달
◇2023년의 핵심 기술은 인공지능
유명 칼럼니스트인 NYU 스콧 갤로웨이 교수는 2023년의 테크 분야 핵심 키워드를 인공지능으로 예측했습니다. 인공지능이 신약을 개발하는 데 사용되기도 하고, 인공지능이 우리 삶의 곳곳을 바꿔가고 있다고 말합니다.
앞으로 우리는 훨씬 더 많은 양의 인공지능 생성 콘텐트를 접하게 될 것입니다. 또한, 이를 인간이 만들었는지 인공지능이 만들었는지 점차 구분할 수 없는 방향으로 향하게 될 것입니다. 인간 수준의 지능을 지니고 비용도 저렴한 인공지능이 모습을 드러낼 예정입니다.
GPT-4는 과연 어떠한 수준의 인공지능으로 우리 앞에 나타나게 될까요. 내년 GPT-4의 등장은 향후 인공지능과 기술의 미래를 완전히 바꿔 놓을지도 모릅니다.
중앙일보
2022.12.02 05:00
윤준탁 에이블랩스 대표
트랜D 기자 dungle@joongang.co.kr
'Trend & Issue > @AI & Data' 카테고리의 다른 글
〔생성AI〕챗 GPT에게 ‘독도는 누구 땅’이냐고 물어봤더니…대답은? (0) | 2023.02.08 |
---|---|
〔생성AI〕수입 딱히 없는데 가치는 36조원...『오픈AI』 (0) | 2023.02.08 |
〔생성AI〕 제너레이티브 AI란? (0) | 2023.02.08 |
〔Metaverse〕메타버스 신산업 선도전략 (0) | 2022.02.22 |
〔Metaverse〕메타버스의 의의와 국내외 동향 (0) | 2021.11.02 |