[기고] 챗GPT 만든 오픈AI, 기술력만큼 비즈니스 전략 뛰어나
타임라인으로 엿보는 오픈AI 비즈니스 전략
📌 이 글을 읽으면 알 수 있어요!
1. 요즘 챗GPT를 둘러싼 대다수 이야기는 기술력에 초점을 맞추고 있습니다. 얼마나 어려운 질문에도 대답을 척척 해내더라, 같은 내용이죠. 그런데 말입니다. 오픈AI가 세상을 뒤흔든 데는 기술력만큼 치밀한 비즈니스 전략이 숨어 있었다고 하네요. 국내 대표 음성인식 AI 기업 리턴제로에서 리서치 엔지니어로 일하는 김한길님의 설명을 들어보시죠.
2. 챗GPT 첫 등장부터 GPT-4 공개, 플러그인 출시까지 채 4개월이 안 걸렸습니다. 그 사이 오픈AI는 구글과 메타를 생성형 AI 전장으로 끌어냈고요. 이들 빅테크는 저마다 획기적인 기술로 시장을 차지하기 위해 노력 중입니다. 이처럼 빠르게 변하는 시장에서 주목해야 할 핵심 관점을 제시합니다.
글. 김한길(리턴제로 리서치팀 / AI 음성인식엔진 연구개발)
편집. 장준영 기자
챗GPT. 이 키워드 하나에 세상이 들썩이고 있다. 챗GPT가 세상을 변화시켰는지, 앞으로 변화시킬 것인지, 아니면 코인 열풍처럼 순식간에 사라질 것인지에 대해서는 아직 답하기 어렵다. 단 연구실을 벗어나 비즈니스 업계와 대중에 이 정도의 관심과 영향력을 끼쳤던 딥러닝 기술이 그간 없었다는 점은 확실하다.
무엇이 달랐을까? 어떻게 300명이 조금 넘는 기업(오픈AI)에서 수 십, 수 백배 규모의 구글, 메타(구 페이스북)도 하지 못했던 변화를 이끌어내고 있을까? 오픈AI의 비즈니스 전략을 엿보기 위해 챗GPT를 철저하게 디자인된 ‘프로덕트’라는 관점에서 살폈다. 챗GPT 등장부터 지금까지, 오픈AI의 발자취를 따라가 보자.
2022년 11월 30일, 챗GPT 등장
챗GPT는 출시된 지 단 일주일 만에 100만 명의 사용자를 모았다. 이는 역사상 가장 빠른 속도로, 인스타그램, 스포티파이 같은 서비스를 압도하는 기록이다. 두 달 후에는 월간 액티브 유저 1억 명을 달성했고, 기세를 이어받아 2023년 2월에 출시한 월 20달러짜리 유료 구독 프로그램 챗GPT Plus는 단 2주 만에 구독자 백만 명을 확보했다.
한때, AI 챗봇이 고객 응대 효율화를 위해 유행처럼 도입되던 시기가 있었다. 하지만 낮은 수준의 이해 능력과 기계적인 응답은 오히려 고객의 불만을 키웠다. 구글, 아마존이 투자를 아끼지 않던 AI 스피커 시장도 최근 대다수 기업이 시장에서 철수하거나 사업 규모를 축소하는 상황이다. 이렇듯 ‘챗봇’ 서비스에 대한 신뢰와 기대가 떨어진 상황에서 챗GPT는 단번에 대중의 눈길을 사로잡았다. 아니, 앞서 기술한 기록적인 수치는 그저 ‘이목을 끈 것’을 넘어 사람들의 일상을 바꾸고 있음을 시사한다.
자연어를 출력하는 딥러닝 모델, 흔히 언어모델(Language model)이라 불리는 인공지능(AI)은 입력으로 들어온 문장 다음에 어떤 표현이 나와야 하는지 예측하는 방식으로 학습을 진행한다. 즉, 다음 표현이 무엇일지 맞추는 데 최적화된 모델이다. 하지만 이런 방식만으로는 사람다운 답변을 내놓도록 학습 시키는 게 쉽지 않았다.
오픈AI는 사람의 선호를 직접 학습 시키고자 RLHF(Reinforcement Learning from Human Feedback, 인간 피드백 강화학습)라는 기법을 활용했다. 여기서 ‘인간 피드백(Human Feedback)’이란 말이 핵심인데, 즉 언어모델이 내놓은 여러 답변 중 좋은 답변을 사람이 직접 골라 선호 순으로 배열한 뒤, 이 정보를 모델 학습에 활용했다.
사실 이 아이디어는 이미 오픈AI가 2017년도 「Deep Reinforcement Learning from Human Preferences」라는 논문에서 공개한 내용이다. 그런데 챗GPT가 성공을 거두기 전까지는 크게 주목 받지 못했다. ‘사람이 딥러닝 모델을 직접 가르쳐야 한다니, 돈이 많이 들 뿐더러 멋이 없지 않은가!’라는 이유였다.
오픈AI는 현 시대의 기술적 한계를 명확히 인지한 뒤, 그럴듯한 기술을 넘어 사람들이 사랑하는 ‘프로덕트’를 만들기 위한 방법을 고민했던 것 같다. GPT3를 운영하며 대중이 어떤 질문을 궁금해 하는지, 어떤 답변을 선호 하는지에 관한 데이터를 쌓아둔 덕분일까. 그들은 결국 챗봇의 시장 적합성(PMF)을 찾았고, 전례 없는 성과를 이뤘다.
그런데 챗GPT가 하나의 ‘프로덕트’라는 점은 챗GPT의 한계이기도 했다. 챗GPT 성능이 대단하다는 것은 누구나 인정할 수밖에 없지만, 그 영향력은 제품 안에서만 존재하는 ‘찻잔 속의 태풍’에 지나지 않았다. 무엇보다 이 무지막지하게 큰 모델을 개발하고 학습 시키는 데 드는 비용, 유저가 서비스를 이용할 때마다 이를 처리하는 비용이 상당했기 때문에 서비스 확장은 고사하고 유지하는 것조차 어려울 것이라는 전문가 예측이 많았다. 하지만 이 예상은 보기 좋게 빗나갔다.
2023년 3월 1일, 챗GPT API 서비스 시작
챗GPT가 채팅 서비스라는 하나의 프로덕트라면 API는 그 서비스의 핵심인 ‘이해하고 말하는 모델’을 챗GPT가 아닌 다른 서비스에서도 이용할 수 있도록 연결해주는 인터페이스다. 사실 API를 제공한다는 것 자체는 놀라운 점이 아니다. 오픈AI는 챗GPT 이전에 개발했던 모델에 대해서도 API 서비스를 제공해왔기 때문이다.
문제는 저렴해도 너무 저렴한 비용이다. 기존 오픈AI가 제공하던 최신 모델(text-davinci-003)보다 좋은 성능을 보여주는 챗GPT API임에도 가격은 이전의 10분의 1 수준으로 책정됐다. 천문학적인 모델 개발 비용은 고사하고, 웬만한 기업에서는 공짜로 가져다 줘도 제대로 활용조차 못 할 규모의 모델이란 것을 감안하면 이는 기존 생태계를 파괴하는 수준의 가격이었다.
이에 따라 아이디어와 약간의 개발 지식만 있다면 누구나 챗GPT와 같은 최신 AI 모델에 기반한 서비스를 만들 수 있는 시대가 열렸다. 지금 이 순간에도 이 API를 기반으로 한 무수히 많은 서비스가 하루에도 수십 개 쏟아져 나오고 있다. 마치 AI 기반 서비스의 대항해시대가 열린 듯. 물론 그 배들은 오픈AI라는 바닷가 위를 둥둥 떠다니고 있지만 말이다.
이처럼 대중화에 성공했지만 여전히 한계는 존재했다. 세상에는 텍스트 외에 이미지나 영상 형태로 존재하는 정보도 있다. 챗GPT는 이를 인식하지 못했다. 또한 4,096개 토큰이라는 입출력 길이의 제한으로 책이나 논문과 같은 긴 글을 이해 시키기 어려웠다. 무엇보다 한국어 등의 비 영어권 언어에서는 성능이나 속도가 상대적으로 좋지 못하다는 불만이 있었다.
2023년 3월 14일, GPT-4 발표
챗GPT API 서비스가 공개된 지 2주 뒤. GPT-4가 출시됐다. 챗GPT로 한껏 높아져 있던 사람들의 기대를 충족시킬 만큼 놀라운 성능 향상을 이룬 동시에 앞서 언급한 단점의 상당 부분을 보완한 모델이다. 텍스트뿐 아니라 이미지도 인식할 수 있고, 입출력 길이 제한도 비약적으로 늘었다.(다만 아직 이미지 인식 기능은 공개되지 않았고 GPT-4 32k 모델은 최근에야 일부에 공개되고 있다.)
하지만 성능보다 먼저 눈에 들어온 건 GPT-4가 공개되는 날 함께 들려온 마이크로소프트 검색 서비스 빙(Bing)을 위시한 일부 서비스의 출시 소식이었다. “이미 저희 서비스에는 GPT-4가 적용돼 있습니다!”를 자랑스럽게 내세우는 그들 대부분은 오픈AI가 투자했거나 밀접한 관계를 맺고 있는 회사였다. 이 기업들만이 수 개월 전부터 GPT-4를 자사 서비스에 최적화할 수 있는 특권을 가지고 있던 것이다. 5월 현재도 GPT-4 API는 여전히 일부 허가된 이용자에게만 열려 있으며, 모델을 튜닝(finetuning)하여 보다 자신의 서비스에 맞는 맞춤형 모델로 만드는 방법은 챗GPT API부터 지원하지 않고 있다. 아이러니하게도 이제 오픈AI는 누구에게나 ‘오픈’ 돼 있지 않다.
여담이지만 GPT-4가 발표된 날은 구글이 PaLM이라는 초거대 모델 API를 발표한 날이기도 하다. 하지만 온 언론과 SNS가 GPT-4로 도배 됐고 구글의 발표는 잊혀졌다. 이와 비슷한 일이 2월 7일에도 있었기에(구글이 챗GPT 대항마로 내놓은 LLM 모델 발표가 있던 날, 마이크로소프트는 자사 검색 서비스 빙에 챗GPT를 탑재한다고 발표했다.) 이를 우연이라 치부하긴 어려울 듯하다.
2023년 3월 23일, 챗GPT 플러그인 발표
챗GPT 플러그인이란 챗GPT를 통해 외부 서비스 기능을 함께 쓸 수 있는 기능이다. 예를 들어 Browsing이라는 플러그인을 설치해두면 ‘지금 영화관 1위 영화는 뭐야?’라는 질문에 응답하기 위해 챗GPT는 Browsing이라는 서비스를 통해 인터넷에 접속하여 추가적인 정보를 얻고, 이에 기반하여 응답할 수 있게 된다. 이는 곧 챗GPT 기능의 무한한 확장을 의미한다.
이는 일견 크롬 브라우저에서 크롬 익스텐션을 설치하는 것, 아이폰에서 앱스토어 앱을 설치하는 것과 유사해 보인다. 하지만 결정적인 차이가 하나 있다. 처음 어떤 플러그인을 설치할지는 이용자에게 달려있지만, 특정 대화 도중 어떤 플러그인을 사용할지는 챗GPT가 결정한다는 점이다.
다시 말해 이용자는 기존과 다를 바 없이 챗GPT와 채팅을 하지만, 이용자에게 적절한 답을 내놓기 위해 챗GPT가 설치된 플러그인 중 적절한 플러그인을 스스로 판단해 실행한다는 뜻이다.
물론 이용자가 서비스명을 구체적으로 언급한다면(예를 들어 “배달의 민족 어플로 주문해줘”) 이용자가 원하는 플러그인을 명시적으로 실행할 수 있을 것이다. 하지만 명목상 가능한 것과 실제로 그렇게 할 것인가는 다른 이야기다. 채팅이라는 환경에서 이용자 대부분은 ‘무엇을 실행할 지’ 판단하지 않(못)을 것이고 그럼 주도권은 온전히 챗GPT, 즉 오픈AI에 넘어갈 것이다. 애플 앱스토어가 앱의 마켓 등록 여부 및 운영 정책에 대한 권한을 가지고 있는 데 반해, 챗GPT는 어떤 서비스를 실행할 것인가 하는 권한까지 갖게 되는 셈이다.
과연 챗GPT님은 무엇을 실행시켜 ‘줄’ 것인가? “맛있는 돈까스 하나 주문해줘” 라는 명령에 대해 챗GPT는 배달의 민족에서 주문할까, 아니면 쿠팡이츠에서 주문할까? 그리고 그 안에 입점해있는 수많은 음식점 중 무엇을 선택할까? 검색엔진최적화(SEO)를 넘은 언어모델최적화(LMO)라는 분야가 생길지도 모를 일이다.
한마디로, 오픈AI는 기술뿐만 아니라 비즈니스를 잘하는 회사다. 그것도 무척이나 전략적으로.
사실 이러한 전략은 계획만 한다고 할 수 있는 게 아니다. 압도적인 기술력과 이에 기반한 서비스가 받쳐 줘야 한다. 그래야 서비스를 일부에만 공개하더라도 의미가 있고, 다른 기업의 타임라인에 맞춰 본인의 일정을 조절할 수도 있는 것이다.
오픈AI는 최근 5개월간 전 세계 타임라인을 원하는 대로 이끌어왔다. 준비되지 않았던 구글을 전장으로 이끌어냈으며, 생성형 AI 시장 규모를 천문학적으로 키웠고, 업무 일상을 바꿔놓고 있다. 오픈AI 수장 샘 알트만이 실리콘밸리 스타트업의 산실인 Y 콤비네이터(Y Combinator) 회장이었다는 사실을 다시 한 번 떠올리게 된다.
물론 이러한 관점은 결과론적 해석일 수 있다. 실제 챗GPT 출시 직전까지만 해도 당시 오픈AI 내부에서조차 반신반의 했다고 한다. 하지만 결과적으로 이들이 내놓은 제품은 대형언어모델(LLM) 시장을 선점했고, 대중에게 ‘LLM = 챗GPT’란 공식을 각인 시켰다. 세계 최고의 AI 기업이라는 홍보 효과 또한 톡톡히 누리며 모든 사람이 오픈AI의 말 한마디에 주목하게 만들었다. 결과물이 텍스트인 LLM 서비스 특성상 모델 간 성능 비교가 쉽지 않기에 이러한 선점 효과와 이를 통한 서비스의 락인(Lock-in)은 어느 정도 계속될 것으로 보인다.
더군다나 이들 뒤에는 마이크로소프트라는 거대 기업이 자리 잡고 있다. 세계 2위 점유율 클라우드 서비스 애저(Azure)를 기반으로 더 좋은 모델을 빠르게 훈련할 수 있고, 그 기술을 코파일럿(Copilot)이라는 명목으로 마이크로소프트 오피스(Word, Excel, teams 등)에 적용할 준비를 마쳤다. 빙이 단지 챗GPT를 탑재했다는 이유만으로 검색 업계의 절대강자 구글의 도전자로 언급 되고 있다는 것 자체만으로도 큰 변화다. 여기에 마이크로소프트가 최근 몇 년 활발히 투자 중인 게임과의 결합도 예정된 수순이다.
이들이 계획하는 다음 6개월은 또 어떤 모습일까.
하지만 전쟁은 끝나지 않았다
챗GPT의 기반 기술인 ‘트랜스포머(Transformer)’를 만든 구글은 여전히 건재하다. 반격을 위해 최근 구글형 챗GPT 서비스인 ‘바드(Bard)’를 선보였고, 오픈AI 출신 엔지니어들이 나와서 세운 앤트로픽(Anthropic)에 대규모 투자를 감행했다. 최근에는 기술이 서비스화 되기 전에는 논문으로 출판하지 말라는 내부 지침이 있었다는 소문도 들린다.
여기에 메타는 모델을 공개하는 오픈소스 전략으로 이 흐름을 뒤바꾸려 하고 있다. 메타의 (의도치 않은) LLaMA 모델의 오픈소스화는 이를 기반으로 수많은 오픈소스 모델의 등장을 촉발 시켰고, 며칠 전에는 텍스트, 이미지, 오디오뿐만 아니라 깊이, 열, 관성 등의 정보를 인지할 수 있는 멀티모달 모델 ‘이미지 바인드(ImageBind)’를 공개했다. 국내에서도 네이버의 하이퍼클로바나 폴리글롯(Polyglot)등의 단체에서 시작한 한국어 LLM 프로젝트도 하나 둘 성과를 내놓고 있다.
과연 오픈AI는 이 흐름을 계속해서 주도할 수 있을까. 아니면 다른 기업이 나타나 주도권을 빼앗을까. 또는 오픈소스 진영의 기술 공개와 모델 경량화 시도에 기반한 진정한 기술 ‘오픈’ 시대가 열릴 것인가. 또 챗GPT 이후 새로운 성공을 거둘 AI 기반 서비스는 어떤 모습일까. LLM을 직접 개발하지 않고 이용하는 것만으로 성공하는 사례가 나올 것인가.
불과 반년 전만 해도 상상조차 할 수 없었던 흐름을 우리는 보고 경험하고 있다. 하지만 여전히 빠르게 변화하는 이 시장을 보고 있노라면 아직도 수많은 질문을 던지게 된다.
기고자: 김한길
소속: 리턴제로 리서치팀/ AI 음성인식엔진 연구개발
주요 이력: 現 리턴제로 ML NLP 리서치 엔지니어
서울대학교 교육학과 교육행정전공 석사
KAIST 전산학과, 경영과학과 복수전공 학사