주 메뉴 바로가기 본문 내용 바로가기

미래에셋증권 웹진

글로벌 소프트웨어
ChatGPT가 쏘아올린 Al란 거대한 공 - Generative Al 시대
(2023년 02월 기사)

글로벌 소프트웨어 ChatGPT가 쏘아올린 Al란 거대한 공 - Generative Al 시대
메인 이미지 보이기
  • 처음 >
  • 글로벌 포커스 >
  • 글로벌 핫이슈
    (2023년 02월 기사)
기고: 넥스트플랫폼분석팀 김수진 선임매니저, 김규연 매니저

ChatGPT의 등장: WWW 등장 때와 같은 혁신적 이벤트

MS는 지난해 12월 1일 ChatGPT를 공개했고, 5일 만에 100만 명의 이용자를 확보했다고 발표했습니다. 언론에서는 ChatGPT가 보여주는 혁신에 놀라움을 표현했습니다. 일각에서는 처음 WWW가 등장해 인터넷 시대가 열릴 때와 같은 상황이 펼쳐질 것이라고 기대했습니다.

ChatGPT 등장 이후 많은 뉴스들이 쏟아졌습니다. 가장 대표적인 헤드라인은 1)이 AI 챗봇이 구글 검색 엔진을 대신할 수도 있을 것이라는 것과, 2)ChatGPT로 작성한 에세이를 과제로 제출해 좋은 성적을 받았다는 것, 3)MS가 자사 검색엔진 Bing과 생산성 솔루션 오피스에서도 ChatGPT를 곧 통합할 것이라는 내용으로 압축됐습니다.

ChatGPT란 AI 연구소인 OpenAI가 자연어처리 인공지능 모델 GPT-3를 기반으로 제작한 챗봇 서비스입니다. ChatGPT가 엄청난 주목을 받고 있는 이유는 인간 노동의 완전한 대체 가능성을 보여주고 있기 때문입니다. ChatGPT의 차별점은 답변의 완성도와 그로 인한 서비스의 범용성입니다. 이것은 학습에 방대한 양의 데이터를 사용했을 뿐만 아니라, 기존의 챗봇과 다르게 강화학습 및 지도학습 두 가지 모두를 활용해 가능한 결과입니다. 기존 챗봇과는 다르게 표면적인 정보 뒤에 숨어 있는 맥락을 이해하고, 이전 사용 기록을 기억함으로써 단순 정보 전달이 아닌 사람과 나누는 것과 유사한 수준의 대화를 진행할 수 있습니다.

대표 기능은 글 작성(에세이, 시, 소설, 이메일 등), 질문과 답변(Q&A), 텍스트 요약, 번역, 분류, 코드 생성, 대화형 AI 등입니다. 과거 대화를 기억하기도 합니다. 엑셀 함수에 대한 질문도 답변해 줍니다. ChatGPT는 2021년까지의 온라인 상의 방대한 데이터를 학습시켜 만들었습니다. 그렇기 때문에 아직까지는 최신 정보를 제공하지 못합니다.

챗봇을 표현한 사진(1)

마이크로소프트(MSFT US)와 OpenAI - 2020년 독점 파트너십 체결

OpenAI는 2015년 테슬라의 일론 머스크와 Y-combinator CEO인 샘 알트먼이 설립한 연구소로 시작했습니다. 머스크는 2018년 OpenAI의 이사회에서 사임했고, 2019년 지분도 전체 매각했습니다. 바로 이 시점에 MS가 OpenAI에 투자를 시작했습니다. 일각에서는 OpenAI가 MS와 손잡는 것에 대해 일론 머스크가 반대 의견을 나타냈고, 그 결과 연구소를 떠난 것이라고 이야기합니다.

MS는 2019년 10억 달러를 OpenAI에 투자했고, 2020년 연례 컨퍼런스 lgnite2020에서 OpenAI의 라이선스를 독점 이용하는 파트너십을 체결했다고 발표했습니다(preferred partnership). 이에 대한 대가로 OpenAI는 MS의 슈퍼컴퓨팅 기술을 사용하게 됐습니다.

OpenAI와 MS의 시너지가 본격적으로 나타난 것은 2022년 6월 Copilot 출시를 통해서입니다. 코딩 비서 Copilot은 MS가 보유한 개발자 커뮤니티 Github에 있는 코드 데이터들을 기반으로 만들어졌습니다. 그렇기 때문에 서비스도 Github 플랫폼에서 하고 있고 가격은 월 10달러입니다. 사람을 대체할 AI를 비용을 지불하고 사용하게 된 대표적 사례입니다.

챗봇을 표현한 사진(2)

그리고 2022년 12월, OpenAI에서 직접 챗봇 ChatGPT를 서비스하기 시작했습니다. ChatGPT PC버전은 현재 무료로 제공되지만, 모바일 앱으로 이용하면 구독 비용을 지불해야 합니다. 아이폰의 경우 주간 11,000원, 월간 29,000원, 연간 77,000원입니다. OpenAI는 AI를 API 형태로도 판매하고 있습니다. GPT-3나 DALL.E2를 사용해 AI 관련 서비스를 개발하고 싶다면, OpenAI가 제공하는 API로 만들 수 있습니다. 가격은 사용량 당 구독 요금으로 책정됩니다.

OpenAl는 ChatGPT도 프리미엄 유료 모델 판매를 시작할 것이라고 밝혔습니다. 최근 한자리에서 OpenAI는 자신들의 매출이 2023년 2억 달러, 2024년 10억 달러를 기록할 것이라고 예측했습니다. 2023년 1월 현재 OpenAI의 기업가치는 290억 달러로 평가받고 있으며, MS가 추가로 100억 달러를 투자해 지분 49%를 보유하는 방안을 추진하고 있다는 언론 보도가 나왔습니다. 언론에 따르면 MS는 지분 확보 이전까지 투자금 회수를 위해 OpenAI의 매출 75%를 가져갈 것이라고 언급했습니다.

Generative Al 선두주자, GPT-3

Generative AI(생성Al)란 사람의 지시없이 스스로 학습한(자가학습) 알고리즘으로 새로운 디지털 이미지, 영상, 음성, 텍스트, 코드 등을 만드는 AI 기술을 뜻합니다. 지금까지 대부분의 학습 모델은 사람이 분류하고 라벨링한 데이터를 기반으로 진행됐습니다. 그러나 Generative Al는 대규모 데이터의 특성, 균형, 패턴 등을 생성/제어한 데이터를 만들어냅니다. 그래서 데이터 자체의 특성을 파악한 데이터(이런 데이터를 '합성 데이터 Synthetic data'라고 함)를 통해 소수의 샘플로 스스로 학습하는 것입니다. GPT는 대표적 Generative AI입니다. GPT 자체가 Generative Pre-training Al의 약자입니다.

2020년 GPT-3가 출시됐을 때, 테크 업계의 반응은 뜨거웠습니다. 이전 버전의 100배에 달하는 대용량 파라미터를 학습시키면서, AI의 기술력이 압도적으로 올라갔기 때문입니다. 대용량 데이터를 학습시킨 AI를 '초거대AI'라고 지칭합니다.
스스로 학습하는 AI 표현한 그림

GPT 기술의 발전 과정

GPT-10I 나오기 이전에는 NLP(Natural Language Processing) 모델을 사용해 Al를 학습시켰습니다. 이 때는 AI가 특정 태스크(분류, 번역)만을 위해 만들어졌습니다. 응용 작업은 불가능했습니다. 초거대시로 불리는 GPT의 기술은 핵심 키워드 딥러닝, 트랜스포머, 퓨샷러닝, 자기주도학습을 통해 이해할 수 있습니다.

인공지능을 학습시키는 것을 '머신러닝(기계학습)'이라 하고, 이 머신러닝 중 신경망을 통해 학습시키는 것이 '딥러닝'입니다. 인공지능을 딥러닝으로 학습시킨다는 것은 컴퓨터가 고양이와 개의 특성을 직접 찾아내는 과정입니다. 딥러닝 이전에는 사람이 구체적 특성을 알려주면 알려준 것을 학습하여 고양이와 개를 구분했습니다. 딥러닝에서는 입력값(ex. 잠든 고양이 찾아줘)에 AI가 직접 찾아낸 특징을 반영해 출력값을 만들어내는데, 실제값과 출력값의 차이를 최소화하는 가중치를 찾는 게 AI의 실력입니다. 이 가중치를 파라미터(매개변수)라고 부릅니다. 학습할 수 있는 데이터가 많을수록, 또 가중치가 많을수록, 실제값과 출력값의 오차가 적어집니다.

트랜스포머 등장 → 초거대시의 도화선

AI 발전에 있어서 가장 큰 걸림돌은 대량 데이터를 처리하는 것이 어렵다는 점이었습니다. 2017년 구글이 발표한 '트랜스포머'란 알고리즘이 이를 가능하게 했습니다.

번역 작업을 예로 들어보겠습니다. 트랜스포머 이전에 사용한 RNN(순환적 신경망, Recurrent Neural Network)은 번역할 때 바로 앞뒤 단어와의 상관관계만 순환적으로 고려했습니다. 그래서 문장이 길어지면 오류가 늘었습니다. 반면 트랜스포머는 전체 문장에서 한 단어가 다른 모든 단어들과 갖는 연관관계를 수학적으로 계산해서 결괏값을 찾아냈습니다(Attention 매커니즘). 이에 여러 개의 인코더를 쌓아올린 'Multi-Headed Attention' 방식으로 대량 데이터를 순차적이 아니라 병렬로 처리할 수 있게 해 학습 속도를 대폭 향상시켰습니다.

엔비디아의 발표에 따르면 트랜스포머 이전 AI 모델이 학습할 때 사용하는 연산 능력이 2년 동안 8배 증가했다면, 트랜스포머 이후에는 2년 동안 275배 성장했습니다.

스스로 학습하는 AI 표현한 사진

퓨샷러닝과 자기주도학습은 GPT-3 발전의 기폭제가 됐다

GPT-3는 사전훈련된 모델입니다. 이름도 Generative Pre-trained(사전훈련) Transformer의 약자입니다. 단순히 한글을 영어로 번역하는 일을 하는 것이 아니라 언어 전반에 대해 사전훈련을 시키면 미세조정(Fine Tuning)을 통해 번역뿐만 아니라 글쓰기, 대답하기 등이 가능한 것이 핵심 특징입니다. 이때 미세조정을 하려면 추가로 대량의 데이터가 필요한데, 적은 데이터로 새로운 작업을 학습할 수 있게 되는 것을 '퓨샷러닝(few-shot learning)'이라고 합니다. 퓨샷러닝이 가능한 것은 '자기지도학습(Self-supervised learning)'을 할 수 있기 때문입니다. 과거 일반적인 지도학습은 사람이 직접 라벨링 한 데이터를 제공해야 그 라벨을 기반으로 아는 것에 미세한 디테일을 쌓아나갔습니다.

그러나 자기지도학습은 AI가 주어진 데이터를 기반으로 지식을 쌓아 직접 다른 데이터를 예측하고 스스로 학습해 나가는 기법입니다. 따라서 지금까지 데이터 라벨링이 힘든 작업이었는데, 이 과정이 생략되자 훨씬 간편하게 AI를 활용할 수 있게 된 것입니다.

GPT-3가 ChatGPT로 탄생하는 과정에 'lnstructGPT'가 있습니다. InstructGPT는 GPT-3의 가장 심각한 문제점으로 지적받던 '편향된 문장'을 완화한 모델입니다. GPT-3는 인터넷에 존재하는 데이터를 대규모 데이터세트로 설정해 AI에 학습시켰기 때문에, '진실이 아닌 문장', '해로운 문장', '공격적인 문장'을 생성하는 경향이 있다고 지적받았습니다. 대표적으로 반(反) 이슬람에 대한 편견, 성적 과격한 단어 등 윤리, 인권적 문제들이 나타났습니다. 그래서 OpenAI는 학습모델을 개량해 편향성을 억제하고, 문장 생성 정밀도를 향상시킨 InstructGPT를 개발했습니다.

GPT-4, 2023년 출시 예상

올해 GPT-4가 출시됩니다. 일각에서는 100 이상의 파라미터를 학습시켰다는 예상도 했지만, OpenAI의 Sam Altman CEO는 GPT-3보다 파라미터가 엄청 늘어나지는 않을 것이라고 설명했습니다. 왜냐하면 파라미터만 무조건적으로 늘린다고 결괏값이 정교해지는 것이 결코 아니기 때문입니다. 이미지와 텍스트 등 다양한 출력값을 가질 수 있는 멀티모달이란 소문도 잘못된 것이라고 설명했습니다. GPT-4 역시 텍스트 온리 모델입니다.

GPT 비용 예측: 유료화는 필수적인 방향성

GPT-3가 탑재된 인공지능 서비스들은 대부분 구독 모델을 기반으로 이용할 수 있습니다. 현재 ChatGPT는 PC에서는 무료, 모바일에서는 유료로 이용할 수 있지만 계속해서 무료로 유지할 수는 없습니다. 서버를 구동할 때 상당한 비용이 들기 때문입니다. AI 가격은 클라우드 AI 기술 사용료와 컴퓨팅 사용료를 기반으로 책정됩니다.

ChatGPT 사용료를 대략적으로 계산해 보겠습니다. 우선 Azure 서버에서 AS 구동하는 엔비디아의 A100 GPU를 이용하면 한 시간당 3달러의 비용이 청구되는데, 이를 단어당으로 환산하면 ChatGPT에서 단어 하나를 생성할 때마다 0.0003달러의 비용이 발생합니다. 일반적으로 응답 한 번에 최소 30개의 단어가 생성되므로, 최소 1센트의 비용이 발생합니다. 따라서 현재 유저수가 100만 명이고, 개인당 하루에 10번씩 질문을 던진다면, 한 명당 0.1 달러, 하루에 10만 달러, 한 달이면 300만 달러의 운용 비용이 들어가는 샘입니다.

하지만 속도를 생각한다면 한 대의 GPU로 모든 쿼리를 처리할 수 없습니다. A100 GPU는 30억 파라미터 모델을 0.006초에 구동할 수 있습니다. 그러면 ChatGPT의 최근 버전인 GPT-3.5는 1,750억 파라미터를 처리하므로, 단어 하나를 생성할 때 0.35초가 걸립니다. 최소 8개의 A100 GPU는 확보해야 초당 15~20개 단어를 생성할 수 있습니다. 이 경우 2,400만 달러로 비용은 늘어납니다.

따라서, 곧 ChatGPT의 유료 버전은 나올 것입니다. 언론에서는 OpenAI가 ChatGPT의 유료 버전을 준비 중이라고 언급했습니다. 유료 버전은 무제한 질문이 가능하고, 시간도 단축되는 등의 서비스를 이용할 수 있습니다.

OpenAI는 이미 AI 모델을 유료로 판매 중입니다. OpenAI 홈페이지에 들어가면 API 형태로 AI 모델을 사용할 수 있습니다. 최근 한자리에서 OpenAI는 자신들의 매출이 2023년 2억 달러, 2024년 10억 달러를 기록할 것이라고 예측했습니다.
건축자재 산업 하락을 표현한 사진

인공지능 산업 전망

인공지능 시장 규모는 2030년 1.6조 달러(한화 약 2,000조 원)에 달할 것으로 전망되고 있습니다. 연평균 성장률은 38%에 달합니다. 시장조사업체 Transforma는 다른 기관과 다르게 매출 등으로 구성된 경제적 가치가 아닌 'instance(활용 건수)'로 AI 시장을 전망했습니다. Instance는 머신러닝 알고리즘을 구동하는 머신의 개수로 추산했습니다.

그 결과 2030년 200억 건이 넘는 instance가 발생할 것으로 예측됩니다. 그 중 가장 많이 활용될 것으로 추정되는 방식은 자연어 처리, 챗봇/가상비서, 사용자 행동 분석, 이미지 분석/생성 등이며, 행동 인지, 번역, 위험 감지, 트래픽 모니터링, 리스크 분석, 침입 감지 등이 뒤를 이었습니다. OpenAI는 현재 위 10가지 유형 중 가장 수요가 많은 자연어 처리, 챗봇/가상비서, 이미지 분석/생성 시장을 타겟팅 하고 있습니다.

마이크로소프트(MSFT US)에서 GPT-3의 역할 전망

MS의 사업부는 크게 8가지로 나뉩니다. 그 중에서 AI가 직접적으로 관여할 수 있는 사업부는 서버 제품 및 클라우드 서비스, 오피스 사업부, 검색 광고, 링크드인 4가지입니다.

서버 제품 및 클라우드 서비스는 AI를 구동하는 컴퓨팅 서비스를 통해 수익을 창출하기 때문에 가장 직접적인 수익원이 됩니다. 더 많은 AI를 구동할수록, 더 많은 매출이 발생할 수 있습니다. 다만 서버 성능이 개선될수록 비용이 저렴해지고 있는 상황입니다.

오피스 사업부에서는 AI를 활용한 여러 기능들을 추가 중입니다. 우선 오피스 제품 중 하나인 Power Platform은 Al를 이용해 챗봇을 만들고, 앱을 개발하며, 데이터를 시각화하는 제품입니다. 이에 더해 우리가 매일 사용하는 오피스의 엑셀 등에도 AI 기능을 추가할 예정이라고 밝혔습니다. AI 기능이 추가되면 가격이 올라갑니다. 실제로 2022년 MS가 10년 만에 처음으로 오피스의 구독요금을 10%가량 인상할 때 인상의 근거로 '보안과 인공지능 기능 등이 추가되어 가격 인상이 불가피하다'고 설명했습니다. 따라서 앞으로도 고도화된 AI 기능이 추가된다면, AI 특별 프리미엄 요금제가 생기거나 전반적인 가격이 인상될 수 있습니다.

AI 네트워크를 표현한 사진

검색 광고 사업부는 MS의 검색 엔진인 Bing에서 발생하는 검색 광고 수익과 MS가 21년 인수한 애드테크 기업 Xandr의 매출이 포함된 사업부입니다(현재 Xandr는 넷플릭스의 광고를 담당). 즉 다수가 가장 큰 성장세를 기대하고 있는 사업부입니다.

MS는 최근 언론에서 Bing에 ChatGPT를 도입할 것이라고 언급했습니다. 아직까지 구체적인 방식은 전해지지 않았습니다. 2020년 창업한 미국의 스타트업이 AI 기반의 검색 엔진 You.com을 출시했는데, 이 검색엔진의 인터페이스를 보면 AI가 적용된 검색 엔진을 엿볼 수 있습니다. 애드테크는 텍스트와 이미지 모두를 적극적으로 활용해 AI를 적용할 수 있는 영역이 넓은 산업입니다. 더 정교한 AI 기술일수록, 더 좋은 광고 성과와 연결된다면 두드러지는 경쟁력을 가질 수 있을 것입니다.

링크드인은 구인 구직 SNS로서, 이 플랫폼에서 비즈니스와 관련된 많은 기능들이 제공됩니다. ChatGPT는 구직자의 이력서를 대신 작성해주고, 구직자에게 최적화된 일자리를 매칭하는 기능 등이 가능할 것으로 예상합니다.

오피스에 AI 기능을 추가하면 사용자 당 ARPU가 올라가기 때문에 매출 증가와 직결될 수 있습니다. 검색 광고 역시 현재 Bing의 시장점유율이 3%에 불과한 상황에서, AI 기능을 통해 사용자를 늘린다면 광고 수익 증가로 연결될 것입니다. 성장률이 하향 곡선을 그리기 시작한 사업부에 결정적 캐탈리스트가 될 수 있습니다.

CODE RED: 긴장하는 구글

구글은 2000년대 초부터 인공지능의 중요성을 역설했습니다. 그로부터 16년 후 전 세계의 이목이 집중된 인간 VS 인공지능 바둑 대전에서 구글은 최고의 AI 기업으로 자리매김했습니다. 그러나 2022년 OpenAI가 일으킨 GPT-3 돌풍으로 인공지능 대표 주자로서의 입지는 위태롭습니다. MS 검색엔진 Bing의 ChatGPT 탑재 소식으로 유일무이한 검색 포털로서의 지위에 대한 위기론마저 제기됩니다.

AI-First를 외치며 인공지능을 강조해 온 순다르 피차이 CEO는 회사 내부적으로 적색 경보code red를 발령하며 촉각을 곤두세우고 있습니다. OpenAI는 1분기 내 GPT-4 공개를 예고했습니다. GPT 독점사용권을 보유한 MS는 100억 달러 상당의 투자를 단행하며 지분 확보 작업을 진행 중입니다. 거래가 완료된 후 Bing을 시작으로 MS 생태계 전반에 인공지능이 탑재되며 구글을 위협할 것입니다.

이에 대응하기 위해 구글 또한 공격적인 투자를 감행할 것으로 보입니다. 2023년은 인공지능 경쟁의 원년이 될 것입니다.

AI 관련 투자 및 조직 구성

구글의 인공지능 굴기는 2000년 창업자 래리 페이지가 "구글의 최종 도착지는 AI"라고 선언하면서 시작됐습니다. 내부 연구소에서 자율주행과 인공 신경망을 연구하던 구글은 2010년대부터는 M&A를 통해 역량을 강화했습니다. 특히 2014년에 인수한 딥마인드는 중요한 이정표를 세웠습니다. 바둑 인공지능 프로그램 AlphaGo가 2015년 유럽 챔피언 판 후이에 이어 2016년 이세돌 9단과의 대결에서 승리를 거두며 인공지능에 대한 사람들의 관심이 비약적으로 증가했습니다.

인수 및 지분 투자를 통해 연구 개발 인력을 확보한 구글은 구글 브레인을 중심으로 인공 지능 연구 개발을 진행하고 있습니다. 구글 브레인은 23개 연구 영역에서 2,315명의 인력을 운영하고 있습니다. 또한 2017년 AI 스타트업 자금 지원을 위한 Gradient Vet니res를 출범해 2022년 12월 기준으로 총 161개 기업을 지원하며 역량 확보를 다각적으로 진행 중입니다.

기술 현황

구글의 AI 역량은 보유 특허에서도 나타납니다. 특허 분석 기업 LexisNexis가 발표한 기계학습 특허 보유 기업 순위에서 구글의 모회사 알파벳이 MS를 제치고 1위를 차지했습니다. 2019년 순위는 MS가 1위, 알파벳이 2위였으나 2020년부터 순위가 뒤바뀌었습니다. 2014년 딥마인드 인수로 취득한 216건의 특허를 기점으로 유효 특허수가 폭발적으로 성장, 2022년 2,303건의 특허를 보유 중입니다. 전체 특허 중 기계학습 관련 건이 9.6%로 인공지능에 대한 구글의 열정을 알 수 있습니다.

선도적인 입지의 발판은 수직적으로 통합된 가치사슬입니다. 구글은 인공지능 연산에 특화된 ASIC TPU를 자체 개발했습니다. AI 컴퓨팅 능력을 평가하는 MLPerf 벤치마크 테스트에서 구글 클라우드 TPU가 MS Azure에서 구동된 A100보다 높은 성능을 기록했습니다.

가장 최신 버전인 TPUv4는 MLPerf 벤치마크 테스트에서 MS-엔비디아의 A100보다 높은 성능을 기록했습니다. 해당 모델들이 테스트를 위해 본 모델보다 적은 파라미터로 구성되었다는 것을 감안하면 실제 사용시 적용되는 비용 절감 효과는 더욱 극대화될 것입니다.

학습 비용 절감은 인공지능 모델 상용화에서 중요한 역할을 합니다. 구글이 개발하는 기초 모델의 발전에 도움이 될 뿐만 아니라 향후 모델을 서비스 형태(AlaaS)로 판매할 때 가격 경쟁력을 확보할 수 있기 때문입니다.

인공지능의 핵심 모델에서도 발전을 거듭했습니다. 구글은 기계학습과 뉴럴 네트워크, 음성인식 분야에서 독보적인 역량을 가지고 있는데, 특히 자연어 처리(NLP) 인공지능 개발에 집중했습니다. 2017년 발표한 트랜스포머는 문장 속 데이터 관계를 파악해 단어 간 맥락과 의미를 학습하는 신경망으로 BERT, GPT 등 오늘날 NLP 모델의 기반이 되는 모델입니다.

2022년 5월 공개된 초거대AI 모델 챗봇 LaMDA2는 일각에서 "지각이 있다"라는 주장이 제기될 정도의 대화 능력을 보여주었습니다.
AI를 표현한 사진

댓글목록

등록된 댓글이 없습니다.