챗GPT로 열린 생성AI 시대, 기업 활용 방안 (최대우 대표/애자일소다)

“트랜스포머 아키텍처라고 하는 것부터 하나씩 이해를 해가면서 ‘내 데이터 가지고 무엇을 할 수 있는가’에 대한 훈련을 하는 것이 필요합니다. 그래야 제대로 된 비전이 생기지 않을까요?”
진행자 : 고우성 PD/토크아이티 (wsko@talkit.tv, https://talkit.tv/)
게스트 : 최대우 대표/애자일소다 (contact@agilesoda.ai, http://agilesoda.com/)

 

인터뷰를 통해서 전문가의 관점을 쉬우면서도 구체적으로 끌어내는 고우성의 잇(IT)터뷰입니다.
요즘 대화형 AI, ChatGPT로 인해서 유튜브와 SNS 타임라인이 뜨겁습니다. 그런데 2016년 알파고 때와는 결이 다른 관심인 것 같습니다.
기업을 위한 AI 자연어처리 전문기업인 애자일소다 최대우 대표와 함께 기업이 ChatGPT와 같은 AI를 어떻게 활용할 수 있을지에 초점을 두고 알아보겠습니다.

 

1. 알파고보다 더한 영향력, ChatGPT

최대우 : ‘ChatGPT’의 임패트가 ‘알파고’보다 더 크죠. 사실 ‘알파고’의 경우, 저희가 그냥 영상으로 우리나라의 최고 기사가 인공지능에 패하는 모습을 보고 임팩트를 받았다고 할 수 있습니다. 한편, ChatGPT는 지금 모든 사람이 경험하고 있지 않습니까?
‘진짜 AI라는게 현실화됐고 곧 되는구나’라는 그런 희망을 주기 때문에 저희처럼 B2B 비즈니스를 하는 곳에도 더 관심을 보이시기 시작했고요.
ChatGPT가 만들 변화를 쉽게 느낄 수 있도록 최대우 대표는 닭튀김 로봇의 예를 들었는데 현재 공장, 매장 등 현장에서 운영되고 있는 단순 기계에 ChatGPT라는 스마트한 뇌가 이식된다면 엄청난 서비스의 변화가 예상됩니다.

 

2. ChatGPT로 스마트해지는 기계들

최대우 : AI 로보틱스라면, 사실 요즘 닭 튀기는 로봇도 있고요.
고우성 : 아, 바리스타도 있죠.
최대우 : 네, 바리스타도 있죠. 그런데 사실, 가장 이상적인 로보틱스의 작동은 그냥 로봇만 설치하면 자기가 주변 환경을 스캐닝해서 할 일을 자기가 스스로 하는 것입니다. 그런데 지금은 모든 것을 사람이 세팅하거든요.
예를 들어 공장에서 박스가 막 나오는 경우를 보겠습니다. 패킹이 되어 박스가 나온 후 그 박스를 팔레트 위에 쌓는 palletizing(적재)만 보더라도 박스 사이즈가 바뀐다든지 하는 변수가 생기면 다시 세팅을 다 해야 하는 것입니다. 그런 것들을 AI로 그냥 다 쉽게 처리할 수 있게 해야 하는데요. 바로 이 부분을 AI 로보틱스라고 생각해 보겠습니다.
예를 들어, 닭 튀김집에서 지금의 AI 로보틱스 닭을 튀기는 역할만 합니다. 닭을 튀기는 그 팔 하나의 비용이 정확히는 모르지만 한 3,000만원 ~ 5,000만원 할 것 같아요.
그런데 ‘닭 튀기는 건 말고 설거지 로봇이 필요하겠다’ 하면 지금은 설거지 로봇을 또 사야 합니다.
고우성 : 그렇죠. 하하.
최대우 : 개인사업자나 자영업 하시는 분이 로봇 몇 대로 사람 대체할 수 있느냐? 난센스잖아요!
그런데 예를 들어, 그 로봇이 ‘낮에는 닭을 튀기고 밤에는 설거지하고, 설거지 끝나면 화장실 청소까지 다 했으면 좋겠다’ 그런 제어 컨트롤 명령어를 입력합니다. 그리고 이 AI 로보틱스가 주변 상황을 이해할 수 있게 해야 합니다. 하지만 지금의 AI 로보틱스는 한 가지 일만 하게 한다는 거죠.
이처럼 AI 로보틱스가 상황을 이해하고 다양한 일을 할 수 있도록 하는 것이 굉장히 어려운 것입니다. ChatGPT4가 릴리즈됐다고 많은 분이 흥분하시는데, 제가 보기에 ChatGPT4의 키워드는 멀티모달(Multi Modal)입니다.
다양한 데이터가 입력되어 텍스트로 나오는 것이 가능하다고 합니다. 그럼 이제 로봇이 자기 눈으로 닭 튀김집의 상황을 인지하여 스스로 판단할 수 있는 컨트롤 랭귀지를 생성한다고 보겠습니다. 그럼 앞서 언급한 이상적인 로봇 한 대가 여러 일들을 할 수 있는 것이 좀 손쉬워지지 않을까요?
특히, 지금까지는 로봇 눈(카메라)을 통해서 입력하면, 그것으로 로직을 만들어 훈련한 후 로봇에 적용합니다. ChatGPT4가 이제 그런 것들을 많이 줄일 수 있는 하나의 또 방안이 아닐까…이렇게 생각합니다.
그러니까 ‘생성’이라는 것이 굉장히 중요한 것 같아요. 아직은 뭐 헛소리도 하고 거짓말도 하지만 이제 그런 것들이 분명히 많이 통제되고 정제되어 좋은 결과가 나오지 않을까 생각합니다.
고우성 : AI 로보틱스는 어떻게 보면 더미한 머신에다가 AI 브레인을 장착시키는 것이라 할 수 있습니다. GPT 3 같은 경우에는 그 AI 브레인이 지금 그냥 텍스트로만 상호작용하잖아요? 근데 지금 멀티모달(Multi Modal)이 되면 CCTV든 음성이든 다양하게 상호작용되는 것이니까요. 그렇죠?
최대우 : 네, 네.
고우성 : 닭 튀기는 로봇한테 주인이 ‘이제 됐고 청소 좀 해줄래?’ 이렇게 말할 수도 있는 거잖아요.
최대우 : 그런 시대가 이제 온다는 거죠. 그 모습과 방법, 가능성을 이제 다 보여주고 있는 것 아닌가…싶습니다.
고우성 : ‘알파고’는 사실 우리가 관객 입장에서 알파고와 이세돌이 바둑두는 것을 그냥 본 거잖아요. ChatGPT는 우리가 직접 해보는 것이고요. 즉, 우리가 경험한 것이지 않습니까? AI와 계속 대화하여 AI가 뭔가를 하게 만들고요. AI도 그렇게 발전하고 그런 패턴이 앞으로 계속해서 발전해 나갈 것 같기도 합니다.
최 대표는 기업들이 먼저 자신의 도메인에 특화된 작은 규모의 ChatGPT와 유사한 AI 모델을 특정 업무에 적용하는 방안을 추천하였습니다.

 

3. 기업에 특화된 주니어 ChatGPT

최대우 : 저는 기업 특화에 포커싱한 작은 모델들도 또 하나의 기회라고 생각합니다. 어차피 기술은 오픈되어 있으니까 오히려 좀 저렴하게 사용할 수 있는 GPT 모델도 있습니다. J-GPT라는 주니어 형태의 모델들도 있어요. 그런 것들을 활용해서 좀 특화된 모델 만드는 게 더 효율적이거든요.
우리가 말하는 ChatGPT, GPT 3, 4. 이것은 이제 Pre-trained 모델인 거죠. 내가 필요한 한정된 지식 말고도 다양한 다른 것들을 뒤섞어 놓았기 때문에 ‘정확한 정보들을 진짜 검색해서 주는가?’는 지금 약간 의문이잖아요? 물론 기술은 좋아졌지만요.
고우성 : 그렇죠.
최대우 : 그런데 예를 들어, 내가 지금 이 GPT의 어떤 구조를 좀 줄이고 즉, 2,000억개 쓰던 것을 확 줄이는 겁니다. 예를 들어서 법학과 관련된 것, 의학과 관련된 것으로 범위를 줄이는 것입니다. 그럼 그 지식 도메인에 한정된 훈련을 시키는 방법을 생각할 수 있잖아요? 그래서 이런 파생된 비즈니스들이 꽤 있지 않을까 하는 생각이 듭니다.
제너러티브하기 때문에 즉, ‘생성’이기 때문에 ‘그럴듯한 것을 만들어낸다는 점에서 창의적이다?’ 그게 진짜 창의적인지는 모르겠습니다. 혼용된 카피일 수도 있거든요. 사실 솔직히 얘기해서 그런 것을 원하는 비즈니스에서는 상당히 효과가 있지 않을까 생각합니다.
여기서 한 가지 궁금해지는 것이 있습니다. 기업이 가진 자신만의 도메인 데이터를 오픈AI ChatGPT에 올려서 학습시키면 바로 되지 않나? 라는 것입니다.

 

4. ChatGPT 기업적용 이슈

최대우 : Pre-trained 모델이 있으니까 지금 이제 많은 분이 ‘원하는 데이터를 가지고 Pre-trained 모델을 또 재학습을 할 수가 있다’고 생각하십니다. 그런데 불가능이라기보다는 지금 현실적으로 실현이 어려운 면이 있습니다. 비용, 시간 이런 것들이 어마어마하게 필요하거든요.
고우성 : ‘지금은 어렵다’고 하셨는데 구체적으로 왜 그것이 어려운 겁니까?
최대우 : 예를 들어, 2,000억개 파라미터(매개 변수)가 있어요. 그러면 파라미터가 뭐냐? 데이터에 의해서 다시 계산을 해야 하는 대상이지 않습니까?
고우성 : 그렇죠.
최대우 : 그럼 데이터를 넣고 이것을 제너러티브하게 잘 만드는 재학습을 해야 하는데, 2,000억개의 파라미터를 계산하기 위해서는 어마어마한 리소스가 필요한 거죠. 그래서 현실적으로 불과하다고 보는 게 맞습니다. 그래서 내가 원하는 어떤 답변을 하고 나의 지식을 학습시키는 또 다른 구조를 갖추는 연구를 합니다. 전체를 튜닝하지 않고 다른 구조를 붙이는 연구를 하는 것으로 저는 알고 있어요.
그렇기 때문에 연구를 통해서 지금 한계나 문제점들은 극복이 될 것이라고 생각합니다. 그렇게 되면 이제 또 다른 생태계가 생기는 거죠.
고우성 : 오픈AI가 다 만들어 놓은 인프라에 데이터 넣어서 돌리면 될 것 아닙니까?
최대우: 아, 돌리는데 그 비용과 시간을 어떻게 할 것이냐는 거죠. 제가 지금 다른 자료들이 있습니다. 그런 얘기들을 이제 유튜브나 오픈된 강의에서 많이 얘기하거든요. 이것을 계산하기 위해서는 숫자는 제가 기억은 못 하지만 몇천 개의 GPU가 필요합니다.
지금은 오픈AI와 MS가 tightly coupled 되어 있으니 아마 애저 클라우드 환경에서 서비스할 것 같습니다. 만약 ‘Pre-trained 모델을 트레이닝시키게 한다’라고 하면 그 거대 모델을 필요한 사람한테 카피에서 하나 줘야 하잖아요?
고우성 : 네. 하하.
최대우 : 네. 그러고 나서 그 사람이 Pre-trained 시키게 해야 합니다. 그럼 하나의 프롬프트를 넣을 때마다 그 비용 등을 어떻게 감당하겠습니까? ‘좀 어렵지 않나’ 이렇게 생각합니다.
그럼 현실적으로 지금부터 2~3년 동안 기업은 무엇을 어떻게 준비하고 있으면 좋을까요? 여기서 회사 대표님들 듣고 계시면요. 제발 직원들에게 ‘ChatGPT4 해봐’ 이렇게 막연한 지시는 하지 말아 주세요. ^^

 

5. ChatGPT보다 AI 내재화부터 먼저!

최대우 : 저는 너무 큰 기술에 관심을 두면서 아무것도 못 하는 기업들의 모습을 많이 봤어요. 예를 들어, 저희가 가지고 있는 NLU 모델이 BERT라는 것인데 2018년 구글에서 공개됐을 때 엄청난 파장을 일으켰습니다. 그런데 그게 한 1억 1,000만개 정도의 파라미터를 가지고 있었습니다.
당시만 해도 ‘1억 1,000만개라고?’ 막 이랬던 시절이거든요. 그런데 사실은 그런 BERT를 통해서 각 기업이 가지고 있는 다양한 텍스트, VOC 데이터를 활용한 자체 Pre-trained 모델을 만들어 놓은 곳도 없어요. 거의 없어요. 근데 갑자기 ChatGPT 가지고 뭘 하겠냐라는 것입니다.
차근차근 작은 것부터 경험을 해가면서 내재화하며 진행해야 합니다. 항상 보면, IT에서의 빅 키워드가 있잖아요. 빅 키워드가 ‘빅데이터’라면 ‘빅데이터 해!’ 이럽니다. 당시에 했던 것이 뭐냐면 외부 데이터 써야 했습니다. 그런데 SNS 크롤링한 평판 분석, 그거 다 어디 갔어요? 하하하.
고우성 : 하하.
최대우 : 그런 식으로 자꾸 접근하니까 오히려 쌓이는 게 없는 것입니다.
과거 기술, 2018년이니까 벌써 4년, 5년이 됐지만 트랜스포머 아키텍처라고 하는 것부터 하나씩 이해를 해가면서 ‘내 데이터 가지고 무엇을 할 수 있는가’에 대한 훈련을 하는 것이 필요합니다. 그래야 제대로 된 비전이 생기지 않을까요?
고우성 : 오픈 AI든 MS든, 다른 곳들도 그렇고 뭔가 거대 언어 모델을 접목할 수 있는 현실적인 방법들을 고민을 하고 있겠네요.
최대우 : 어휴. 당연히 그렇죠.
고우성 : 그래야 그 사람들은 돈을 벌거니까요.
최대우 : 빅테크들은 그렇게 하는 게 맞고요. 너무 그러한 것을 따라가려고 하면…하하. 제가 보기에는 어디 찢어집니다.
고우성 : 그러니까 그런 것들이 성숙했을 때 그때 활용하면 되는 것이고, 그전에는 기반한 기술들을 내재화 시키는 것을 해봐야 한다는 말씀이신 거네요.
최대우 : 네, 아무래도 기업이라는 게 뭔가 눈에 띄는 일을 해야 하잖아요. C 레벨들이 주는 메시지가 ‘ChatGPT 좀 해봐!’ 이렇게 전달했을 거라는 거죠. 그러면 진짜 하려고 하고요. 하하.
고우성 : 하하.
▶최대우 대표의 애자일소다와 AI 관련 문의를 하고 싶으신 분들은 메일로 상담 문의를 하실 수 있습니다.
※ 상담 메일 : contact@agilesoda.ai
※ 애자일소다 사이트 : http://agilesoda.com/

 


영상으로 시청하기!


최대우 대표의 다른 잇(IT)터뷰 글도 클릭해 보세요!
 
ChatGPT 동작 원리, RLHF-인간 피드백 기반 강화학습 (최대우 대표/애자일소다)
ChatGPT시대, 어떤 사람과 기업에게 유리할까? (최대우 대표/애자일소다)

◼ 콘텐츠 & 웨비나 문의 : marketing@talkit.tv , 02-565-0012
Copyright ⓒ 토크아이티 All rights reserved. 무단 전재 및 재배포 금지.