지금은 AI 전쟁의 시대다 1- 챗 DPT 란

지금은 AI 전쟁의 시대다 1- 챗  DPT 란 

주목받고 있는 과학기술 분야는 바로 AI이다. 
영화 "HER" 는 인공지능인 사만다와 정서적으로 교감하고 여자 친구로 까지 발전하는 과정을 메인 주제로 관객들에게 크게 생각해 볼 거리를 던져주었다.
여기에서 일반적인 AI 와 영화 "HER" 에서의 사만다가 특징적으로 다룬 부분은 바로 감정을 공유할 수 있다는 것이다 . 이런 감정 공유의 필수 조건이 상대방과의 대화를 문맥상으로 이해하고 소통이 가능해야 한다는 점이다.
그런데 최근 챗 DPT 라는 대화형 검색 엔진이 등장해 큰 파장을 주고 심지어 거대 AI에 대한 공포심으로 까지 확장되고 있다.
오늘은 GPT 가 무엇인지 어떤 기업이 만들었는지 자세히 알아보고 어떤 기술을 어떻게 활용해서 수익화 하고 있으며  마지막으로 대화형 검색 엔진의 한계점에 대해서 살펴보자




           < Chat GPT란 무엇이고 왜 구글검색엔진을 위협 하는가? >

GPT란 무엇인가 사전적 정의에 의하면 GPT란 generative pre-trained transformation 약자로 딥 러닝을 통한 생산적 사전 학습 변환기라고 해석된다.
GPT는 언어를 이해하고 구사하는 AI 언어 생성 모델 중 하나로 
2018년 GPT -1 ,2019년 GPT-2 ,2020년에 GPT-3로 발전해 왔다. 
현재 이슈가 되고 있는 챗 GPT는 GPT 3.5모델이다.
전문가들은 오픈 AI 가 2023년 공개할 예정인 GPT-4에 1조에서 100조개 사이에  매개변수 가 사용될 것으로 추측한다. 

그렇다면 기존의 챗봇이랑 책 GPT가 무슨 차이가 있길래 이렇게 큰 이슈가 되고 있는지? 
가장 큰 차이점은 사람의 피드백을 반영 하는 강화 학습 RLHF(reinforcement learning with human feedback)기술이 적용되어 있다는 점이다.  
기존 챗봇은 답이 정해져 있는 데이터를 사람들이 입력해서 AI를 학습 시키는 방법이었다면 GPT는 인공지능이 사용자의 피드백을 기반으로 훈련하여 최적의 결과를 찾는 강화 학습 방식을 채택하고 있다 . 
바꿔 말하면 GPT는 이용자들의 실시간 대화 데이터를 바탕으로 시행착오를 거치며 스스로 훈련하는 모델이다. 
또한 대화가 끝나면 데이터가 사라지는 기존의 챗봇 과는 다르게 사용자의 피드백을 반영하는 학습 방법이기 때문에 이용자의 데이터를 계속적으로 축적해 대화의 맥락을 꾸준히 이어갈 수 있다는 장점이 있다 . 
여기까지 듣고 보면 GPT 에 대해서 대략적으로는 이해하겠는데 이 기술이 구체적으로 구글 검색 엔진에 어떻게 위협을 가하는 걸까 하는 의문이 든다. 

GPT를 만든 open AI에 대해 알아보자.
2015년에 일론 머스크와 현 ceo인셈 알트만이 공동 설립한 비영리 인공지능 연구소로 전적으로 인류에게 이익을 주는 것을 목적으로 건립하였으나 개발 비용과  인건비와 설비 비용을 담당 못해 open AI  투자자 수익에 100배 제한이 있는 반영리 단체로 바뀌었다.

이때 MS가  10억달러(1조 2400억)의 투자를 함으로  open AI 라이센스를 소유하게 되었다.
MS는 2020년  GPT-3의 학습을 위한 맞춤용 슈퍼 컴퓨터를 제공해 주고 자사 클라우드 서비스의 "MS Azure" 를 활용하게 해줌으로써 open AI GPT-3의 독점 라이센스를 부여 받는다.
테크 펀딩 뉴스에 따르면 최근 MS가 추가적으로 100억 달러를 open AI 에게 투자하기로 결정했고 MS가 지분의 49%를 다른 투자자가 49% 나머지는 2%는 비영리 모 회사가 보유하게 된다. 결국은 75% 이익을 얻게 될 것이다 라고 한다(비확정)

MS사의 비즈니스 모델 2가지 
1. 깃허브콕 파일럿 : 코딩 자동 완성 기능으로 월 19달러를 내고 이용할 수있는 AI모델 
GPT-3모델을  이용하여 개발자들이 자주 사용하는 코딩을 사용자 피드백 기반으로 AI에게 
학습 시켜 방대한 데이터를 확보한 뒤 그들에게 최소한의 타이핑으로 코딩을 자동 완성 시켜주는 기능을 하고 있다.

2. MS 사의 "bing"에 GPT적용 
질문을 하면 최적의 답변을 바로 보여준다.

불름버그 기사에 따르면 
구글  순다르 피차이가 최근에 사내 AI 회의에서  GPT가 구글에 검색엔진 비즈니에 가하는 위협을 해결하라고 지시했다고 언급하고 있다.
그런데 이 부분에서 궁금한 점은 거대 기업 구글은 대화형 검색엔진을 만들 역량이 없는가?
이에 대한 답변은 구글도 충분히 역량이 있다. 
일단 구글은 다수의 언어 생성 모델을 가지고 있다. 이 중 람다는 1370억 개의 매개변수를 가지고 있을 정도로 거대한 모델이기 때문에  구글이 챗 GPT 못지않은 챗봇을 만들어낼 역량이 충분하다고 평가 받고 있다.  하지만 대다수의 전문가들은 구글이 챗봇의 검색 기반으로 바꾸는 것을 서두르지는 않을 것이라고 전망하고 있다. 

금융 시장을 위한 클라우드 소싱 컨텐츠 서비스 업체인 시킹 알파의 기사에 따르면 구글의 총매출 80% 이상은 광고 수익에서 나오고 있고 이러한 광고를 적용하기 위해서는 검색 엔진의 링크를 제공해 광고를 붙여야 하는데 챗봇과 같은 경우 링크를 제공 하지 못하기 때문에 이렇다 할 수익 모델을 만들기가 어렵다.  게다가 챗봇 연산하는 과정에서 엄청난 운용비가 들기 때문에 수익화 하기가 더욱 어렵다고 기사를 전하고 있다 . 
또한 오픈 AI CEO 샘 알트만도 채 GPT에 운용 비용이 너무 들어서 어떻게든 수익화 할 방법을 찾을 것이라고 말했다. 

또 다른 큰 한계점으로  GPT의 해결 과제 중 하나 인 할루시네이션 문제가 있는데 , 
할루시네이션이란 AI 가 존재하지 않는 답변 또는 틀린 답변을 마치 존재하지 않는 환각을 보는 것처럼 내놓는 것을 말한다 . 오픈 AI 의 공식 블로그 제한 사항 카테고리 글에 따르면 
챗 GPT가 그럴듯하지만 편향적 이거나 사실을 기반으로 하지 않는 답변을 내놓을 수 있다고 경고하고 있다.  또한 데이터 과학자인 앨런 말고 리스는 뉴욕 타임즈 아이 인터뷰에서 
새로운 챗봇이 놀랍기는 하지만 그들의 대답은 마치 그들이 배운 인터넷처럼 사실과 허구를 섞을 수 있다고 언급했다 .

MIT 테크놀로지 리뷰의 기사에서 오픈 AI 의 CEO 므라치는 대규모 언어 모델의 출력에 의문을 제기하는 것은 모델이 생성하는 응답을 되돌리는 효과적인 방법이다 
그러나 이 방식은 사용자들이 처음부터 오답이나 잘못 해석 질문을 찾아내야 한다.그래서 우리가 아직 답을 알지 못하는 것에 대한 질문을 하려는 경우 실패할 확률이 높다 라고 말하고 있다. 

이에 대한 예시로 경쟁 업체인 메타도기사 논문 사전 등으로부터 과학 정보를 훈련하고 과학에 관한 질문에 해 답변을 하는 AI 갤럭티카를 선보였지만  사이비 과학 정보를생성한다는 비난이 제기되자 3일 만에 서비스를 종료한 사건이 있었다.
이처럼 챗봇이 검색 시장을 바꿀 잠재력을 가지고 있지만  수익 모델이 없고 할루시네이션 이슈를 해결하지 못한 점을 미루어볼 때 구글이 당장 대화 기반 검색 엔진으로 전환할 가능성은 작아 보인다.

모건 스탠리 애널 리스트 브라이언 노악은 비즈니스 인사이드와 인터뷰에서 인터넷 사용자가 구글을 버리려면 챗 GPT 가 10배 더 나은 솔루션을 제공해야 한다.
하지만 아직은 그렇지 않다고 언급했다 . MS가 GPT를 적용해서 검색엔진 bing을 어떻게 바꿀 지에 따라 인터넷의 핵심인 검색 엔진의 대 변화를  이끌 가능성도 있기 때문에 앞으로 언어 생성 AI 에 대한 관심은 더욱 커질 것으로 예상된다. 

여기까지 챗 GPT-와 수익화 모델 그리고 한계점에 대해서 구체적으로 설명한
최신 IT 소식을 알려주는 N잡러의 IT몰아주기 의 유투브 동영상 내용을 적은 내용이다. 

현재는 AI 전쟁의 시대다. 그렇다. 
인류를 흔들고 알 수 없는 미래로 이끄어 가고 있다.
30년전의 영화 속에서 보던 일이 현실 세계에 이미 일어나 일이다.
또한 일부에서는 아마겟돈이라는 전쟁이 일어날 거다 라는 인류의 종말을 암시하는 전쟁을 말하는 사람도 있었다. 
나는 AI전쟁 즉 구글과 MS사의 이런 전쟁을 보면서 
아마겟돈, 므깃도 라는 조용한 평야 지대를 생각한다. 
조용 하지만 인류에게 엄청난 미래를 가져다 줄 일이 지식 , 사회 문맹인 나의 눈에도 보인다.
우리는 공상 과학 영화 속, 현실에서  살아가고 있다. 

댓글