챗GPT 및 AI활용

챗GPT를 탄생시킨 Open AI , 구글을 위협할 정도 장점만 있을까?

남극타잔

챗GPT를 만들어낸 Open AI는  유명한 테슬라 CEO 일론머스크와 링크드인(Linkedin) 회장 리드호프먼, 클래리엄캐피털 회장등 공동 설립한 스타트업이지요. 사실 Chat GPT가 시끄럽게 광고를 하면서 세상에 나온 플랫폼도 아닙니다. 조용히 출시되고 소문으로 화제에 올랐던 것이고 , 여기서 마이크로 소프트가 무려 100억이나 투자선언을 하면서 구글을 위협하게 되었습니다. 

 

 

OPEN AI

 

Open AI 는 2017년 구글이 트랜스포머를 제안후 2018년 디코더를 사용, GPT모델을 소개하게 되었는데 , 이 모델이 Generative Pre Training 이라고 논문에서 언급되고 , Chat GPT는 여기서 출발해서 GPT-1 ~GPT3까지 나오게 됩니다. 일반적인 이야기이기는 하지만, 컴퓨터는 컴퓨터의 언어로 이해하고 정보를 인지하지만, GPT같은 경우 언어 모델 , 단어를 기반으로 해석하고 이해할 수 있는 특징 입니다.

 

챗GPT

 

우리가 잘 알고 있는 것처럼 이전에는 이러한 기능의 사람의 '언어기반' 으로 정보를 얻고 만들어 낼수있는 것이 거의 없었다고 봐야겠지요. 이러한 기능으로 인해서 우리는 'CHAT'  , 채팅 기능의 챗GPT를 사용할 수 있는 것이고 , 그래서 사람들의 지시인 '프롬프트'가 중요하게 역할을 하고 있습니다. 또한 그러한 답변을을 토대로 다시 학습하고 , 다시 단어 , 토큰을 확장해 줍니다. 

 

 

언어모델이란?

 

언어 모델이란 텍스트 데이터들을 수집하여서 , 이것을 바탕으로 학습하게 됩니다. 또한 특정 단어를 토대로 그다음 단어를 계산하게 됩니다. 이러한 과정을 반복하게 되면서 글을 다듬어 가게 됩니다. 

 

 

2020년 출시한 대형언어 모델 기반

 

챗GPT는 2020년에 출시하게 된 대형 언어모델 기반의 GPT-3.5 를 다듬은 것입니다. 이는 사실 결함이 아직 많다고 판단한 버젼이였고, 이러한 결함들을 대중들의 피드백을 기반으로 좀 더 연구에 반영해서 다듬어 출시하려던 시도였습니다.  여전히 오픈AI 내부에서는 이러한 수백만명 사람들의 부딪혀야할 난관들에 대한 과제를 준비하고 있는 것으로 추정 됩니다. 이러한 과정의 예로는 "적대적 학습 (?) " 같은 기능을 강화하고 있는 것으로 , 이는 일반적인 제약으로 정해져 있는 것을 반대로 하고 , 원하지 않는 쪽으로 유도 질문이나 응답을 끌어 내려는 경우 다른 챗봇을 공격하는 것으로 , 그러한 정보들을 무시해 나갈수 있도록 학습 시키고 있다고 볼 수 있습니다. 2022년 1월에 오픈 AI를 GPT-3.5에서 미세조정 해본 인스트럭트GPT 출시를 하였습니다. 이는 챗GPT에 대화형 데이터를 추가하고 , 사용성을 높였던 것입니다.

 

 

GPT 시리즈

 

Open AI는 2019년에 GPT-1 이 공개가 되었고 , 이후 2020년 GPT-3까지 나오게 됩니다. 자세한 내용은 좀 전문적이지만 간단히 보면 , 점차적으로 모델의 크기와 규모가 커지면서 더 많은 데이터를 처리할 수 있게 되는데 이는 일반적으로 입력 및 출력 데이터를 TOKEN수로 표시 합니다.  모델이 발전함에 따라서 이 수치는 커졌는데, 아래표를 참고해 보실수 있습니다. 이 자료는 Chat GPT (챗GPT) 에 질의하여서 받은 답변 입니다. 객관적 수치를 보자면 정말로 엄청나게 발전을 한것으로 추정할 수 있습니다.

 

모  델 파라미터수 디코더 블럭층수
GPT-1 117,000,000 12
GPT-2 1500,000,000 48
GPT-3 1,75000,000,000 96

 

GPT-3 의 놀라움

 

사실 GPT-3 가 나온 시점인 2020년 역사적으로 가장 뛰어난 언어 인공지능 임에는 부인할수 없는 사실이였습니다. 다만 , 개발자와 연구 진행중에 있었기 때문에 일반인들이 그만큼 딜링할 수 없었고 접근성이 없었다고 볼 수 있습니다.

 

 

Chat GPT 사용자

 

챗GPT 가 등장한 것은 2022년 12월이니 얼마 되지 않아서 Open AI 에서 챗GPT를 공개한 것이지요. 개발은 GPT-3.5버젼으로 개발 되었습니다. 처음에는 유료버젼 없이 홈페이지 접속후 회원가입으로 가볍게 어떤 질문에도 답변을 해주는 것을 보고 아마도 금방 세계적으로 호평과 다운로드를 기록하게 되었습니다. 역사적으로 정량적 데이터만 비교해 봐도 사실 비교가 되지 않을 정도로 짧은 기간에 백만사용자를 돌파하기도 하였다고 유명 하지요. 물론 현재에는 이미 억명의 수치를 넘어서서 얼마나 많은 사용자가 사용하고 있는지 가늠할 수 없을것 같습니다.

 

한가지 팁을 드리자면 챗GPT를 통해서 우리가 다른 사람들보다 좀 더 구체적이고 명확한 세부정보를 얻기 위해서는 어떻게 활용하는 것이 좋을까요? 이는 사실 정확한 프롬프트를 , 즉 작업지시를 해주시는 것이 중요합니다. 이렇게 하기위해서는 두가지 툴이 필요한데요. 영어 언어 기반인 프로그램을 영어기반으로 활용을 쉽게 한다면 아무래도 많은 점에서 유리하게 활용하시는데 큰 잇점이 됩니다. 여기에 대한 자세한 이유와 내용이 궁금하시면 아래 정보를 선점 하시면 도움이 되실 겁니다.

 

 

챗 GPT 제대로 활용하는 비법

 

 

챗GPT 방향성과 한계점

 

사실 지속적으로 개발하고 발전시켜 나가야할 많은 문제들을 여전히 안고 있습니다. 물론 개발자들이나 오픈AI에서는 조속히 이러한 문제들을 해결시켜 나가고 싶어 하기도 합니다. 또 하나의 문제는 윤리적이고 도덕적으로 문제가 발생하지 않도록 관심을 기울이고 노력하겠지만, 끝없이 발생할 수 있는 Chat GPT 한계점은 지속해서 고치려 노력할수 밖에 없을 것입니다. 

 

 

검색포털 Bing 에서는 고도화 챗지피티 적용할까?

 

마이크로소프트에서는 검색포털 '빙'에서 빙챗 (Bing chat) 을 공개한 것이 지난 2023년 1월 이였습니다. 이때 아마도 GPT-4를 마이크로소프트에서 빙Chat에서 사용하였을 거라고 추정하였는데요. 사실은 물론 일부 향상된 모델로 챗GPT와 GPT-3.5모델 기능을 통합해서 모델을 구축하였다고 알려져 있습니다.

 

 

챗GPT 한계점

 

사실 아직도 오픈AI 에서는 지속적으로 연구개발 , 사람들의 사용을 기반으로 개선을 시켜나갈 계획임에는 분명한 사실 입니다. 아직도 많은 부분에서 수정하고 문제를 해결하도록 시도해야 하는 과정에 있는 것입니다. 또한 언어모델로 컴퓨터와 소통하는 것 또한 초기단계에 있기 때문에 여러가지 한계점을 지니고 있는 문제는 분명히 있습니다.

 

이러한 챗GPT의 방향성과 한계점에 대한 내용은 다음글에서 간단히 요약해 보도록 하겠습니다.

댓글

💲 추천 글