Notice
Recent Posts
Recent Comments
Link
관리 메뉴

Asia-Pacific Region Intelligence Center

구글의 시대 끝났다? 친구처럼 대화 나누는 AI 나왔다! 본문

Guide Ear&Bird's Eye6/산업의 쌀 반도체(5G. 인공지능, 자율주행. 태양광 재생에너지 등 )

구글의 시대 끝났다? 친구처럼 대화 나누는 AI 나왔다!

CIA bear 허관(許灌) 2023. 2. 8. 07:06

사진1. Chat GPT가 구글 검색을 대체할 수 있다는 목소리가 나오고 있다. (출처: ShutterStock)

세계 최대 AI 연구소인 오픈 AI가 최근 공개한 AI 모델인 GPT-3.5의 대화형 AI 서비스 'Chat GPT'가 화제다. 
 
Chat GPT는 이용자와 실시간으로 대화할 수 있는 AI 챗봇 서비스 중 하나다. 동시에 GPT-3의 방대한 데이터 처리 능력을 바탕으로 기존 AI 챗봇을 압도하는 성능을 보여준다. 여기에다 GPT-3의 단점으로 지적되던 '기계스러움'을 벗어던지는데 성공했다. 성능 자체는 기존 GPT-3와 큰 차이가 없지만 사람과 자연스러운 대화가 가능하다. 실제로 Chat GPT를 이용한 대화를 보면 AI의 대답이라고 생각하기 힘든 결과물이 많다.
 
해외에선 Chat GPT가 사람 수준의 농담을 하거나(GPT-3는 농담을 거의 하지 못 했다), 개발자가 만든 코드의 오류를 순식간에 잡아내는 사례도 올라오고 있다.
 
IT 업계에선 Chat GPT가 보여주는 수준이면 구글 같은 검색 서비스를 대체할 가능성이 있다고 평가한다. 지금 AI 챗봇으로도 필요한 정보를 확인할 수 있지만, 검색 포털 서비스를 대체할 정도는 아니다. 하지만 Chat GPT처럼 자연스러운 대화가 가능한 AI 서비스라면 검색을 대체할 수 있겠다는 평가다. Chat GPT의 데이터 처리나 학습이 이전 버전과 어떻게 다르기에 이런 결과물이 나왔는지 원리와 함께 살펴보자.
사진2. 구글과의 경쟁에 관한 각오(?)를 밝히는 Chat GPT

문장을 생성하는 AI GPT

 
GPT는 '사전 학습형 문장 생성 변환기(Generative Pre-trained Transformer)'의 약자로 미국 OpenAI가 자연어 처리를 위해 개발한 심층 학습 모형 Transformer에게 사전 학습을 제공해 자연스러운 문장을 산출하도록 튜닝한 인공지능 언어 모형이다. 2018년 처음 공개된 GPT-1은 매개변수 1억 1700만 개를 활용했으며, 2019년 공개된 GPT-2는 15억 개, 2020년 공개된 GPT-3는 1750억 개를 활용했다. 매개변수의 수가 늘수록 인공지능의 성능은 크게 향상된다.
 
문장을 생성하는 AI는 '질문에 답하기', '대화하기', '자연스러운 문장 만들기' 같은 다양한 목표를 추구한다. GPT는 그중 '자연스러운 문장 만들기'를 연구 목표로 삼았다. 예를 들어 약 45TB의 대규모 텍스트 데이터를 사전 학습한 GPT-3는 '내일 날씨는'이라는 단어열이 주어질 경우, 다음에 오는 단어의 확률은 맑음:40%, 흐림:30%, 비:15%, 밝은:5%, 기쁜:5%, 맛있는:3% 이므로 ‘내일 날씨는' 뒤에 '맑음', '흐림', '비'가 들어갈 확률은 높지만, '밝다', '기쁘다', '맛있다', 는 확률이 낮다고 추론한다. GPT-3는 이렇게 어떤 단어 다음에 오는 단어를 높은 정확도로 예측해 나가 자동으로 문장을 완성한다.
 
간단한 대화나 질문이라면 몰라도, 일정 수준 이상의 복잡한 문장을 만들려면 해당 내용에 관한 지식이나 상식이 어느 정도 필요하다. 적절한 지식이 없으면 문법적으로 자연스럽지만 의미없는 문장을 나열하는데만 그친다. GPT-3는 방대한 데이터베이스를 효율적으로 다룰 수 있는 학습 모델 '트랜스포머(Transformer)'로 이 문제를 해결했다.
 
트랜스포머의 핵심 기술은 신경망 알고리즘 '어텐션(Attention)'이다. 영어로 '주의'를 의미하는 Attention은 인공지능이 '어디에 주목해야 하는가'에 관여하는 알고리즘으로 각 '단어'나 '문장'중 어디가 중요하고, 어떤 관계성에 중점을 둬야 하는지 살핀다. 종래의 문장 생성 인공지능은 제공받은 문장을 순서대로 읽고 학습해 모든 단어와 문장을 살펴본 후, 단어와 문장의 전체적인 관계를 파악하는 식으로 작동했다. 그러나 이러한 방식은 원리적으로는 결함이 없지만, 방대한 지식과 데이터 양을 처리하기에 적합하지 않아 실용적인 수준에 도달할 수 없었다.
 
어텐션 알고리즘은 문장의 '요점'을 구분하는 식으로 방대한 데이터를 종래의 방식보다 빠르고 정확하게 학습할 수 있다. 트랜스포머는 어텐션의 도움을 받아 사용자에게 입력받은 문장 각 성분의 중요성을 평가하고, 중요한 부분에 더 많은 가중치를 부여해 다양한 길이의 문장을 효과적으로 처리한다. Chat GPT는 문구와 핵심 단어, 가치 같은 문장의 구성 요소를 동시에 주목하는 '멀티 어텐션' 기능을 강화해 다른 유형의 정보를 빠르게 파악할 수 있게 됐다.
사진3. Transformer 알고리즘이 작동하는 방식. (출처: arXiv)

Chat GPT는 당신의 문장을 이해하지 못한다 

 
새롭게 도입된 멀티 어텐션과 강화된 트랜스포머는 Chat GPT를 구성하는 중요한 요소이자 자연어 처리 분야를 크게 발전시킨 획기적인 아이디어다. 그러나 이 기술들은 '언어 처리를 효율적으로 해낼 가능성'을 열어줬을 뿐, AI에 의한 자연어 처리의 기본 원리는 신경망에 의한 자연어 처리 연구를 시작하던 무렵에 제안했던 '단어의 벡터화(Word to Vector)'와 크게 다르지 않다. 
 
'단어의 벡터화'는 모든 단어를 수치 매개변수로 나타낸 후, 단어가 모인 문장을 변수 사이의 통계적 관계성 문제로 대체해 신경망으로 처리하면 아무리 복잡한 문장이라도 처리할 수 있다는 아이디어다. GPT-3는 트랜스포머로 '단어의 벡터화'를 효율적으로 행하고, 종래 학습 모델보다 방대한 파라미터를 사용해 능력을 실용적으로 활용할 수 있을 정도까지 끌어올렸다.
 
그중 Chat GPT는 GPT-3의 여러 기능 중 채팅 기능을 강화한 특수판에 해당하며, 학습 도중에는 인간의 도움을 받는다. 실험자가 주어진 질문에 대한 모범 답안을 작성하면, 그들을 학습해 몇 가지 응답 후보를 만든다. 각각의 응답에 실험자가 점수를 매기면, 이를 토대로 더 나은 대답과 그렇지 않은 대답을 구분하는 식으로 채팅 능력을 강화한다.
 
이처럼 Chat GPT는 기본적으로 모든 문장을 문장 성분의 관계성으로 이해하기 때문에, 단어나 문장의 의미, 지식을 다루는 방법은 고려하지 않는다. 단순히 '오늘 날씨가 좋네요.'라는 문장을 입력하면, 이와 관계성이 깊은 문장을 찾고 그 다음에 이어질 확률이 높은 단어를 나열한다. 단순하지만 그 단순성 덕분에 어떠한 질문에도 자연스럽게 답할 수 있고 응용도 간단하다.
 
이 방식은 때때로 말의 의미를 이해하고 지식이 있는 사람이라면 '부자연스럽다'고 느낄 문장을 생산할 수 있다. 하지만 얼마 안 가 Chat GPT는 우리의 도움을 받아 점점 더 자연스러운 문장을 만들 수 있을 것이다. Chat GPT를 사용하려면 OpenAI 사가 요구하는 약정에 동의해야 하는데, 약정에는 Chat GPT와 주고받는 대화를 인공지능의 학습에 활용할 수 있다는 문구가 들어있다. 연구팀은 문화적 배경이나 고도의 문맥적인 이해를 필요로 하는 복잡한 상황이라도 Chat GPT가 사람과 대화를 주고받으면서 충분히 축적한 데이터 덕에 자연스러운 문장을 만들어 낼 수 있으리라 기대한다. 
 

구글의 시대 끝났다? 친구처럼 대화 나누는 AI 나왔다!

과학향기,세계 최대 AI 연구소인 오픈 AI가 최근 공개한 AI 모델인 GPT-3.5의 대화형 AI 서비스 'Chat GPT'가 엄청난 화제다.    Chat GPT는 이용자와 실시간...

scent.kisti.re.kr

ChatGPT: AI 챗봇 '챗GPT'에 커지는 표절 우려

지난해 미국 오픈AI사가 개발한 대화형 인공지능(AI) 챗봇 '챗GPT(ChatGPT)'가 전 세계적으로 큰 반향을 일으키며 인기를 끌고 있다.

과거 다른 AI 챗봇과 다르게 챗GPT는 일회성으로 끝나는 것이 아닌, 대화의 맥락을 파악해 마치 사람과 얘기하는 것과 같은 경험을 준다. 에세이를 쓰거나 컴퓨터 코드를 짜고 심지어 창의적인 아이디어까지 알려줄 수 있다.

챗GPT는 인터넷에 올라온 방대한 양의 정보를 학습해 사람이 쓴 것과 같은 글을 만들어낸다. 다만 2021년까지의 정보를 학습했기 때문에 시사나 현재 시각과 같은 '현재의 정보'는 알려줄 수 없다.

일부 학계에서는 챗GPT를 학생들이 표절에 사용할 수 있다며 우려를 표했다.

실제로 챗GPT는 의사면허시험 합격 성적을 받기도 했고 경영학 석사(MBA) 시험도 통과했다. 이에 프린스턴 대학에 재학 중인 한 학생이 AI가 사용됐는지 식별해내는 'GPT제로' 프로그램을 개발하기도 했다.

이러한 우려에 오픈AI는 자체적으로 사람이 작성한 글과 AI가 작성한 글을 판별해내는 툴을 출시했다. 하지만 아직 더 많은 테스트를 거쳐야 한다는 의견이 높다.

그러나 챗GPT는 마케팅 문구나 웹사이트 문구를 쓰는 데 활용되는 등 긍정적인 방향으로도 많이 사용되고 있다.

챗GPT가 '검색'의 새로운 미래가 될 수 있다는 의견도 있다. 이에 챗GPT를 따라잡으려는 기업도 많다.

대표적으로 구글은 비슷한 언어 모델인 '람다'를 개발 중이다.

람다의 개발 엔지니어 중 한 명은 '(람다가) 지각 능력이 있는 것 같다'고 발언 한 바 있다. 하지만 구글은 '지각 능력' 주장을 꾸준히 부인해왔고 해당 연구원은 해고됐다.

마이크로소프트사의 경우 오픈AI사와 파트너십을 맺어왔으며 추가로 수십억 달러를 투자할 것이라 밝히기도 했다

.ChatGPT: AI 챗봇 '챗GPT'에 커지는 표절 우려 - BBC News 코리아

 

'챗GPT', 의사면허시험도 통과한 인공지능 챗봇? - BBC News 코리아

오픈AI사가 선보인 인공지능 챗봇 '챗GPT'가 큰 인기를 끌고 있는 가운데 표절 우려도 커지고 있다.

www.bbc.com