고도의 자동완성 기능
GPT는 ‘Generative Pre-trained Transformer’의 약자입니다. 챗GPT의 학습 과정은 다음과 같습니다. 챗GPT의 본체인 GPT에 지식을 학습시키고, GPT가 질문에 답을 하도록 학습시킵니다. 즉, 미리 GPT에게 학습시킨 것들을 바탕으로 chat(대화) 하게 학습시킨 것입니다. GPT 최신 모델인 GPT-3는 약 1억5000개의 단어를 기반으로 만들어졌다고 합니다. GPT가 미리 학습한 지식들은 약 1억5000개의 단어들 사이의 관계에 지나지 않습니다. GPT는 각 단어가 무엇을 의미하는지 모르지만, ‘A라는 단어 뒤에는 주로 B라는 단어가 온다’와 같은 단어들의 관련성을 바탕으로 문장을 구성하여 출력해내는 것입니다. 우리가 구글이나 네이버에서 검색을 할 때 쓰이는 자동완성 기능의 상위모델이라고 할 수 있겠지요.
챗GPT 무료로 공개한 이유
요즘 챗GPT가 열풍입니다. 마치 만능일 것처럼 소개되며 언론, 유튜브, SNS 등에서 챗GPT에 대한 논의가 계속되고 있습니다. 이렇게 큰 열풍인 챗 GPT는 대중들에게 무료로 공개되고 있습니다. 이유가 무엇일까요? 챗GPT를 무료로 공개한 이유는 사용자의 피드백을 받기 위해서입니다. 챗GPT는 스스로 고백했다싶이 아직 완벽하지 않습니다. 때문에 사용자의 피드백을 받아서 품질을 높이고 오류를 보완하고 있습니다. 하지만 상호 복잡하게 얽힌 신경망 알고리즘의 특성상 예상할 수 없는 부작용을 일으킬 수도 있고, 피드백끼리 충돌할 위험도 있습니다.
유료화 서비스 '챗GPT 플러스'
챗GPT의 하루 운영비는 1억원 이상이라고 합니다. 지난해 11월 공개된 이후 두 달만에 1억명의 사용자를 모았고, 챗GPT가 공개된지 3개월만에 유료화 서비스인 '챗GPT 플러스'가 출시되었습니다. 미국에서 유료 서비스 모델이 공개된지 8일만에 한국에서도 유료 서비스가 개시되었습니다. 무료 버전과 차별되게 '챗GPT 플러스' 구독자들은 새로운 기능과 개선사항이 나올 때 우선적으로 접근권한을 가지게 되고, 피크타임에도 평상시와 같은 접속이 가능합니다. 그러나 챗GPT에게 3000억개 규모의 단어를 학습시키는 과정에서 오픈AI가 저작권법 및 개인정보 보호규정을 어겼을 것이라는 주장들이 잇따라 나오고 있기 때문에 유료화가 수월하게 진행될지는 지켜볼 필요가 있다고 합니다.
총평
이제 우리는 생성 AI 시대를 마주하였습니다. 도구로서의 효용성이 크지만, 리포트 대필, 과제 대필, 표절 등 악용 가능성 또한 매우 큽니다. 아무리 좋아도 악용하지 않고, 잘 활용하는 것이 본인의 역량 증진에 좋을 것이라 생각합니다. 음식의 정의를 외울 수 있다고 음식을 잘 안다고 할 수는 없는 것입니다. 챗GPT는 음식의 정의를 외울 수 있을 뿐 음식에 대한 경험이 없기 때문에 잘 알고 있다고 말하기는 어려울 것입니다. 자신이 경험한 것들에 대해서 잘 알고있다는 믿음을 가질 수 있기 때문입니다. 다른 지역, 다른 나라에 관한 글을 많이 읽어서 잘 알고 있다고 생각했지만, 그곳에 가보거나 현지인들의 경험을 들어보면 막상 또 다를 수도 있는 겁니다. 또한 감각, 즉 소리, 감촉, 향기에 대한 정보는 직접 경험하지 않으면 잘 알기 어려운 것들이지요. 그만큼 직접 경험하고 부딪히는 것이 점점 중요해지고 있는 시대인 것 같습니다.