기업조회

본문 바로가기 주메뉴 바로가기

동향 기본정보

돌파구가 필요한 AI 언어 학습

동향 개요

기관명, 작성자, 작성일자, 내용, 출처, 원문URL, 첨부파일 순으로 구성된 표입니다.
기관명 NDSL
작성자 KISTI 미리안 글로벌동향브리핑
작성일자 2019-03-14 00:00:00.000
내용 기계가 언어를 습득하는 분야에 경력을 쏟은 보리스 캐츠(Boris Katz)는 현재 AI 기술이 시리나 알렉사를 정말 지능적으로 만드는데 불충분하다고 생각한다. 40년 이상 기계가 언어 능력을 갖도록 노력해 온 MIT 수석 과학자 캐츠는 현재 음성인식 기술에 감동하지 않는다. 그는 80년대에 자연스러운 문장 질의에 응답할 수 있고 IBM 왓슨이 제퍼디에서 우승하는데 일조한 START 시스템을 개발하여 현재 인공지능 비서의 기술적 기반을 마련했다. 하지만 캐츠는 수십 년 된 낡은 생각에 기반을 둔 접근으로 기술 발전이 저해되고 있으며 실제 지능을 갖춘 기계에 도달할 수 없을 것이라는 우려를 하고 있다. 어떻게 컴퓨터가 언어를 사용하는 것에 관심을 갖게 되었나? 1960년대 모스크바 대학에서 처음으로 컴퓨터를 접했다. 당시 사용한 시스템은 BESM-4라는 메인 프레임이었는데, 8진수 코드를 통해서만 통신할 수 있었다. 첫 번째 프로젝트는 컴퓨터가 수학 문제를 읽고, 이해하고, 해결하도록 가르치는 것이었다. 이어 시를 쓰는 프로그램을 개발했다. 아직 컴퓨터실에서 기계가 다음 시를 쓰는 것을 기다리던 시절을 기억한다. 마치 지적인 존재가 쓴 것 같은 시의 아름다움에 놀랐었다. 이후 평생 동안 컴퓨터와 소통할 수 있는 법을 터득하고 지능형 기계를 만들고 싶다는 것을 깨달았다. 시리, 알렉사를 비롯한 개인 비서 개발에 어떤 역할을 했나? 우리는 누구나 주머니에 하나씩 가지고 있는 인공지능 비서의 엄청난 발전에 대견해하며 한편으로는 매우 오래전에 그 발전에 도움을 준 것을 놀랍게 생각한다. 하지만 다른 한 편으로는 이 프로그램들이 매우 멍청하다는 것을 알기 때문에 부끄러움도 느낀다. 사용자들은 지능적이라고 느끼지만 실제로는 전혀 그 근처에도 가지 못한다. 머신 러닝으로 AI 분야에 상당한 발전이 있어 왔다. 기계가 언어에 더 능숙해진 것이 아닌가? 한편으로는 매우 극적인 발전이었으나 다소 과장된 면이 있다. 기계 학습을 돌이켜 보면 모든 아이디어는 20-25년 전에 등장한 것들이다. 그 아이디를 실현한 것은 엔지니어들이 훌륭한 업적을 쌓은 것 때문이다. 하지만 아무리 그 업적인 훌륭하다고 해도 진정한 이해, 진정한 지능이라는 문제를 해결하지는 못할 것이다. 그래도 AI가 진전을 보이고 있지 않은가? 매우 상위 수준에서 볼 때, 머신러닝과 딥러닝 같은 통계적인 현대 기술은 규칙성을 찾는데 매우 능숙하다. 사람들은 대개 오랜 시간에 걸쳐 동일한 문장을 만들기 때문에 언어에서 규칙성을 찾는 것은 매우 쉬운 일이다. 문장 예측을 살펴보자. 기계는 우리보다 어떤 말을 할 것인지 더 잘 알고 있다. 그걸 지능이라고 할 수 있지만 단순히 단어와 숫자를 세는 것일 뿐이다. 우리는 계속해서 같은 것을 말하기 때문에 규칙성을 찾는 시스템을 구축하는 것은 쉬운 일이고 지능처럼 보이도록 할 수도 있다. 이게 바로 우리가 보고 있는 발전의 실체다. 최근 OpenAI가 발표한 위험한 언어 생성 도구를 어떻게 생각하는가? 사실 매우 인상적인 사례지만 어떤 배울 점이 있는지는 확실하지 않다. OpenAI 언어 모델은 다음에 나올 단어를 예측하기 위해 800만 개의 웹페이지를 학습하여 이전에 학습한 동일한 주제에 속한 이전 단어를 통해 다음 단어를 추측한다. 이 방대한 훈련을 통해 통사론과 의미론에 있어 지역적인 일관성을 보장할 수 있었던 것이다. 그럼 왜 AI가 언어에 있어서는 잘못된 방향으로 가고 있다고 생각하는가? 다른 분야와 마찬가지로 언어처리는 수백만 문장에 달하는 방대한 데이터를 이용한 학습으로 발전했다. 하지만 사람은 이런 식으로 언어를 습득하지 않는다. 우리는 아기에게 백과사전을 쥐어주면 언어를 습득할 것이라고 기대하지 않는다. 우리는 무언가를 볼 때 언어로 묘사한다. 또한 누가 무엇인가를 말하는 것을 들으면 실제 사물이나 사건을 상상한다. 사람은 시각, 촉각, 언어적 감각 등으로 가득한 물리적 환경에서 살고 있으며, 중복적이고 보완적인 감각을 통해 어린이들은 세상을 이해하고 동시에 언어를 배우게 된다. 이런 양식을 고립된 환경에서 학습한다면 문제를 쉽게 할 것인가 어렵게 할 것인가? 왜 상식이 중요한가? 포장 작업을 로봇이 돕는다고 가정하면 “이 책은 빨간 상자에 맞지 않을 것 같아 왜냐면 너무 작거든(This book would not fit in the red box because it is too small.)”이라고 말하면 로봇이 빨간 상자가 작다는 것을 분명히 인식한 후 의미 있는 대화를 이어갈 수 있기를 기대할 것이다. 하지만 “이 책은 빨간 상자에 맞지 않아 왜냐면 너무 크거든(This book would not fit in the red box because it is too big.)”이라고 말하면 책이 너무 크다는 것을 로봇이 인지하기를 원할 것이다. 대화에서 대명사가 어떤 것을 지칭하는지 아는 것은 사람들이 매일 하는 상식적인 작업이지만 위의 예제와 다른 사례에서 보듯이 세계에 대한 매우 심도 깊은 이해가 필요하고 현재 우리가 알고 있는 기계의 수준을 뛰어넘는다. 이것은 상식과 직관적인 물리, 다른 사람들의 믿음과 의도를 이해하고 원인과 결과를 추론하며 시각화하는 것 등 많은 능력이 필요한 작업이다. 물리적 세계의 시뮬레이션을 통해 기계에게 언어를 가르치려고 하는 이유는 무엇인가? 앞서 언급했듯이 우리는 아기에게 백과사전을 던져주고 “학습해”라고 말하는 것이 현재 우리가 컴퓨터에게 시키는 일이다. 이런 시스템이 우리가 원하는 대로 세상을 이해하도록 학습시킬 수 없다고 생각한다. 아기는 촉각을 통해 즉각적으로 세상을 경험한다. 이후 사건과 사물의 특징을 흡수하고 세상을 보기 시작한다. 이후 언어적인 입력을 듣기 시작한다. 이 보완적인 입력이 이해라는 마법을 일으키는 것이다. 더 나은 접근은 무엇인가? 한 가지 방법은 인간의 지능을 더 잘 이해하고 그 바탕에 지능형 기계를 만들어 내는 것이다. AI 연구는 우리가 어떻게 세상을 배우고 이해하는지 이미 알고 있는 방법을 반영할 수 있도록 발달 심리학, 인지과학, 신경과학을 기반으로 한 모델을 세울 필요가 있다. 진정한 발전은 과학자들이 밖으로 나가 실제 사람들과 소통할 때 이루어질 수 있다. 함께 지능을 이해하고 실세계에서 말하고 보고 운영하는 것을 어떻게 지능형 기계에서 복제할 수 있는지 알아내야 한다. 진정한 지능형 기계를 만들어 내는 것은 매우 어렵지만 가장 중요한 도전이기도 하다.
출처
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=TREND&cn=GTB2019005050
첨부파일

추가정보

과학기술표준분류, ICT 기술분류, 주제어 순으로 구성된 표입니다.
과학기술표준분류
ICT 기술분류
주제어 (키워드) 1. 인공지능,기계학습,딥러닝,언어 2. AI,machine learning,deep learning,language