지난 13일 구글은 블로그에 자연어 처리에 대한 연구결과를 포스팅했습니다. 자연어는 말 그대로 사람이 말하는 자연스러운 문장을 의미하는데 현재까지 컴퓨터는 자연어를 100% 정확하게 인식하지 못하고 있기 때문에, 이를 개선하기 위한 연구가 계속되고 있습니다.
▼우리가 네이버에서 검색을 할 때 '키워드'로 검색을 하는 이유도 컴퓨터가 사람이 말하는 문장을 이해하기 어려웠기 때문입니다. 따라서 내가 필요한 정보의 핵심을 표현하는 '키워드'를 검색한 후 검색결과에서 내가 원하는 정보를 추가로 탐색해야 하는 과정을 거쳤습니다.
▼이런 키워드 검색은 인터넷이 생긴 이후로 검색방식의 표준으로 통했습니다. 하지만 최근 인공지능스피커에 대한 투자가 늘어나면서 기존의 키워드 검색보다 AI와 대화하는 방식의 자연어 검색에 대한 니즈가 커지고 있습니다. 이를 위해 구글과 같은 검색엔진을 운영하는 IT기업들은 자연어 이해를 위한 연구 개발을 꾸준히 진행해 왔습니다.
▼구글은 자연어 처리를 위해 최근 몇년 동안 인간이 사용하는 문장에 포함된 단어 간의 관계를 컴퓨터가 학습 할 수 있도록 하는 '단어 벡터 모델'을 개발해 왔습니다. 이 모델은 균등화, 유사성 또는 아이디어와 언어의 관련성에 기초하여 해당 단어의 인근 지점에 의미 있는 유사 용어를 매핑 할 수 있게 해주는데, 구글은 이 기술을 Smart Reply for Gmail에 적용하기도 했습니다.
▼Smart Reply for Gmail은 구글의 AI 시스템인 '텐서플로(TensorFlow)' 신경망 네트워크를 활용해 수신된 메일의 내용을 분석 스팸인지 여부를 구분합니다. 또한 메일의 중요도를 분석해 답장을 해야 할지 말아야 할지 알려주며, "운정 중이니 답장을 할 수 없습니다.", "오늘은 쉬는날이라 답변을 드릴 수 없습니다."와 같이 사용자의 일정과 현재 상황을 파악해 자동으로 답장을 해주기도 하는 서비스 입니다.
▼구글은 이렇게 개발된 자연어처리 기술이 다양한 분야에서 활용될 수 있도록 훈련된 텐서플로우 모듈을 사람들에게 공개했으며 이 기술을 사용한 서비스도 함께 선보였습니다.
▼Google은 두가지 신규서비스를 선보 였는데, 첫번째는 인공지능 도서검색 서비스인 '톡투북(Talk to Books)' 입니다. 이 서비스는 구글 라이브러리에 보관되어 있는 10만권의 도서를 자연어를 통해 검색을 할 수 있는 서비스 입니다. 마치 책과 대화를 하듯이 내가 원하는 정보를 검색하는 것인데요.
▼제가 "구글이 스카이 넷이야?" 라고 물어보니, "아니요. 자체 소프트웨어 프로그램의 정의에 따르면 Google 로봇은 자기 방어 기능을 사용하지 않는 한 사람에게 해를 끼칠 수 없습니다."라는 답변을 책에서 검색해 알려주었습니다. 이는 "구글이 스카이 넷이야?"라는 질문의 의도를 컴퓨터가 정확하게 이해했다는 것을 의미합니다. 물론 지금은 인간의 언어를 모두 정확하게 이해할 수는 없기 때문에 종종 예상치 못한 검색결과가 나오기도 했습니다.
▼구글이 선보인 두번째 신규서비스는 게임인데요. '세만트리스(Semantris)'는 자연어 처리기술이 적용된 단어연상 게임 입니다. 이 게임은 아케이드와 블록 두가지 모드가 있는데, 아케이드 모드는 단어나 구를 입력하면 화면에 표시되는 모든 단어의 순위를 정해 입력한 단어에 얼마나 잘 반응하는지에 따라 점수를 매기는 게임입니다.
▲ 세만트리스 아케이드 모드
▼블록모드는 AI가 제시한 단어를 보고 연상된 단어(화면에 나온 단어는 입력할 수 없음)를 입력하면 AI가 내가 입력한 단어를 분석해 AI가 제시한 단어중 어떤 단어를 보고 연상한 것인지 찾아줍니다. 이 과정을 테트리스 게임처럼 플에이할 수 있습니다. 실제로 플레이 해보니 블록 모드는 중독성이 상당했습니다. ^^
▲세만트리스 블록모드(중독성 장난아님)
▼지금까지 Google이 발표한 자연어 처리 기술에 대해서 알아봤는데요. 컴퓨터가 네이티브 스피커가 되는 날이 머지 않았다는 생각이 듭니다.