본문 바로가기
IT/AI

[BP/AI] MS. 사람 독해수준을 넘어선 AI 실험결과 공개. SQuAD 점수 사람보다 높아

by bruprin 2018. 1. 17.

BP's : 올해도 AI는 IT부문을 주도하는 주제가 될 것이다. AI로 기존의 IT를 다른 차원의 부가가치를 만드는 일이 벌어지고 있다. 

MS는 자사가 개발한 AI가 Stanford Question Answering Dataset (SQuAD)을 사용한 문장 독해력 테스트에서, 사람 수준의 점수를 기록했다고 발표했다.

SQuAD는 500개 이상의 Wikipedia 항목에 대해, 10만 개 이상 질문과 답변으로 이뤄져 있다. 

MS AI는 이 중에서 하나의 단문을 '읽고', '이해'하고 몇 가지 질문 대해 문장에 근거한 답을 도출했다.

이번 SQuAD 테스트에서 AI가 높은 점수를 기록한 것은 동의어나 문법적인 차이를 어느 정도 이해하고, 구분했다는 점에서 의미가 있다. 

이전까지는 특정 단어에 대해서 파악하지 못하면, 전혀 엉뚱한 답을 내놨는데, 이번 테스트에서는 설명이 불충분한 단어에 대해서 문장을 통해 어느 정도 추론을 해서 답을 냈다. 

MS는 82.650이라는 점수를 달성했다. 같은 테스트를 사람으로 했을 때 평균 점수인 82.304을 넘어섰다.

MS는 AI가 머신러닝을 통해 책과 서류 정보를 신속하게 분석하고 이해하기 쉬운 방법으로 필요한 정보를 사람들에게 제공할 수 있다고 설명했다. 

그리고, 이번 시험결과는 그 시작에 불과하다고... 

웬지 좀 무서워진다. 

관련링크 : https://blogs.microsoft.com/ai/microsoft-creates-ai-can-read-document-answer-questions-well-person/


댓글