본문 바로가기
IT

[BP/IT] 음성인식과 기계학습이 결합한 유튜브 자동자막 서비스

by bruprin 2017. 2. 20.



BP's : 유튜브에 자동자막 서비스가 빠르게 확장되고 있다. 유튜브는 2006년 처음 동영상 자막 기능을 제공했고, 2009년에는 자동으로 자막을 생성하는 기능을 도입했다. 

그리고, 이 자막 기능을 더 확대해 자막을 적용한 동영상을 확대하고 있다. 현재 유튜브에서 자동 자막이 적용된 영상은 10억개를 넘어섰다. 


유튜브는 영어를 중심으로 10개 언어에 자동자막 기능을 적용하고 있는데, 이 자막들이 일부는 잘 안맞기도 한다. 하지만, 단순한 문장이나 맥락을 이해하는 수준은 충분히 된다. 


구글은 그 정확성을 높이기 위해 노력하고 있고, 음성인식과 기계학습 알고리즘을 개선해 전체 서비스 수준을 높이는데 집중하고 있다. 영어 자막 같은 경우 인식률이 빠르게 높아지고 있다고.... 


이 자동자막서비스를 보면 구글의 문제 해결 방식에 대해서 알게 된다. 

동영상 자막을 하나하나씩 개선하는 하는게 아니라 전체 서비스를 한번에 개선할 수 있는 핵심 알고리즘을 조정하는 방식으로 접근하는..


물론 이 방식이 가능하다는 것은 누구나 알지만. 그런 기술적인 혁신을 하기 위해서는 많은 시간과 노력이 필요하기 때문에..할 수 있는 범위부터 하는 경우가 있는데. 

구글은 밑바닥부터 손을 댄다. 물론 그런 인력, 비용에 대한 역량이 있기 때문이기는 하지만... 


이런 것을 볼 때마다. 대단하기도 하지만 좀 무섭다는 생각이...


관련링크 : https://youtube.googleblog.com/2017/02/one-billion-captioned-videos.html



댓글