최근 한국의 주요 대학을 방문했던 구글 세미나의 주요 주제도 웹에 기반한 자동 번역에 대한 것이었다.
그리하여... 실험 정신이 발동했다.
"자유의 여신상"에 대한 자동 번역 검색 결과 (그림을 클릭하면 확대)
검색 키워드의 난이도가 그다지 고약하지 않았지만 뜻밖의 검색 결과를 얻었다.
"자유의 여신상"을 하나의 고유명사로 감지하지 못하고, 자유, 신용 등과 같은 별개의 키워드로 인식한 것 같다.
근데 자유(Freedom)은 명백하지만 신용(Credit)은 대체 어디서 나온 키워드일까?
나올만한 곳이라면 여신(與信) 밖에 없는데. 어찌 이런 고난도(?)의 키워드가 먼저 나온걸까.
네이버 국어사전에서 "여신"을 검색해보면 첫번째 결과로 여신(與信)을, 두번째 결과로 여신(女信)을 얻는다. But 네이버 영어사전의 검색 결과 순서는 그렇지 않다. 설치형 사전인 Microsoft Bookshelf에서도 국어사전과 영어사전의 순서는 제각각이다. 혹시나 사전 검색 우선 순위 때문인가 했던 추리는 아닌 것으로 드러났다. ;;;
그 정확한 속사정이야 구글이 알겠지만서도, 아직 자동 번역은 발전할 여지가 많아 보인다.
(또는 웹문서들이 아직 덜 쌓였거나 ^^;; )
Posted by saber
