著者
石田 憲幸 高崎 俊之 石松 昌展 石田 亨
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.95, no.1, pp.39-46, 2012-01-01

WikipediaはWeb上における有用な百科事典である.しかし,Wikipediaの記事数は言語によって大きく異なり,地域によってWikipediaを活用できる度合にも差が生じている.言語による知識の偏在を是正するために,Wikipedia記事を翻訳する活動がWikimedia財団とボランティアによって行われている.しかし,翻訳の際には,翻訳先言語に適した用語や表現を選択する必要があり,またそのためには,翻訳元言語の記事内容を十分に理解し翻訳を決定するための議論が必要である.この議論は,典型的には翻訳元言語と翻訳先言語を用いた2か国語(一般には多言語)による議論となる.その際,機械翻訳によって多言語の議論を支援することができるが,「翻訳されるべきでない部分まで翻訳される」「メッセージが往復することによって同一箇所が複数回翻訳される」といった問題が発生する.本論文ではそれらを解決する方法として,翻訳を行うべきでない部分の的確な選択と,その部分を説明する翻訳情報を付加するアルゴリズムを提案する.また,このアルゴリズムを実際にWikipediaの掲示板であるLiquidThreadsに実装し,効果の推定を行ったのでその結果を報告する.