著者
隅田 英一郎
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.57, no.1, pp.12-21, 2014-04-01 (Released:2014-04-01)
参考文献数
15

本稿では,半世紀を越える歴史があり,現在,巷(ちまた)にあふれる自動翻訳システムの2014年の到達点を紹介する。自動翻訳に対する人々の印象はさまざまである。翻訳対象の言語・分野・文長などによって,翻訳品質が大きく違うからである。たとえば,日本語と英語の間では,汎用で高精度な自動翻訳システムは現存しない。一方,日本語と韓国語の間では,汎用で高精度な自動翻訳システムが手軽に利用できる。技術に立ち返って,現在の自動翻訳の真の姿を共有することを目的として,中核技術になっている統計翻訳について詳しく説明する。統計翻訳は,対訳データから翻訳に必要なモデルを導出し,これに基づく確率を最大化するように翻訳する。統計翻訳は,①専門分野の高精度翻訳を実現できる,②多言語化が容易である等の従来技術にない特徴を有する。統計翻訳を旅行会話に適用した音声翻訳と特許に適用したテキスト翻訳を例に,高精度の自動翻訳について紹介する。
著者
西垣 知佳子 中條 清美 内山 将夫 隅田 英一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.109, no.297, pp.35-38, 2009-11-14

iPhoneとiPod touchをインターフェイスとする英語語彙学習用教材の開発を行った。iPhoneとiPod touchは発売以来急速に普及し,大学での英語学習への活用も始まっている。開発した語彙学習教材は,学校英語教科書で取り扱われることが少ないために,日本人英語学習者に不足している生活語彙を補強するための教材である。教材は1)コーパス言語学の手法を使って客観的に選定された生活語彙を学ぶことができる,2)教材に採用された指導法は指導実践を経て,指導効果が高いことが確認されている,3)初級学習者から上級学習者まで,また子どもから成人まで様々なレベルの学習者が活用できるという特徴を持つ。
著者
松田 繁樹 林 輝昭 葦苅 豊 志賀 芳則 柏岡 秀紀 安田 圭志 大熊 英男 内山 将夫 隅田 英一郎 河井 恒 中村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.96, no.10, pp.2549-2561, 2013-10-01

本論文では,独立行政法人情報通信研究機構(NICT)が開発した世界初のスマートフォン用多言語音声翻訳アプリケーション"VoiceTra"を用いた大規模実証実験に関して,VoiceTraシステムの概要,クライアントサーバ間の通信プロトコル,本システムで用いられた多言語音声認識,多言語翻訳,多言語音声合成の詳細を述べる.また,本実証実験中に収集された約1000万の実利用音声データの一部について,聴取による利用形態の分析,更に,実験期間中に行った音声認識用音響モデル,言語モデルの教師無し適応,言語翻訳用辞書の追加に対する音声認識,音声翻訳性能の改善について述べる.
著者
隅田 英一郎 佐々木 裕 山本 誠一
雑誌
情報処理
巻号頁・発行日
vol.46, no.5, pp.552-557, 2005-05-15

機械翻訳に対する増大しつづける需要とその翻訳品質に対する期待に現時点の技術は応じきれていない.しかし,最近,機械翻訳技術の研究は大きく変わった.1つは,翻訳品質を自動的に評価する手法が提唱され普及したこと.もう1つは大量の対訳から翻訳知識を学習する手法が盛んに研究され,短時間に低コストで機械翻訳システムを構築する技術が開発されたこと.この2つが相まって,機械翻訳システムが長足の進歩を遂げ社会の需要と期待に応える日は近い. 本稿では,特に,翻訳品質の評価に焦点をあてて,(1)代表的な人手評価の手法,(2)最も広く利用されている自動評価の手法,(3)評価型国際ワークショップの1つであるIWSLT,(4)自動評価の応用と展望について述べる.
著者
塚田 元 永田 昌明 隅田 英一郎 黒橋 禎夫
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.49, no.2, pp.194-202, 2008-02-15

近年,統計的機械翻訳研究コミュニティが中心となって,コンテスト形式の評価型ワークショップが開かれている.この評価型ワークショップが,(上)統計的機械翻訳入門で紹介した統計翻訳技術の急速な進歩を後押しする立役者となった.本稿では,代表的な評価型ワークショップを紹介するとともに,これを背景に進展した自動評価などの技術動向を解説する.また,これらのワークショップに日本から参加している研究機関の翻訳システムを紹介することで,日本における統計的機械翻訳研究の動向も合わせて報告する.
著者
土居 誉生 隅田 英一郎
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.6, pp.1742-1752, 2006-06-15

コーパスベース翻訳は高い翻訳品質を実現しうる有望な技術である.しかし,入力文と関連のない語が訳文に湧き出すなど,特徴的な翻訳誤りも観察される.本稿では,この湧き出し誤りへの対処として,後編集により自動修正するアプローチを提案する.提案手法は,単語翻訳モデルを利用して誤り語候補を検出し,修正処理を起動する.誤り語候補は,対訳コーパスから得られた用例を利用した制約の検証を経て,訳文から削除される.日英および中英翻訳を対象とした複数のシステムを使った実験で,誤り語自動削除による翻訳精度向上効果が確認された.
著者
隅田 英一郎 山本 博史 山本 博史 パウル ミヒャエル
出版者
独立行政法人情報通信研究機構
雑誌
基盤研究(C)
巻号頁・発行日
2007

構文、換言の利用、多言語向き形態素解析等、翻訳の高度化を行い、翻訳品質評価に基づく言語間距離を計算する方式を提案した。「英語話者の学習時間」は、フランス語などは短く、アラビア語、中国語、日本語は長いことは提案距離で説明できる。しかし、後者の3言語の「学習時間」は同じであり、英語との距離差では説明できない。より精緻な距離の創出が今後の課題である。また、副産物として21言語の全組合せ420通りの翻訳システムを構築した。
著者
菅谷史昭 竹澤 寿幸 隅田 英一郎 匂坂 芳典 山本 誠一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.7, pp.2230-2241, 2002-07-15
被引用文献数
12

ATR音声翻訳通信研究所(ITL)が研究開発した音声翻訳システムATR-MATRIXのシステム概要,コーパス収集,評価結果などについて,研究開始当初の目標や研究経緯に則して述べる.コーパスベースの技術を全面的に取り入れたATR-MATRIXの要素技術の詳細については文献を参照し,システムに特徴的な技術について本論で述べる.対話実験による総合評価を実施し,利用分野は限定されるものの,タスク達成率が90%となることを確認した.また,対話実験において実験を重ねるに従って,同一タスクに対する性能が向上するなど,ATR-MATRIXを介した対話実験結果について述べる.ATR-MATRIX speech translation system was developed at ATR Interpreting Telecommunications Research Laboratories (ATR-ITL).In this paper we explain the system's outline and its development process including the initial objective, corpus collection and its overall evaluation.Each of three major components of the system: speech recognition, language translation, and speech synthesis, introduced an innovative corpus-based technology.In the paper, however the explanation is focused to major topics in the overall system, while rendering appropriate references to detail explanations of specific technology.We also explain some experimental results: additional sessions improve the performance of the same task.
著者
隅田 英一郎
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.72, no.7, pp.232-237, 2022-07-01 (Released:2022-07-01)

深層ニューラルネットの登場によって人工知能の実用化が様々な分野で進んでいる。自動翻訳はその典型的な成功事例である。2016年以降の深層ニューラルネットによる自動翻訳の高精度化は革命的である。汎用だけでなく分野特化型もあり,多くのサービスが上市され,加速度的に普及し始めている。高精度化の背景にある自動翻訳の固有の事柄を説明し,自動翻訳を一層高精度にするために研究者以外が大きく貢献できることを述べる。また,自動翻訳が音声技術と連携することによって可能となる,逐次通訳と同時通訳の自動化についても現状と展望を述べる。
著者
山本 和英 隅田 英一郎
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.6, no.1, pp.3-28, 1999
被引用文献数
2

機械翻訳では目的言語で必須格となる格の人称と数を補う必要がある。本論文では、省略補完知識の決定木による表現、及び帰納的に機械学習することによって日本語対話文の格要素省略を補完する手法を提案する。本研究では形態素分割され、品詞、省略情報が付与された任意のコーパスとシソーラスのみを用いて行なう。決定木学習には、内容語の意味属性、機能語の出現、言語外情報の3種類の属性を使用する。未学習文に対してテストを行なった結果、ガ、ヲ、ニの三つの格で照応的な省略の補完を十分な精度で行なうことができた。またガ格と二格に対しては人称と数の補完にも有効であることを確認した。ガ格に関して、処理の有効性を学習量、話題依存性、使用属性との関係の三点から実験し、以下の知見が得られた。 (1) 当該問題に対する決定木学習量は全体として10<SUP>4</SUP>~10<SUP>5</SUP>事例で十分である。この時の補完精度の上限は80%~85%と予想される。 (2) 対話の話題が既知もしくは予測可能な時は、その話題のみのコーパスによる学習が最善である。話題が未知の場合は、可能な限り広範な話題に対して学習するのが最も効果的である。 (3) 学習量増加に伴い、決定木には機能語などの話題に依存しない属性が多く採用される。
著者
窪澤 駿平 渡辺 太郎 隅田 英一郎 岡田 将吾 新田 克己
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第29回全国大会(2015)
巻号頁・発行日
pp.2C1OS06a5, 2015 (Released:2018-07-30)

ニューラルネットワークにおいて,汎化性能向上のために深層構造が用いられる様になった.一方で,各層においてデータセットの大域的な特徴を捉えることが可能であれば,少ない層数でデータセットを表現可能である.そこで本研究では,級数展開に基づくネットワーク構造を用いることで大域的な特徴を捉え,さらに汎化性能を上げるために周波数領域での正則化を行うアプローチを提案する.
著者
今村 賢治 隅田 英一郎
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2019-NL-241, no.1, pp.1-8, 2019-08-22

本稿では,事前訓練済みの BERT (Bidirectional Encoder Representations from Transformer) モデルを Transformer ベースのニューラル機械翻訳 (NMT) に適用する.単言語のタスクと異なり,NMT の場合,BERT のモデルパラメータ (訓練済み) に比べ,デコーダー (未学習) のパラメータ数が多い.そこで,まず BERT エンコーダーのパラメータを固定して,未学習パラメータのみを訓練し,その後,全体を微調整する 2 段階最適化を行う.実験では,直接微調整したときには BLEU スコアが極めて低くなったのに対して,2 段階最適化では訓練が成功した.その結果,Transformer の基本モデルや,モデル構造が同じ事前訓練なしの Transformer に比べても BLEU スコアが向上することが確認された.また,少資源設定で,より効果が高いことが確認された.
著者
中村 哲 隅田 英一郎 清水 徹
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.49, no.6, pp.606-610, 2008-06-15
参考文献数
7
被引用文献数
1

異なる言語を話す人とのコミュニケーションや異なる言語を話す集団への情報発信を自由に行うことは,経済活動等種々の活動のグローバル化やボーダーレス化に伴いきわめて重要になってきている.特に,人間が話した言葉をそのまま相手の言語に自動通訳する技術は,人類にとって長年の夢の技術であった.この技術は,音声を認識する技術,話し言葉を翻訳する技術,相手の言語で音声を合成する技術で構成されており,長年の研究の結果,その基本的な部分が,最近,日本語,英語,中国語の旅行会話を対象に実用可能なレベルまで到達してきた.この技術は,文が比較的短く単純な日常の旅行会話を対象に,音声認識結果をテキストとして逐次翻訳をする技術であり,非言語的な情報を利用せず1文単位に訳を行うという点で音声翻訳と呼ばれている.現在の性能として,旅行会話に対する日英翻訳の精度の観点で人間と比較するとTOEICで600点以上の人間の翻訳性能と等価ということが明らかになっている.本稿では音声翻訳技術の技術と現状について概説する.
著者
江原 遥 馬場 雪乃 内山 将夫 隅田 英一郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

クラウドソーシング上の翻訳で高品質な訳を得るためには,同一文を複数の翻訳者に発注する必要がある.本研究では,高品質な訳が見込まれる翻訳者に優先的に作業を発注するため,翻訳品質を翻訳前に予測するモデルを提案する.提案モデルは言語テスト理論に基づき,原文中の単語を用いた単語テストを通じて翻訳者の語彙力を推定し予測に活用する.実験の結果,翻訳品質の予測精度と正しい訳文を得るまでの発注数が有意に改善した.
著者
隅田 英一郎
出版者
科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.57, no.1, pp.12-21, 2014-04
著者
西垣 知佳子 中條 清美 砂岡 和子 隅田 英一郎 内山 将夫 徳井 厚子
出版者
千葉大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

グローバル化の進展に伴い,世界の外国語教育は多様化の方向に進んでいる。本研究では多言語教育のための語彙学習教材の開発を行った。研究成果として,1)ペーパー版の英語語彙学習教材を開発し,試用効果を小・中学校で検証した,2)英語教材をもとに中国語,韓国語,日本語学習のためのペーパー版語彙学習教材を作成した,3)ペーパー版教材の成果を踏まえ,iOSを使ってモバイル英語語彙学習教材を開発し,Apple Storeにて公開した。
著者
隅田 英一郎 土井 伸一 飯田 仁水 山端 潔
雑誌
全国大会講演論文集
巻号頁・発行日
vol.46, pp.137-138, 1993-03-01

自然言語処理における最も困難な問題の一つに、構造的曖昧性の解消がある。例えば、前置詞句の係り先は典型的な構造的曖昧性を引き起こす。(1)I present a paper at the conference.例文(1)の前置詞句「at the conference」は、動詞「present」、名詞「paper」の両方を修飾しうる。一般に前置詞句の係り先は構文規則による解析だけでは一意に決定することが困難である。この例では前者の方が自然であるとしてよいだろう。例文(1)の翻訳を考えてみる。二つの係り先の相違は、それぞれ「会議で論文を発表する」、「会議での論文を発表する」と異なった日本語訳になるが、やはり前者の方が尤もらしい。このように前置詞を含む文を正しく翻訳するためには前置詞句の係り先の暖味性を解消する必要がある。既に、構文的な情報、統計的な情報などを利用して複数の係り先候補から尤もらしいものに絞り込む手法が数多く提案されている。筆者らは対訳コ-パスから用例(原言語表現とその対訳の対)を抽出し、入力表現と用例との間の意味的距離をシソーラスに従って計算し、最小距離の用例に基づいて訳語選択を行なう手法(Exampl-Based Machine Tralation EBMT)を提案している。