著者
杉浦 正利 木下 徹 山下 淳子 滝沢 直宏 藤村 逸子 成田 克史 大室 剛志 大野 誠寛
出版者
名古屋大学
雑誌
基盤研究(B)
巻号頁・発行日
2009

第二言語(外国語)で、読んだり書いたりする際に、単語の連続(連語)をどのように処理しているのかを観察した。読解時の視線をミリ秒単位で記録する視線計測装置による実験で、英語では連語の頻度の差により母語話者と学習者の処理は違うという結果が得られたが、フランス語では頻度の差は影響するが母語話者と学習者で処理に差はなく、ドイツ語では頻度の差は母語話者にも学習者にも影響しないという結果が得られた。また、英文を書く際には、書く過程と書いた結果とでは必ずしも連語は一致しないという結果が得られた。
著者
外山 勝彦 小川 泰弘 大野 誠寛 中村 誠 角田 篤泰 松浦 好治
出版者
名古屋大学
雑誌
基盤研究(A)
巻号頁・発行日
2014-04-01

本研究の目的は,日本法の動きに関する情報を即時に,分かりやすく国際発信するための支援環境の構築である.特に,統計的機械翻訳の利用とターミノロジーの構築により,法令の要約である「法令のあらまし」の翻訳・理解・発信を支援する手法とその有効性を示す.本研究の結果,「法令のあらまし」に対する日英統計的機械翻訳手法と文書構造化手法,複単語表現対訳辞書の構築手法とそれを用いた統計的機械翻訳手法の開発,法令改正に伴う法令ターミノロジーの経時変化の抽出・可視化手法などを開発した.また,「英文官報」からの対訳法令用語2,750語の抽出や,現在有効な定義語6,890語からなる法令ターミノロジーの構築も行った.
著者
村田 匡輝 大野 誠寛 松原 茂樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.92, no.9, pp.1621-1631, 2009-09-01
参考文献数
22
被引用文献数
3

リアルタイム字幕生成とは,講演や解説などの音声をテキストで提示するものであり,聴覚障害者や高齢者,外国人らによる講演音声の理解を支援するための技術である.講演では一文が長くなる傾向にあり,多くの文がスクリーン上で複数行にまたがって表示されることになるため,テキストが読みやすくなる位置に改行が挿入されている必要がある.本論文では,読みやすい字幕を生成するための要素技術として,日本語講演文への改行挿入手法を提案する.本手法では,係り受け,節境界やポーズ,行長などの情報に基づき,統計的手法によって改行位置を決定する.日本語講演データの1,714文を使用した実験では,改行挿入の再現率で82.66%,適合率で80.24%を達成し,本手法の有効性を確認した.
著者
大野 誠寛
出版者
東京電機大学
雑誌
基盤研究(C)
巻号頁・発行日
2016-04-01

本研究では、話し言葉や、即興で生成された書き言葉を入力とする言語アプリケーションのための基盤技術として、読みにくい語順を持った文に対する高性能な係り受け解析器を開発する。平成29年度は、以下の4項目を実施した。(1)これまでに開発済みの語順整序・係り受け解析の同時実行手法を、節内部と節間の2段階に分けて適用する解析器の開発を推進した。具体的には、その前処理として、読みにくい文に対する節の始境界検出手法を開発した。昨年度構築した読みにくい文のデータを分析した結果、読みにくい文には埋め込み節が頻出することが分かり、節ごとに分割実行するには、節の始境界の検出が必須となることが判明したためである。(2)本研究では、人が漸進的に係り受け構造を把握する過程を分析し、その振舞に関する知見の獲得を試みる。その分析用データとして、これまでに作業者1名が漸進的係り受け解析を実行したデータを構築していたが、本年度は昨年度に引き続き、当該データの増築を実施した。具体的には、異なる別の作業者1名によるデータ構築を推進し、3,639文に対する作業が完了した。(3)漸進的係り受け解析では、入力に対して同時的に処理を行う必要があり、処理の正確さを保ちつつ、遅延時間を抑えることが求められる。そのため、意味的なまとまりをもつ文が今後どれだけ続くかという情報は重要な手がかりとなりうる。そこで、漸進的係り受け解析の関連研究として、文節が入力されるごとに残存文長を推定する機構の開発に取り組んだ。(4)読みにくい文に対する係り受け解析の関連研究として、昨年度に引き続き、法令文に対する並列構造解析手法の開発を推進した。本年度は、ニューラル言語モデルを用いた法令文の並列構造解析技術の精緻化を新たに実施した。昨年末時と比較して、適合率は65.2%から66.1%に、再現率は62.5%から65.2%に、それぞれ向上した。
著者
大野 誠寛 村田 匡輝
出版者
名古屋大学
雑誌
若手研究(B)
巻号頁・発行日
2009

本研究では、講演や解説などに対して読みやすい字幕をリアルタイムに生成するため、その要素技術として、次の3つの話し言葉処理手法、(1)節の始境界検出に基づいて高精度化した、話し言葉の漸進的係り受け解析手法、(2)話し言葉を読みやすいテキストにするための構文構造に基づく話し言葉の整形手法(主に、読点挿入手法)、(3)字幕テキストを読みやすく表示するための構文構造に基づく改行挿入手法、をそれぞれ開発した。