著者
大野 誠寛
出版者
東京電機大学
雑誌
基盤研究(C)
巻号頁・発行日
2016-04-01

本研究では、話し言葉や、即興で生成された書き言葉を入力とする言語アプリケーションのための基盤技術として、読みにくい語順を持った文に対する高性能な係り受け解析器を開発する。平成29年度は、以下の4項目を実施した。(1)これまでに開発済みの語順整序・係り受け解析の同時実行手法を、節内部と節間の2段階に分けて適用する解析器の開発を推進した。具体的には、その前処理として、読みにくい文に対する節の始境界検出手法を開発した。昨年度構築した読みにくい文のデータを分析した結果、読みにくい文には埋め込み節が頻出することが分かり、節ごとに分割実行するには、節の始境界の検出が必須となることが判明したためである。(2)本研究では、人が漸進的に係り受け構造を把握する過程を分析し、その振舞に関する知見の獲得を試みる。その分析用データとして、これまでに作業者1名が漸進的係り受け解析を実行したデータを構築していたが、本年度は昨年度に引き続き、当該データの増築を実施した。具体的には、異なる別の作業者1名によるデータ構築を推進し、3,639文に対する作業が完了した。(3)漸進的係り受け解析では、入力に対して同時的に処理を行う必要があり、処理の正確さを保ちつつ、遅延時間を抑えることが求められる。そのため、意味的なまとまりをもつ文が今後どれだけ続くかという情報は重要な手がかりとなりうる。そこで、漸進的係り受け解析の関連研究として、文節が入力されるごとに残存文長を推定する機構の開発に取り組んだ。(4)読みにくい文に対する係り受け解析の関連研究として、昨年度に引き続き、法令文に対する並列構造解析手法の開発を推進した。本年度は、ニューラル言語モデルを用いた法令文の並列構造解析技術の精緻化を新たに実施した。昨年末時と比較して、適合率は65.2%から66.1%に、再現率は62.5%から65.2%に、それぞれ向上した。

言及状況

Twitter (1 users, 1 posts, 0 favorites)

基盤研究(C)「日本語語順の柔軟性を考慮した係り受け解析技術の開発」 https://t.co/P1HBe1gYw0

収集済み URL リスト