著者
大熊智子 増市 博 吉岡 健
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2006, no.1(2006-NL-171), pp.61-66, 2006-01-13

Lexical Functional Grammar(LFG),Head Phrase Structure Grammar(HPSG) などの句構造文法を用いたパーザでは、入力された自然言語文に対し、f(unctional)-structureやminimal recursion semantics(MRS)などの統語意味構造を出力する。このプロセスを逆に辿ることによって、つまり統語意味構造を入力することによって同じ文法を用いて自然言語文を出力として得ることができる。パーザに用いられた文法をそのままジェネレータに適用することが可能である。LFGに基づく処理系であるXerox Linguistic Enviroment(XLE)やHPSGの代表的な処理系LKBも、ジェネレータ機能を有している。このような生成技術が適用される応用として代表的な研究は、中間木を利用した翻訳システムがあるが、最近注目を集めている「言い換え」に対しても生成技術を適用できる可能性は高い。これ以外にも、QAシステムや対話システムなど、生成技術は様々な言語処理アプリケーションに適用可能な基礎技術である。ところが、実際には解析用の日本語文法をそのまま生成に適用しようとすると、解析の段階では問題にならなかった事柄が顕在化する。本研究では、我々が研究開発を進めてきた解析用文法を用いて生成を行う際の課題を分析し、それを解決するための手段について提案する。さらに文の生成実験を行ってそれらの妥当性について検証した。その結果、例外ルールの付加と語彙の選択という二つの手法を用いて、解析用文法を生成に適応させる手法を提案し、両者が解析成功率の向上に寄与することを確認できた。
著者
大熊 智子 梅基 宏 三浦 康秀 増市 博
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.16, no.3, pp.3_51-3_80, 2009 (Released:2011-09-01)
参考文献数
31

事物の数量的側面を表現するとき,数詞の後に連接する語を一般に助数詞と呼ぶ.英語などでは名詞に直接数詞が係って名詞の数が表現されるが,日本語では数詞だけでなく助数詞も併せて用いなければならない.名詞と助数詞の関係を正しく解析するためには,助数詞が本来持つ語彙としての性質と構文中に現れる際の文法的な性質について考慮する必要がある.本稿では,数詞と助数詞の構文を解析するための Lexical-Functional Grammar (LFG) の語彙規則と文法規則を提案し,その規則の妥当性と解析能力について検証した.提案した規則によって導出される解析結果 (f-structure) と英語,中国語の f-structure をそれぞれ比較することによって,日本語内での整合性と多言語間との整合性を有していることが確認できた.また,精度評価実験の結果,従来の LFG 規則に比べて通貨・単位に関する表現では 25%,数量に関する表現では 5%,順序に関する表現では 21% の F 値の向上が認められた.
著者
増市 博 大熊 智子 鷹合 基行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.106, no.299, pp.1-8, 2006-10-13

本稿では,深い言語処理のための言語理論の一つであるLexical Functional Grammar(LFG)を取り上げ,LFGに基づく日本語文法記述および日本語文解析/生成システムの研究,開発の現状とその応用技術について述べる.日本語LFGシステムの解析カバー率はEDRコーパスを対象とした場合で97.3%であり,適合率85.9%,再現率83.9%の係り受け精度を実現している.また,LFGに基づく文生成では95.7%の生成成功率を実現している.このように深い言語処理は精度およびカバー率の点で実用化のレベルに近づいてきている.さらに,宣言的な文法規則に基づく深い言語解析システムを用いれば,通常の係り受け解析システムよりも豊富な情報を持つ解析結果を得ることができる.今後深い言語処理技術は,より高度な言語処理アプリケーションを構築していく上で重要な役割を担っていくと考えられる.本稿では,このような深い言語処理の応用例として,日本語LFGシステムを用いた,医療テキストを対象とする情報抽出手法について説明を行う.

2 0 0 0 OA 言語処理乙女

著者
大熊 智子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.2, pp.173-174, 2016-03-14 (Released:2016-06-14)
著者
大熊 智子 増市 博 吉岡 健
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.13, no.1, pp.27-52, 2006-01-10 (Released:2011-03-01)
参考文献数
19

本稿では, 意味判定ルールを段階的に適用することにより, 副助詞「まで」, 「など」, 「だけ」が生来的に持つ曖昧性を自動的に判別する手法を提案し, その有効性を検証した.本手法では, まず着目する副助詞の前後の形態素を参照する形態素ルールを優先度に応じて適用し, 意味を決定する.次に, 形態素ルールだけではうまく判別できない構文に対して日本語LFGシステムによる構文意味解析を行い, LFGの出力結果であるf-structureの意味機能を参照する意味機能ルールを適用して多義性の解消を行う.EDRコーパスを用いた実験では, 殆どの形態素ルールで高精度の多義性解消が可能であることを実証することができた.さらに, この実験で判別精度が低かった5種類の構文 (「まで」2種, 「など」2種, 「だけ」1種) に対して, 意味機能ルールを用いて多義性の解消を行うことで, 形態素ルールよりも, 高い精度の多義性解消を確認できた.「まで」の多義性解消では, 69.6%から73.2%と58.4%から61.8%への向上, 「など」の多義性解消では29.6%から72.5%と47.2%から60.3%への向上, 「だけ」の多義性解消では55.8%から76.1%への向上を確認することができた.
著者
三浦 康秀 狩野 竜示 谷口 元樹 谷口 友紀 三沢 翔太郎 大熊 智子
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.26, no.1, pp.59-81, 2019-03-15 (Released:2019-06-15)
参考文献数
42

本稿ではオンライン議論における談話行為を分類するモデルを提案する.提案モデルでは談話行為を分類するために,ニューラルネットワークを用いて議論のパターンを学習する.談話行為の分類において議論のパターンを取り入れる重要性は既存の研究においても確認されているが,対象としている議論に併せたパターン素性を設計する必要があった.提案モデルではパターン素性を用いずに,木構造およびグラフ構造を学習する層を用いて議論のパターンを学習する.提案モデルを Reddit の談話行為を分類するタスクで評価したところ,従来手法と比較して Accuracy で 1.5%,F1 値で 2.2 ポイントの性能向上を確認した.また,提案モデル内の木構造学習層およびグラフ構造学習層間の相互作用を確認するため,提案手法の中間層を注意機構を通じて分析した.