著者
山本 和英 安達 康昭
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.12, no.1, pp.51-78, 2005-01-10 (Released:2011-03-01)
参考文献数
9
被引用文献数
4 1

換言・削除規則を用いた国会会議録の要約手法とその評価について報告する.国会会議録には, 丁寧表現の頻出や独特な言い回し等の特徴がある.また, 会議における発言の書き起こしであるため, 話し言葉の特徴も見られる.本論文では, この様な特徴的な表現に着目し, 換言・削除することで要約を試みた.まず, 単語n-gramの統計結果から得られた頻出する敬語表現を普通体の表現に言い換えた.次に, 手がかり語を用いて頻出する冗長な表現や挿入句を推定し削除することによって要約した.これらの処理を約20年分の会議録に対して行なった結果, 自由発話が含まれる会議録では80%程度の要約率が得られた.また, CSJコーパスに対して本システムを適用した結果, 平均要約率が約84%であった.したがって, 本システムが国会会議録以外の話し言葉データに対しても有効に働くことを確認した.