著者
山本 和英 池田 諭史 大橋 一輝
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.12, no.6, pp.85-111, 2005-11-10 (Released:2011-03-01)
参考文献数
8
被引用文献数
1 1

新幹線要約, すなわち新幹線車内や街頭での電光掲示板で流れるニュースは簡潔に表現されており, このために独特の表現をしている.本論文ではこの特徴的な表現のうち体言止めや助詞止めといった文末表現に着目し, 一般的な新聞記事の表現をこのような高密度表現に加工する手法を提案する.まず, 実際に2万記事に及ぶ新幹線要約の表現の特徴を調査し, 文末におけるサ変名詞での体言止めが一般の新聞記事の8倍, 格助詞での助詞止めが一般の20倍あることを確認し, 新幹線要約における表現の特異性を確認した.次に, このような文末表現を実現するための提案手法を実装し, 新聞記事を入力として要約した.この結果, 文末表現に限定した要約率は12%であり, 1文当たり平均して2.5文字削除することができた.この結果を人間が行なった文末整形の結果と比較したところ, 要約率はほぼ同様の結果が得られた.さらに, 出力表現の評価を行なった結果, 正解率は95%となった.
著者
池田 諭史 大橋 一輝 山本 和英
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.93, pp.161-168, 2004-09-17
被引用文献数
1

新幹線の電光掲示板で使用されるニュース記事は冗長度の少ない高密度表現となっている。また、体言や格助詞で終るといった独特の文末表現をしている。そこで本稿ではこのような高密度文の文末に着目し文末が体言や格助詞で終る形に整形することによる要約を試みた。整形はパターンマッチを用いて行ない、結果として文末の要約率は52%であり1 文当たり2.50文字の削除ができた。また、人が判断した正解率は95%であった。The electrical bulletin board news consists of high density expressions. The end of the sentence is unique shape that is nouns or case particles. This paper focuses on expressions of the sentence end, and attempt to summarize them by forming them into nouns or case particles. We summarize the news sentence by pattern matching approach. Our evaluation illustrates that our summarizer reduces 2.50 characters on average; the summarization ratio of sentence ends is 52%. We also show that the correctness of reduction is 95%.