著者
持橋 大地 加来田 裕和
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1999, no.2(1998-NL-129), pp.35-39, 1999-01-20

メッセージ処理などにおいて,単語に重みづけを行うことは基本的で重要な課題である.従来このための手法としてtf・idfが用いられてきたが,tf・idfは文脈を考慮していないため,重要な語を落としてしまう可能性がある.本研究では,単語の重要度の基準として周辺分布に着目し,頻度と組み合わせた形での指標を提案する.この手法はテキストが文書に分かれない環境でも重みづけが可能であり,学習データによって適応的な重みづけが得られる.また,電子メールの重要性判定に適用することで,内容による優先度判定やフィルタリングが行えることが示唆された.