著者
浅原 正幸 加藤 祥
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.23, no.5, pp.463-499, 2016-12-15 (Released:2017-03-15)
参考文献数
26

文書間類似度は,内容の類似度と表現の類似度の二つの側面を持っている.自動要約や機械翻訳ではシステム出力の内容評価を行うために参照要約(翻訳)との類似度を評価する尺度が提案されている.一方,表現を対照比較するための手段として,形態素(列)を特徴量とする空間上の計量が用いられる.本稿では,さまざまな文書間類似度について,距離・類似度・カーネル・順序尺度・相関係数の観点から,計量間の関係や同値性を論じた.さらに内容の同一性保持を目標として構築したコーパスを用いて,内容の差異と表現の差異それぞれに対する各計量のふるまいを調査し,文書間類似度に基づく自動評価の不安定さを明らかにした.

言及状況

外部データベース (DOI)

Twitter (3 users, 3 posts, 3 favorites)

文書間類似度について https://t.co/ceSGaPhwoI
文書間類似度について 自然言語処理 Vol. 23 (2016) No. 5 p. 463-499 https://t.co/jVUaJNLaqJ

収集済み URL リスト