著者
岩井 秀成 土方 嘉徳 西田 正吾
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.7, no.2, pp.11-23, 2014-06-30

Amazon.comに代表されるショッピングサイトの多くでは,アイテムに対してレビューを簡単に作成・閲覧できる機能が提供されている.レビューに書かれた他者の意見は有用であるが,小説や映画などのストーリーを持ったアイテムに対するレビューには,ストーリーの内容(本稿では「あらすじ」と呼ぶ)が書かれている場合がある.レビューによりあらすじが分かってしまうと,実際に小説や映画を見たときの楽しみや感動が減ってしまい問題である.そこで我々は,あらすじを文単位で検出し除去することを試みる.我々は,このあらすじ検出を実現するために,各文がレビューとしての文脈を維持する形で書かれていること(文脈一貫性)に注目する.本研究では,レビュー文書の文書構造とあらすじ以外の観点に基づくクラス情報を用いたあらすじ文判定手法を提案する.評価実験を行い,文書中における文の位置情報の付与と文脈情報の利用によりあらすじ判定の精度が向上することを確認した.また,被験者実験により,提案手法はユーザが知りたくなかった記述の多くを除去できており,かつ,商品購入の際に意思決定につながる文の多くを表示できていることを明らかにした.Users can write and read reviews of items easily on many Internet shopping sites. Reviews on items like novels and movies can include spoilers (undesired plot descriptions) along with the opinions of the review authors. It is an issue that spoilers might reduce a delight in reading novels and watching movies. Therefore, we try to detect and eliminate spoilers by sentence. In this paper, our target is utilization of contextual coherence that is originally embedded in a review document and makes readers to understand the content easier. We propose a plot classification method using the document structure and the information of multiple classes in reviews. Experimental results show that using position information of a sentence and context information contributes to the improvement of classification results. In addition, a user study shows the proposed method can remove spoilers without removing useful sentences.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

レビューからあらすじを除去する研究あります(卒研ネタとしてブックマークしたまま中身を確認していないのですが…) ( 。・・)/⌒□ポイ『レビューの文脈一貫性を用いたあらすじ文判定手』https://t.co/8bVSKsiCe2 https://t.co/T5H4RNPmUz

収集済み URL リスト