著者
横井 祥 小林 颯介 福水 健次 乾 健太郎
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

コロケーション獲得や対話応答選択など,言語表現の間の関連の強さのモデル化は自然言語処理における基本的タスクである.デファクトの共起尺度である自己相互情報量(PMI)は疎なデータに適用すると大きな学習時間が必要となる.本講演では,PMIが「相互情報量へのペア(x,y)の貢献度」と捉えられることと対応付け,新しい共起尺度であるPointwise HSIC(PHSIC)を「カーネル法に基づく依存性尺度HSICへのペア(x,y)の貢献度」として提案する.PHSICは句や文などの疎な言語表現に適用でき,しかも行列計算に基づく高速な推定が可能である.実験では,PHSICを対話の応答文選択タスクに適用し,学習速度が既存尺度に比べ約100倍高速で,かつデータ数が少ないときにも予測精度の劣化が少ないことを示す.

言及状況

Twitter (6 users, 6 posts, 14 favorites)

私は明日6月5日(火) 15:20〜 自然言語処理セッションで発表します。 予稿集の話に追加で、提案手法(カーネルでスムージングした自己相互情報量)が機械翻訳の訓練データのクリーニングにも便利に使える話もします。 https://t.co/VZycKZ2yEg

収集済み URL リスト