著者
本多 淳也 小宮山 純平 前原 貴憲 横山 大作
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.3A25, 2017 (Released:2018-07-30)

人間の嗜好や競技の優劣といったものを評価する場合、個々の候補の良さや強さを絶対評価をすることは困難で相対比較のみが可能である場合が多く存在する,このような相対比較に基づいてK個の候補のうちランキングを誤り確率p以内で推定する問題に対し、本研究では新たに O(K log K/p)の平均比較回数を達成するアルゴリズムを提案する.
著者
小宮山 純平 本多 淳也
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

複数のクリック率の不明なオンライン広告をウェブサイトに配置する問題を考える。このとき、クリック率の高い広告から順に配置したいが、ユーザのフィードバックを見ながらクリック率を推定しオンライン的に配置を最適化する必要がある。下の位置にある広告は通常上位より見られないが、この割引効果を考慮したオンライン最適化を多腕バンディット問題として定式化し、有効なアルゴリズムを提案する。
著者
小宮山 純平 本多 淳也 鹿島 久嗣 中川 裕志
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21888833)
巻号頁・発行日
vol.2015-MPS-103, no.14, pp.1-8, 2015-06-16

バンディット問題 (multi-armed bandit problem) は,情報の活用と探索の間のトレードオフをモデル化した問題である.バンディット問題にはいくつかの亜種があるが,そのうち比較バンデイット問題 (dueling bandit problem) と呼ばれるものは,一対比較によるフィードバックを用いて最適化を行う.比較バンディット問題の枠組みを用いることによって,検索エンジンのランキング手法の比較や,人間の選好抽出の問題に対して,効率的な最適化を行うことができる.本研究では,比較バンディット問題における理論的な性能限界およびそれを達成するアルゴリズムを提案する.このアルゴリズムは,経験尤度を用いた通常のバンディット問題におけるアルゴリズム (本多,竹村,2010) の比較バンデイット問題への拡張である.提案手法を評価するため,検索エンジンの実データにおけるランキング手法の比較や,寿司データセット (神嶌,2003) などによる人間の選好抽出における性能を既存手法と比較する.