著者
川島 崇 川本 峻頌 積田 大介 下山 翔 宗政 一舟 友松 祐太 林 邦興 高木 友博
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.1E201, 2018 (Released:2018-07-30)

近年,インターネット上でユーザに対して店舗の紹介を行うサービスが増えてきている.各サービスでは同時に,ユーザの嗜好に合った店舗を表示させる分析が幅広く行われてきている.推薦の分野ではユーザのクリック情報が十分に存在する時には協調フィルタリングが高い性能を誇る.一般的にユーザ×アイテムの行列を作成した際データスパースの問題が発生するので新規ユーザに対応することが難しい.また十分にデー タが得られなかった場合,バンディットアルゴリズムなどを応用しているケースが見られる.バンディットアルゴリズムは各アームを十分に試行してそれぞれから報酬を得ることで学習を進めていくためアイテム数が多くなった場合に全てを学習するのは実質的に不可能である.新たなユーザが出てきた時に十分にデータを集める必要性は協調フィルタリングと同様の問題がある.上記の問題を解決すべく本稿では強化学習の価値関数の更新に多層ニューラルネットを用いた深層強化学習による推薦システムの提案を行う.
著者
松野 元樹 田中 翔 原 拓希 川本 峻頌 下山 翔 川島 崇 積田 大介 城戸 康 橋本 司 高木 友博
出版者
人工知能学会
雑誌
2019年度 人工知能学会全国大会(第33回)
巻号頁・発行日
2019-04-08

本研究ではマルチエージェントシステムを念頭に、タスク実行に必要なリソースとメンバー能力のマッチング問題を考える。我々はタスク・リソースマッチング問題に対し深層強化学習を用いて現代的な解法を構築し、基準となるいくつかの既存手法と多角的な観点から比較しながら提案手法の評価を行った。数値実験の結果により、深層強化学習は組み合わせ最適化問題において実行時間と組み合わせ精度の両立を狙う際に有用であるということが明らかにされた。