著者
本間 幸徳 貞光 九月 西田 京介 浅野 久子 松尾 義博
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2017-SLP-116, no.26, pp.1-6, 2017-05-08

本稿では,ある文書におけるユーザの検索要求に対し,一つ以上の文を回答として提示する部分文書検索手法を提案する.検索要求によっては提示すべき文が文書中に散在する場合があるため,提案手法では,文間の関係性に基づいて推定した文書構造を用いることで,文書に散在する文の集合を部分文書として抽出する.また抽出された部分文書について,分散表現を利用した意昧ベクトルを作成し,検索スコアの算出に用いることで検索精度の向上を図る.評価実験により,文書構造に基づいて部分文書を抽出し,対応する意昧ベクトルを検索に用いることで,ユーザの検索要求に適した検索結果が得られることを示す.
著者
川中 翔 西田 京介 倉島 健 星出 高秀 藤村 考
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. LOIS, ライフインテリジェンスとオフィス情報システム (ISSN:09135685)
巻号頁・発行日
vol.112, no.35, pp.121-126, 2012-05-10

Twitterを情報源としてユーザ属性を活用したブランド特徴分析手法を提案する.提案法ではツイートから抽出するブランドの特徴語と,自己紹介文から抽出するユーザの属性語の共起から,ブランドの特徴語毎に関係の強い属性語を獲得する.提案法は,特に新しい点として,周囲のユーザから該当する属性語推定手法を含む.Twitterの実データを用いた実験において、属性語推定手法はランキング手法に比べ良い結果を示した.提案法は,限定的な実験ながら,属性語推定を行うことで,特徴語と関係の強い属性語を数多く獲得することを可能にした.
著者
西田 京介 島田 章平 石川 悟 山内 康一郎
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J91-D, no.1, pp.51-64, 2008-01-01

オンライン学習を行うパターン分類システムにとって,学習対象の様々な変化に対応する能力は実世界問題を扱う上で必要不可欠である.特に,学習システムにとって重大な変化が突然発生した場合,すなわち,変化前の学習結果が新たな学習対象への適応を大きく阻害する場合には,変化をできる限り高速に検出して対応する必要がある.突然かつ重大な変化のみを正確かつ高速に検出可能な手法を実現するために,本研究では柔軟に様々な変化に対応できる人間に着目した.「最近の分類精度が高い状況で確信度の高い回答が短期間に連続して否定されるほど,人間は変化を高速に検出できる」という作業仮説を立てて行動実験を行い,得られた知見からLeaky Integrate-and-Fireモデルをもとにした手法を提案した.その有効性を検証するため計算機実験を行ったところ,ノイズがない場合とノイズや緩やかな変化が存在する場合の両方で,提案手法は従来手法よりも高い検出性能を実現できた.今後の課題は,問題に大きく依存するパラメータ値を学習中に自動で調整することである.
著者
長谷川 拓 西田 京介 加来 宗一郎 富田 準二
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.4Rin145, 2020 (Released:2020-06-19)

近年 BERT をはじめとする transformer 型の事前学習モデルの出現により,様々な自然言語処理タスクにおいて目覚ましい研究成果があげられている.情報検索の分野においても,事前学習モデルを利用した検索技術により従来技術を大きく上回る精度で検索が可能となってきた.また,大量の文書から関連文書を高速高精度に検索することを目的として,ニューラルネットワークでスパースな潜在表現を獲得しこれを潜在単語とみなすことにより,転置インデックスを利用した高速検索を実現する試みもなされてきた.しかし,従来手法では学習時にスパース性を明示的に評価していなかったため,出力が限られた部分空間に偏ってしまい,転置インデックスをうまく活用できず高速に検索ができない可能性があるという問題があった.本研究では,事前学習モデルを利用したニューラルネットワークを用いて文脈を考慮可能にするとともに,このモデルで得られる潜在表現が部分空間に偏りにくい学習方法を提案する.数値実験により提案手法で得られる潜在表現から作成された転置インデックスを用いて,高速な検索が可能であること示す.
著者
西田京介 戸田浩之 倉島健 内山匡
雑誌
マルチメディア、分散協調とモバイルシンポジウム2013論文集
巻号頁・発行日
vol.2013, pp.334-345, 2013-07-03

GPSやネットワーク位置情報源(携帯基地局やWi-Fiなど)により得られるユーザの時空間行動軌跡から,そのユーザが訪問した場所(Point of Interest; POI)を推定する確率的訪問POI分析技術を提案する.提案技術は(1)時空間カーネルを用いたMean-shiftクラスタリングによる滞留点抽出法(2)ユーザの真の訪問POIを潜在変数とした,滞留点の位置とその滞留時間に関する確率的生成モデル,から構成され,真の訪問POIが未知の滞留データも学習に利用することで訪問POIを高精度に推定できる.本技術が実現する訪問POIを基にした個々のユーザの行動・嗜好の理解は,情報提供や生活支援などパーソナルアシスタントサービスの品質向上に貢献できる.本論文では,GPS/Wi-FIにより得られた実データによる実験を行い,提案技術が従来手法に比べて滞留点の抽出と訪問POIの推定を精度良く行えたことを示す.
著者
鳴海 建太 西田 京介 山内 康一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.605, pp.1-6, 2007-03-08
被引用文献数
2

現在スパムメールが問題化しており,メールの内容を基にスパムメールか否かを分類するスパムメールフィルタが多数考案されている.その中でもNaive Bayesなどの統計的学習機械を利用したフィルタは多く実用化されており非常に高い精度を実現しているが,多数のメールの学習を行った後はこれまでの傾向とは違うメールの学習が進みにくくなってしまう.日々変わり続けるスパムメールに対処するにはこの問題を解決しなければならない.一方,学習に即応性があるフィルタとしてはNearest Neighborに代表されるインスタンスベースの学習機械を用いたフィルタがあるが,計算量や使用メモリ量が大きいため多くのメールを保持して分類に使用することができない.そこで本研究では,即時的な学習を行うインスタンスベースの学習機械と,過去の大量の知識を記憶する多数の統計的学習機械を組み合わせて分類を行うことで,スパムメールの変化に対応できるフィルタを提案する.また,計算機実験による他の学習機械のフィルタとの比較によって,提案フィルタが変化に対応して優れた分類精度を実現することを示す.