著者
大岩 秀和 数原 良彦 淡島 英輝
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

近年の技術進歩に伴い,様々な製品やサービスにおいて人工知能技術の導入検討が行われている.一方で人工知能技術の導入判断時には,人工知能技術の評価や検証に特有のバイアスが存在し,適切な人工知能技術の利用を阻害する導入判断が下されるリスクが存在する.本研究では,意思決定者が人工知能技術の導入判断時にとらわれがちなバイアスと誘発される問題点について整理し,適切な導入判断を推進するための方法論を検討する.
著者
数原 良彦 片岡 良治
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

検索ランキング精度向上のため,TF-IDFなどの素性を入力とし,機械学習の枠組みでランキングの最適化を行うランキング学習において.クリックスルーログなど,全文書に対して付与されていない素性を用いると,適切にランキングを行うことができない問題が考えられる.本研究では,文書全てに付与されない素性について,素性推定器を用意することで上記問題を解決し,高精度なランキング学習の実現を目指す.
著者
数原 良彦 植松 幸生 戸田 浩之 井上 孝史 片岡 良治
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

多数のユーザによって付与されたソーシャルアノテーションを用いた情報検索ではアノテーションが付与されているコンテンツのみを検索対象とするため,ウェブ全体を検索対象にできないという問題がある.本研究では,ソーシャルブックマーク数を正解としてランキング関数を学習することにより,ブックマークされていないウェブページについてもブックマーク件数を近似した検索ランキングを提案する.
著者
大岩 秀和 数原 良彦 淡島 英輝
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第31回全国大会(2017)
巻号頁・発行日
pp.1E1OS24a4, 2017 (Released:2018-07-30)

近年の技術進歩に伴い,様々な製品やサービスにおいて人工知能技術の導入検討が行われている.一方で人工知能技術の導入判断時には,人工知能技術の評価や検証に特有のバイアスが存在し,適切な人工知能技術の利用を阻害する導入判断が下されるリスクが存在する.本研究では,意思決定者が人工知能技術の導入判断時にとらわれがちなバイアスと誘発される問題点について整理し,適切な導入判断を推進するための方法論を検討する.
著者
数原 良彦 鈴木 雅大 戸田 浩之 鷲崎 誠司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

ユーザの移動履歴を用いて移動手段を判定するタスクでは,区間に対して付与された移動手段の正解ラベルと教師あり学習を用いて移動手段を判定する分類器を生成する従来手法があった.しかし,正解ラベル作成はコストが高く,現実的には大量の正解ラベルの利用は困難である.本研究では,少量の正解ラベルと正解ラベルが付与されていない移動履歴データを用いて半教師あり学習の枠組みで分類器を学習する手法を提案する.
著者
西村 駿人 数原 良彦 鷲崎 誠司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.112, no.367, pp.23-27, 2012-12-12

本研究では,Twitterユーザのプロフィールに記述されている居住地とユーザが投稿したツイートに出現する単語情報をもとに地域特徴語の選択手法を提案する.またTwitterユーザの居住地をラベル,ユーザが投稿した単語情報を素性とすることでマルチクラス分類を用いてユーザの居住地の推定を行う.日本語Twitterデータに対して評価実験を行い,提案手法が地域特徴語選択を行わないベースライン手法に比べて高い正解率で推定することを確認した.
著者
数原 良彦 宮原 伸二 植松 幸生 金田 有二 藤野 昭典 片岡 良治
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.99-111, 2010-09-28

情報検索において,機械学習の枠組みでランキング関数の最適化を行うランキング学習が重要な課題である.従来のランキング学習手法では人手による適合性評価,もしくはクリックログから得られる訓練データを利用してきた.我々は,これらの複数情報源を適切に利用し,より高精度なランキング学習を達成することを目標とする.我々は複数情報源から得られる訓練データは,適合性分布が異なると考えた.そのため,訓練データの適合性分布が同一であることを仮定している従来の教師あり学習に基づくランキング学習手法では,複数情報源を用いたランキング学習の実現が困難だと考えられる.そこで我々は,分布が異なる訓練データを用いて転移学習の枠組みに着目し,転移学習をランキング学習に適用することによって適合性分布が異なる複数の情報源を用いたランキング学習の実現を試みる.本稿では,転移学習の枠組みに基づくランキング学習手法 TRankBoost を提案し,商用モバイルウェブ検索エンジンの実データを用いた評価実験によって有効性を検証した.評価実験により,TRankBoost によって,従来手法である RankingSVM,RankBoost と比べて NDCG@5,10 の値で上回る精度のランキングを実現することを示した.
著者
数原 良彦 戸田 浩之 櫻井 彰人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.3, pp.619-627, 2008-03-01
被引用文献数
2

本研究では,関連する二つの話題語を手掛りとして,動作主,動作対象,動作を記述する動作関係を抽出する手法を提案する.ここでいう話題語とは,最新のブログ記事中で特徴的に出現する固有名詞のことで,アルゴリズムによって自動的に抽出される.我々は,関連する話題語間の関係を提示すれば,ユーザがより的確に話題の内容を理解できると考える.提案手法では,二つの話題語のAND検索によって取得したブログ記事から,係り受け解析を用いてキーワードに付属する格助詞とそれに伴う述語を取得し,それらを用いて関係を記述する.しかし,日本語ではしばしば格要素の省略が行われるため,一文に対してのみにこの方法を適用することでは適切な動作関係を抽出できないことが予想される.提案手法では,ブログ記事から選択された大量の文を対象に係り受け解析を行い,〈格要素,格助詞,述語〉の組を抽出する.これらの抽出された組の中から,同じ述語をもつものを重ね合わせることで省略語の補完を行い,動作関係の抽出を試みる.評価実験により,一文における解析に比べ,高い精度でより多くの適切な関係を抽出することが確認できた.
著者
数原 良彦 植松 幸生 井上 孝史 片岡 良治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学
巻号頁・発行日
vol.108, no.329, pp.7-8, 2008-11-24

本研究では,ソーシャルブックマークにおけるスパマーのタグ付与行為が非スパマーとは異なると考え,ユーザのタグ付与行動に基づく特徴を抽出し,教師つき機械学習を用いてスパマーの判別器を生成することでスパマーの除去を行う手法を提案する.評価実験より,提案した特徴を用いて,スパマーの分類精度を保ったまま非スパマーの誤分類が減少されることを確認した.