著者
木谷強 小川 泰嗣 石川 徹也 木本 晴夫 中渡瀬 秀一 芥子 育雄 豊浦 潤 福島 俊一 松井 くにお 上田 良寛 酒井 哲也 徳永 健伸 鶴岡 弘 安形 輝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.2, pp.15-22, 1998-01-19
被引用文献数
33

日本語情報検索システム評価用テストコレクションBMIR-J2は、情報処理学会データベースシステム研究会内のワーキンググループによって作成されている。BMIR-J2は1998年3月から配布される予定であるが、これに先立ち、テスト版としてBMIR-J2が1996年3月からモニタ公開された。J1は50箇所のモニタに配布され、多数の研究成果が発表されている。BMIR-J2では、J1に対するモニタユーザからのアンケートの回答と、作成にあたったワーキングループメンバの経験をもとに、テストコレクションの検索対象テキスト数を大幅に増やし、検索要求と適合性判定基準も見直した。本論文では、BMIR-J2の内容とその作成手順、および今後の課題について述べる。BMIR-J2, a test collection for evaluation of Japanese information retrieval systems to be released in March 1998, has been developed by a working group under the Special Interest Group on Database Systems in Information Processing Society of Japan. Since March 1996, a preliminary version called BMIR-J1 has been distributed to fifty sites and used in many research projects. Based on comments from the BMIR-J1 users and our experience, we have enlarged the collection size and revised search queries and relevance assessments in BMIR-J2. In this paper, we describe BMIR-J2 and its development process, and discuss issues to be considered for improving BMIR-J2 further.
著者
田中 理恵子 芥子 育雄 池内 洋
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.37, no.7, pp.579-585, 1994-10-01 (Released:2008-05-30)
参考文献数
7

従来のキーワード検索では, キーワードを思い出せないと検索できない, 検索結果を順位付けすることができないなどの問題があった。これらの問題を解決し, キーワード1個からでも連想検索ができる検索手法として意味ベクトルによる連想検索技術を開発中である。この技術を画像検索へ応用した画像データベースを試作した。風景写真など約170枚の画像と, それぞれに付与した説明文からなる画像データベースを構築し, 意味ベクトルを用いた検索を行ったところ, 素人によって数語程度の説明文をつけただけでも, かなりの検索ができることがわかった。
著者
溝口 理一郎 芥子 育雄 磯本征雄 角所 収
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.25, no.3, pp.404-412, 1984-05-15

近年 マン・マシンインタフェースの問題が盛んに論じられている.本論文では 筆者らによって作成された音声データベース「SPEECH-DB」を例にとって実現した知的マン・マシンインタフェースについて述べている.本インタフェースは 日本語による検索要求を受けつけるJCSサブシステム エラーからの回復や利用者の疑間に答えるPSSサブシステムおよびシステム全体の制御の流れを管理するMONITORサブシステムの三つのサブシステムから成っている.知的マン・マシンインタフェースは 情報処理システムに関する専門知識を用いることにより問題解決を行って 利用者に対して知的な援助を提供するものであり ある種のエキスパートシステムとみなすことができる.そこで本インタフェースの作成においては 汎用DBMS INQとその親言語であるFORTRANによりプロタクションシステムを実現した後 それに種々の知識を埋め込むという方法を採用した.SPEECH-DBと同一のDBMS INQを用いることにより 柔軟性 拡張性に富んだシステム構成が実現されたわれわれのプロダクションシステムは 前向き推論と後向き推論の二つの推論モードとバックトラック機能をもっている.さらに 任意のFORTRANプログラムを呼ぶことができるため 既存のソフトウェアとの結合が容易であり AI的手法の現実的問題への応用に適したものとなっている.
著者
小川 泰嗣 木本 晴夫 田中 智博 石川 徹也 増永 良文 芥子 育雄 豊浦潤 福島俊一 宮内 忠信
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.1994, no.86, pp.145-152, 1994-10-13
被引用文献数
4

日本語を対象とした情報検索に関する研究開発では、性能(検索精度)の評価に開発元独自の方法が用いられてきた。このような状況に対し、われわれは「情報検索システム評価用データベース構築ワーキンググループ」を設置し、情報検索手法・システムを公正かつ客観的に評価するためのベンチマーク構築を目指している。本稿では、情報検索システムモデル・対象データの特性とサンプル件数・評価法・作成手順などベンチマーク構築に関する現在までの検討内容を報告する。In the research and development of Japanese information retrieval systems, different research groups have been using different measures to evaluate their system because there is no standard or benchmark for them. Our working group in IPSJ-SIGDBS has been developing such a benchmark, and in this report we will present several of its characteristics: IR models, the features and size of texts and queries, evaluation methods, and the development procedure of the benchmark.
著者
芥子 育雄 鈴木 優 吉野 幸一郎 Graham Neubig 大原 一人 向井 理朗 中村 哲
出版者
電子情報通信学会
巻号頁・発行日
2017-04-01

LeとMikolovは,文書の分散表現を単語と同様にニューラルネットワークで学習できるパラグラフベクトルのモデルを提案し,極性分析ベンチマークを用いて最高水準の分類精度を示した.パラグラフベクトルを用いたツイートの極性分析における実用上の課題は,単語のスパース性を解消するパラグラフベクトルの構築のために大規模文書が必要なことである.本研究では,Twitterの文に対して評判情報抽出を適用する際,その出現単語のスパース性に由来する性能低下を解決するため,人手により構築された単語意味ベクトルを導入する.意味ベクトルとして,各次元が266種類の特徴単語に対応し,約2万語に付与されている単語意味ベクトル辞書を使用する.この辞書を用いて単語拡張したツイートをパラグラフベクトルのモデルで学習するという,単語意味ベクトルとパラグラフベクトルの統合化手法を提案する.これにより,単語がスパースでも特定分野の文脈情報を学習できることが期待される.この評価のため,クラウドソーシングを利用してスマートフォン製品ブランドに関する極性分析ベンチマークを作成した.評価実験の結果,約1万2千ツイートから構成される特定のスマートフォン製品ブランドのベンチマークにおいて,提案手法は,ポジティブ,ニュートラル,ネガティブの3クラス分類におけるポジティブ予測とネガティブ予測のマクロ平均F値71.9を示した.提案手法は従来手法であるパラグラフベクトルによるマクロ平均F値を3.2ポイント上回った.
著者
河村 晃好 黒武者 健一 佐藤 亮一 芥子 育雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.101, no.192, pp.9-16, 2001-07-11

膨大な量のデジタルコンテンツが蓄積されるようになり, ユーザが興味を持っている情報を選択的に探し出すのは困難になってきている.ユーザが欲しい情報を得るためには, 検索についての専門的な知識や技術も必要になってくる.そのため, ユーザの嗜好を学習し, 嗜好に合致した情報だけを推薦するリコメンダシステムが注目されている.本論文では, 簡単なアンケートを元にユーザグループを決めた後, グループ嗜好モデルを利用して検索キーワードを拡張するコンテンツの検索方式と視聴履歴による検索とを融合した嗜好類推型検索方式を提案する.さらに, ユーザにお薦めコンテンツを推薦する検索サーバのプロトタイプについて紹介する.