著者
岩田 具治 山田 武士 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.109, no.51, pp.13-18, 2009-05-15

トピックモデルに基づく内容に関連するタグの抽出法を提案する.ソーシャルアノテーションサービスでは,ユーザが任意のタグを付与できるため,しばしば内容に関連しないタグが含まれる.内容に関連するタグの抽出により,情報検索の性能向上や,文書分類や画像認識などの機械学習タスクの精度向上が期待できる.提案法では,内容とタグが生成される過程をモデル化し,確率的EMアルゴリズムを用いてモデルを推定することにより,関連するタグを自動的に抽出する.人工データ,および,Webページと画像を対象とするソーシャルアノテーションサービスの実データを用いて提案法の有効性を示す.
著者
木村 昌弘 斉藤 和巳 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.102, no.253, pp.61-66, 2002-07-19

本論文では、成長ネットワークモデルとその学習アルゴリズムを提案する。従来のスケールフリーモデルと異なり、WWWを含む多くの実世界ネットワークの重要な特徴である、コミュニティー構造を組み込む。提案モデルが巾則後部をもつ次数分布を示すこと、および、我々の方法がコミュニティーの情報をもたないデータから新リンク生成確率を正確に推定できることを、実験により確認した。さらに、動的ハブ度という量を導入することにより、コミュニティー間のハブ度の変化を予測できた。
著者
上田 修一 吉野 貴庸 石田 栄美 倉田 敬子
出版者
慶應義塾大学
雑誌
Library and information science (ISSN:03734447)
巻号頁・発行日
vol.41, pp.1-15, 1999

WWW OPAC has become one of standard services at university libraries in Japan. A largenumber of studies have been carried out for the evaluation of OPACs. What seem to be lacking,however, are those from the actual users' point of view. ln this research, we examine major 15WWW OPAC systems from such search terms as supposed likely to be used by novice users.Three cases are analyzed, each searching a specific book or author from terms extracted fromit and their variants. The first case is to search a Japanese book translated from English from9 terms (ex. full Japanese title, one keyword from title, 'kanjj' of Japanese translator, Englishspell of author, and so on). The second case is to search a book with long title from 5 terms (fulltitle including subtitle, main title only, and the variants). The third case is to search all booksby an author, whose 'yomi' is the same with more than 9 persons. The major results are as follows: (1) Only three systems are successful in searching from all the terms in the first case. (2) Some systems are very ineffective, can be searched only from few terms. (3) The same outcomes cannot be got even from the same search terms. These problems seem to occur under such situations as: (1) A standard architecture and indexing system of OPAC database have not yet been established.(2) Standard OPAC searching procedure has not been developed. (3) Current OPAC is a mixture of traditional cataloguing rules and online retrieval system. It is necessary to develop an original architecture and standard searching procedure forOPAC based on a new user model.
著者
石黒 勝彦 山田 武士 上田 修功
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.3, pp.371-381, 2009-03-01

従来の複数対象トラッキング手法は,すべての追跡対象について一つのダイナミックスモデルを適用することが多い.しかし,シーン内に存在するすべての対象が常に同一のダイナミックスに従うとは考えにくい.この問題に対処するためには複数のダイナミックスパターンが必要となるが,シーンの解析前に適切な数のダイナミックスパターンをすべて人手で決定することは困難であり,自動的に学習できることが望ましい.複数のダイナミックスパターンを学習する問題は,時系列データを複数のパターンにクラスタリングし,各クラスタごとに適切なパラメータを推定する問題ととらえることができる.本論文では,複数の移動対象をトラッキングするとともに,同時にそれらをクラスタリングしてダイナミックスモデルを学習する確率的な生成モデルを提案する.人工データ,及び実動画データを用いた実験を通じて,提案モデルがトラッキングとダイナミックスのクラスタリングを同時に実現可能であること,またトラッキング自体の性能も向上することを示した.
著者
岩田 具治 田中 利幸 山田 武士 上田 修功
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.3, pp.361-370, 2009-03-01

分布が時間的に変化するデータが与えられたとき,最新データを高い精度で予測するためのモデルの学習法を提案する.提案法では,最新データに関する期待誤差を近似するように,時刻に応じてサンプルに重みを付ける.過去のサンプルも重みを付けて学習データとして用いることにより,頑健なモデル学習が期待できる.提案法では,時間発展をモデルに組み込む必要はないため,時間を考慮しない既存のモデルを,分布が変化するデータに容易に適用することができる.人工データ,及び,購買データを用いた実験により,提案法の有効性を示す.
著者
池内 淳 野末 道子 安形 輝 久野 高志 石田 栄美 上田 修一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.51, pp.159-166, 2003-05-22
被引用文献数
1

Webの拡大に伴い、情報検索における、Webページの有用性の識別は重要な問題となっている。本研究では、まず、150万のページ集合から抽出した1 000ページについて、被験者によって、7ポイント・スケールで有用性判定行うとともに、その有用性判定の規準について分析をおこなった。さらに、ページの被リンク数、及び、特徴語を用いたWebページの有用性判定システムを構築し、各々の結果の比較を行った。In information retrieval, the problem of identifying web page usefulness increases its importance with expansion of the Web. In this study, firstly, web page test set(1,000 pages) was extracted from 150 million Japanese pages. Three respondents judged web page usefulness by 7-point scale, and we examined their judging criteria. We developed two type of web page usefulness judging systems by using linked frequency and key-term frequency, and compared each result.
著者
上田 修一
出版者
社団法人情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.57, no.5, pp.226-232, 2007-05-01
被引用文献数
1

BMからEBP,そしてEBL/EBLIPへという流れの中で,新しく始めた共同研究「エビデンスベーストアプローチによる図書館情報学研究の確立」では,研究におけるエビデンスとは何かの解明を目標に,図書館情報学研究における研究方法の再検討のためのワークショップの開催,EBL/EBLIPの導入などの活動を行っている。EBMに始まる根拠に基づいた進め方は広い支持を得ている。けれども,実際の場になると,検討すべき課題は多く,またエビデンスに対する考え方も多様である。
著者
山田 武士 斎藤 和己 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.102, no.729, pp.143-148, 2003-03-10
被引用文献数
2

ネットワークで表現されたデータを低次元ユークリッド空間へ埋め込む新たな方法を提案する.本手法では,望ましい配置と現在の配置との間のクロスエントロピーを最小にすることによって最適な配置を求める.あわせて,ノードの接続関係が埋め込みによって如何に忠実に再現されているかを定量的に評価する新たな評価尺度を提案する.実際のネットワークデータを用いた実験によって,本手法の有効性を検証した.