著者
桑田 修平 上田 修功 山田 武士
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.115, pp.81-86, 2007-06-21
被引用文献数
3

本稿では,ノンパラメトリックベイズモデルに基づくグラフクラスタリング手法を提案する.近年Newmanらは,混合多項分布モデルに基づき,リンク先が類似するノードを同一クラスに分類する,という一般的な仮定のみを用いた,クラスタ構造に関する事前情報を必要としない,汎用的かつ効率的なクラスタリング手法を提案した.しかし,予めクラス数を与える必要があるという問題があった.提案手法は,Newmanらのモデルを発展させ,ノンパラメトリックベイズの枠組でクラスの生成過程をデータの生成過程に含めることにより,クラス数を動的に推定しながらより柔軟なクラスタリングを行うことができる.人工データと実データを用いた実験により提案法の有効性を示す.
著者
岩田 具治 渡部 晋治 山田 武士 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.978-987, 2010-06-01
被引用文献数
4

購買ログデータを用いて,時間変化するユーザの興味及び商品の流行を追跡するためのトピックモデルを提案する.提案モデルは,興味や流行の変わりやすさをデータから逐次推定するため,変化に柔軟に対応可能である.また,新たなデータが得られた際,過去のデータで既に推定された興味・流行に基づいて,現在の興味・流行を推定するため,過去のデータを保持する必要がなく記憶容量を削減でき,かつ計算効率も高い.実購買ログデータを用いた実験により,購買行動の予測精度及び推定の計算効率の観点で提案モデルの有効性を示す.
著者
上田 修功 斉藤 和巳
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.45, no.3, pp.282-289, 2004-03-15
被引用文献数
10

前回,テキストモデリングではトピックの多重性を如何にモデル化するかがポイントであり,かつ,単一トピックのNBモデルを要素分布として混合した混合NBモデルでは多重性は表現できないことを説明した.これを受けて,本稿では,前回でも簡単に紹介したトピックの多重性を扱う3つのモデル(pLSA1) LDA2) PMM3))について解説する.
著者
上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会誌 (ISSN:09135693)
巻号頁・発行日
vol.85, no.8, pp.633-638, 2002-07-25
被引用文献数
28
著者
石黒 勝彦 山田 武士 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.92, no.3, pp.371-381, 2009-03-01
参考文献数
14
被引用文献数
1

従来の複数対象トラッキング手法は,すべての追跡対象について一つのダイナミックスモデルを適用することが多い.しかし,シーン内に存在するすべての対象が常に同一のダイナミックスに従うとは考えにくい.この問題に対処するためには複数のダイナミックスパターンが必要となるが,シーンの解析前に適切な数のダイナミックスパターンをすべて人手で決定することは困難であり,自動的に学習できることが望ましい.複数のダイナミックスパターンを学習する問題は,時系列データを複数のパターンにクラスタリングし,各クラスタごとに適切なパラメータを推定する問題ととらえることができる.本論文では,複数の移動対象をトラッキングするとともに,同時にそれらをクラスタリングしてダイナミックスモデルを学習する確率的な生成モデルを提案する.人工データ,及び実動画データを用いた実験を通じて,提案モデルがトラッキングとダイナミックスのクラスタリングを同時に実現可能であること,またトラッキング自体の性能も向上することを示した.
著者
木村 昌弘 斉藤 和己 上田 修功
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. ICS, [知能と複雑系] (ISSN:09196072)
巻号頁・発行日
vol.2004, no.85, pp.155-162, 2004-08-04
参考文献数
12

Web上で日々流通する大量の情報に基づいて,米国同時多発テロのようなある種の例外的な社会現象を検出する問題を考察する.本稿では特に,あるカテゴリーに属する文書群の時系列データに基づいて,その中でアウトブレークしたトピック(ホットトピック)と,その存在期間を抽出する手法を提案する.社会ニュースの実データおよび,国際ニュースの実データを用いた実験により,提案法の有効性を検証する.
著者
藤野 昭典 上田 修功 磯崎 秀樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.85, pp.95-98, 2008-09-11

各データが複数のカテゴリに属する多重分類問題に対して,ラベルありデータとラベルなしデータを用いた半教師あり学習により分類器を設計する手法を提案する.提案法では,ラベルありデータで学習させる識別モデルとラベルなしデータで学習させる生成モデルの統合により分類器を得る.提案法を多重テキスト分類問題に適用するため,識別モデルに対数線形モデルを,生成モデルにナイーブベイズモデルを用いる.実テキストデータからなる3つのテストコレクションを用いた実験で,従来の対数線形モデルとナイーブベイズモデルの半教師あり学習法と比較して,提案法ではより高い汎化能力を持つ多重分類器を得られることを確認した.We propose a method for designing semi-supervised multi-label classifiers, which select one or more category labels for each data example and are trained on labeled and unlabeled examples. The proposed method is based on a combination of discriminative models trained on labeled examples with generative models trained on unlabeled examples. We employed a log-linear model and a naive Bayes model as the discriminative and generative models, respectively, for multi-label text classification problems. Using three test collections consisting of real text data, we confirmed experimentally that the proposed method provided a better multi-label classifier with high generalization ability than conventional semi-supervised learning methods of log-linear and naive Bayes models.
著者
岩田 具治 山田 武士 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.109, no.51, pp.13-18, 2009-05-15

トピックモデルに基づく内容に関連するタグの抽出法を提案する.ソーシャルアノテーションサービスでは,ユーザが任意のタグを付与できるため,しばしば内容に関連しないタグが含まれる.内容に関連するタグの抽出により,情報検索の性能向上や,文書分類や画像認識などの機械学習タスクの精度向上が期待できる.提案法では,内容とタグが生成される過程をモデル化し,確率的EMアルゴリズムを用いてモデルを推定することにより,関連するタグを自動的に抽出する.人工データ,および,Webページと画像を対象とするソーシャルアノテーションサービスの実データを用いて提案法の有効性を示す.
著者
木村 昌弘 斉藤 和巳 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.102, no.253, pp.61-66, 2002-07-19

本論文では、成長ネットワークモデルとその学習アルゴリズムを提案する。従来のスケールフリーモデルと異なり、WWWを含む多くの実世界ネットワークの重要な特徴である、コミュニティー構造を組み込む。提案モデルが巾則後部をもつ次数分布を示すこと、および、我々の方法がコミュニティーの情報をもたないデータから新リンク生成確率を正確に推定できることを、実験により確認した。さらに、動的ハブ度という量を導入することにより、コミュニティー間のハブ度の変化を予測できた。
著者
石黒 勝彦 山田 武士 上田 修功
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.3, pp.371-381, 2009-03-01

従来の複数対象トラッキング手法は,すべての追跡対象について一つのダイナミックスモデルを適用することが多い.しかし,シーン内に存在するすべての対象が常に同一のダイナミックスに従うとは考えにくい.この問題に対処するためには複数のダイナミックスパターンが必要となるが,シーンの解析前に適切な数のダイナミックスパターンをすべて人手で決定することは困難であり,自動的に学習できることが望ましい.複数のダイナミックスパターンを学習する問題は,時系列データを複数のパターンにクラスタリングし,各クラスタごとに適切なパラメータを推定する問題ととらえることができる.本論文では,複数の移動対象をトラッキングするとともに,同時にそれらをクラスタリングしてダイナミックスモデルを学習する確率的な生成モデルを提案する.人工データ,及び実動画データを用いた実験を通じて,提案モデルがトラッキングとダイナミックスのクラスタリングを同時に実現可能であること,またトラッキング自体の性能も向上することを示した.
著者
岩田 具治 田中 利幸 山田 武士 上田 修功
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.3, pp.361-370, 2009-03-01

分布が時間的に変化するデータが与えられたとき,最新データを高い精度で予測するためのモデルの学習法を提案する.提案法では,最新データに関する期待誤差を近似するように,時刻に応じてサンプルに重みを付ける.過去のサンプルも重みを付けて学習データとして用いることにより,頑健なモデル学習が期待できる.提案法では,時間発展をモデルに組み込む必要はないため,時間を考慮しない既存のモデルを,分布が変化するデータに容易に適用することができる.人工データ,及び,購買データを用いた実験により,提案法の有効性を示す.
著者
山田 武士 斎藤 和己 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.102, no.729, pp.143-148, 2003-03-10
被引用文献数
2

ネットワークで表現されたデータを低次元ユークリッド空間へ埋め込む新たな方法を提案する.本手法では,望ましい配置と現在の配置との間のクロスエントロピーを最小にすることによって最適な配置を求める.あわせて,ノードの接続関係が埋め込みによって如何に忠実に再現されているかを定量的に評価する新たな評価尺度を提案する.実際のネットワークデータを用いた実験によって,本手法の有効性を検証した.