著者
上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.101, no.616, pp.23-30, 2002-01-22
被引用文献数
2

本稿では, 近年, 実践的ベイズ学習法として注目されつつある変分ベイズ法について解説する.まず, 最尤推定値を求める数値解法であるEM法および一般化EM(GEM)法について説明する.次いで, VB法の基本原理がGEMで用いられている変分近似法をベイズ拡張したものと見なせることを示す.すなわち, VB法がEM法からどのように発展して誕生したのかを系統的に解説する.
著者
持橋 大地 山田 武士 上田 修功
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2009, no.36(2009-NL-190), pp.49-49, 2009-03-18

本論文では,教師データや辞書を全く必要とせず,あらゆる言語に適用できる教師なし形態素解析器および言語モデルを提案する。観測された文字列を,文字 n グラム ‐ 単語 n グラムをノンパラメトリックベイズ法の枠組で統合した確率モデルからの出力とみなし,MCMC 法と動的計画法を用いて,繰り返し 「単語」 を推定する。提案法は,あらゆる言語の生文字列から直接,高精度で未知語のない n グラム言語モデルを構築する方法ともみなすことができる。
著者
上田 修功 斉藤 和巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.3, pp.872-883, 2004-03-01
被引用文献数
8

テキストは,一般に,多重トピックからなる.それゆえ,テキストからの自動トピック抽出は,伝統的なパターン認識で行われている排他的なクラス分類とは異なり,多重を許容するという意味でより困難な分類問題といえる.従来法では,多重トピックテキストの生成モデルが全く考慮されていないため,必然的な性能限界があると考えられる.本論文では多重トピックを有するテキストの新たな確率モデル,パラメトリック混合モデル(PMM1,PMM2)を提案し,次いで,PMMに基づいて,テキストから多重トピックを同時に抽出する手法を論じる.PMMは,単一トピックに対応する基底パラメータで可能なすべての多重トピッククラスを表現でき,PMM1ではパラメータ推定アルゴリズムの大域的最適性が保証され,更に,PMMのパラメータ推定及びトピック予測アルゴリズムは高速,という優れた特長を有する."Yahoo"ドメインの実際のwebページ分類実験により,提案手法の従来手法に対する顕著な優位性を示す.
著者
松林 達史 清武 寛 幸島 匡宏 戸田 浩之 田中 悠介 六藤 雄一 塩原 寿子 宮本 勝 清水 仁 大塚 琢馬 岩田 具治 澤田 宏 納谷 太 上田 修功
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.34, no.5, pp.wd-F_1-11, 2019-09-01 (Released:2019-09-01)
参考文献数
29

Forming security plans for crowd navigation is essential to ensure safety management at large-scale events. The Multi Agent Simulator (MAS) is widely used for preparing security plans that will guide responses to sudden and unexpected accidents at large events. For forming security plans, it is necessary that we simulate crowd behaviors which reflects the real world situations. However, the crowd behavior situations require the OD information (departure time, place of Origin, and Destination) of each agent. Moreover, from the viewpoint of protection of personal information, it is difficult to observe the whole trajectories of all pedestrians around the event area. Therefore, the OD information should be estimated from the several observed data which is counted the number of passed people at the fixed points.In this paper, we propose a new method for estimating the OD information which has following two features. Firstly, by using Bayesian optimization (BO) which is widely used to find optimal hyper parameters in the machine learning fields, the OD information are estimated efficiently. Secondly, by dividing the time window and considering the time delay due to observation points that are separated, we propose a more accurate objective function.We experiment the proposed method to the projection-mapping event (YOYOGI CANDLE 2020), and evaluate the reproduction of the people flow on MAS. We also show an example of the processing for making a guidance plan to reduce crowd congestion by using MAS.
著者
木村 昭悟 Zoubin Ghahramani 竹内 孝 岩田 具治 上田 修功
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

本論文では,少量の訓練データのみからニューラルネットワークを学習する新しい手法を提案する.提案手法では,一般的な少数ショット学習の問題設定とは異なり,所与の少数訓練データ以外のデータ資源は仮定しない.提案手法では,少数の訓練データで学習した非NNモデルを参照モデルとして用いる知識蒸留を行うと共に,少数の訓練データから生成した大量の疑似訓練データを導入し,この疑似訓練データをモデル学習の過程で更新する.
著者
上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.102, no.381, pp.31-36, 2002-10-10
被引用文献数
1

学習機械の性能は,与えられた学習データに対する整合性のみならず,未学習データに対する予測能力(汎化能力)で評価される.単一の学習機械を何らかの形で融合して,汎化能力の向上を図るアンサンブル学習という枠組みがあり,実用面での有効性がこれまで数多く報告されている.本稿では,このアンサンブル学習について解説する.まず,代表的なアンサンブル学習法について説明し,次いで,何故アンサンブル学習が汎化能力向上に有効なのかについても述べる.
著者
山田 武士 斉藤 和己 上田 修功
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.44, no.9, pp.2401-2408, 2003-09-15
被引用文献数
3

ネットワークで表現されたデータを低次元ユークリッド空間へ埋め込む新たな方法を提案する.本手法では,ネットワークの隣接行列が定義するノード間の離散類似度と,現在の埋め込み配置から導かれる連続類似度との間のクロスエントロピーを最小にすることによって最適な配置を求める.さらに,与えられた埋め込みにおいてにおいて,ノードの接続関係がいかに忠実に再現されているかを定量的に評価する新たな評価尺度を提案する.最後に実際のネットワークデータを用いた実験によって,本手法の有効性を検証した.We present a novel approach to embed network data into a low dimensional Euclidean space. Theproposed method attempts to minimize cross-entropy between the discrete node similarity measure induced by theadjacency matrix and the continuous node similarity function derivedfrom current embedded node positions.We also propose a natural criterion to effectively evaluate an embeddednetwork layout in terms of how well node connectivities are preserved.Experiments using real network data show the effectiveness of theproposed method.
著者
木村 学 斉藤 和巳 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.106, no.38, pp.51-56, 2006-05-11

本稿では、新聞記事のような文書ストリームを対象に、ホットトピック抽出法に関する検討結果を報告する。具体的には、文書出現のバースト性を土台にしたKleinbergの抽出法に村し、単語出現のバースト性を土台にした改良法を提案する。新聞記事一年間分を用いた評価実験では、人手抽出したベンチマークのホットトピック群に対し、Kleinbergのオリジナル抽出法と比較して、提案法が高い抽出性能を示したことを報告する。
著者
桑田 修平 上田 修功
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.48, no.15, pp.153-162, 2007-10-15
参考文献数
20

確率モデルに基づく新たな協調フィルタリング手法を提案する.提案法は,評点済みのデータから算出されるユーザごとの評点分布,アイテムごとの評点分布,および全評点に対する評点分布が,予測対象の未評点データに対して同様に算出されるそれぞれの評点分布と類似しているとの仮定に基づき,評点済みのデータに対する各評点分布と未評点データに対する各評点分布との間の KL ダイバージェンスを最小化することにより予測値を求める.評点予測を個別に独立で行う従来法と異なり,提案法は予測対象の評点に対する予測値を互いに依存させ,予測対象の評点を一括して予測できるという特長を持つ.映画に対する評価データを用いた実験の結果,予測精度は従来の代表的手法とほぼ同程度であるが,計算時間の面で顕著な優位性を確認した.We propose a new collaborative filtering method based on a probabilistic approach. In the proposed method, we assume that the empirical marginal distributions of the ratings over users and/or items are similar to these corresponding distributions of unrated data. Based on this assumption, we try to predict unobserved ratings by minimizing the Kullback-Leibler divergence between both the rated and unrated rating distributions. In contrast to the conventional methods, which predict unobserved ratings individually and independently, our method predicts all unobserved ratings simultaneously and with mutual dependence. We evaluate the prediction performance and the computational time of our method by using real movie rating data, and confirmed that the proposed method could provide prediction errors comparable to those provided by the conventional top-level methods, but could significantly reduce the computational time.
著者
上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会誌 (ISSN:09135693)
巻号頁・発行日
vol.85, no.4, pp.265-271, 2002-04-01
被引用文献数
31
著者
上田 修功 中野 良平
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.9, pp.2512-2521, 1997-09-25
参考文献数
17
被引用文献数
30

最近, 汎化能力向上のための新たなアプローチとして, 同一タスクに対して複数の予測器を個別に学習した後, それらの出力の平均値(一般には重み付き平均)を予測値とするアンサンブル学習法が提案され実験的にその有効性が示されている. しかしながら, これまでアンサンブル予測器の汎化誤差に関する厳密な議論は十分になされていない. 本論文では, 回帰問題に焦点をあて, 一般のアンサンブル予測器の汎化誤差改善効果に関する数理的考察を行う. すなわち, 同一タスクに対して個別に学習させた任意の非線形予測器のアンサンブルによる汎化誤差を, 各予測器の推定値のバイアス, 分散, 予測器間の出力の共分散, 学習データのノイズの分散を用いて表し, 各々が汎化誤差に及ぼす影響を明らかにする. 次いで, 実用上興味深いケース(各予測器が同一モデルからなる等)について考察し, 計算機シミュレーションにより解析結果の検証を行う. 解析結果をもとに, 一つのデータセットのみが与えられているという実用上自然な状況下では, データセットを分割する方法では予測の精度向上は期待できないことを明らかにし, その場合の有効なアンサンブル学習法について言及する.
著者
上田 修功
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.91, pp.195-202, 2004-09-11
被引用文献数
3

パターン認識システムでは,汎化性能の高い識別器の設計が重要となる.において,性能を向上させるには,識別器の汎化性能を向上させるための学習法と,識別に有効な特徴の選択法,および異種情報の効果的な融合法が重要課題となる.本稿では,アンサンブル学習という視点でこれらの問題を解決するための方法論について最新の研究も交えて解説する.In patter recognition system, it is crucial to design a classifier with high generalization ability, Ensemble learning is one pronissing approach for the purpose. In this tutorial, representative ensemble learning methods are reviewed. Moreover, different information dusion methods are also explaind as a new type of ensemble learning.
著者
上田 修功 中野 良平
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.12, no.5, pp.689-697, 1997-09-01
被引用文献数
9
著者
中野 允裕 石黒 勝彦 木村 昭悟 山田 武士 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.113, no.286, pp.197-204, 2013-11-12

本稿では,関係データ解析への応用を目的として,無限サイズを持つ行列の長方形分割を行う確率過程について議論する.関係データ解析法の一つとして、与えられたデータを行列として表現し、その行列を少数の長方形クラスタに分割する手法が広く利用されている。長方形分割を表す確率的生成モデルとして従来Chinese restaurant processの積やMondrian processなどが用いられてきたが,これらは限られたクラスの長方形分割しか表現することが出来なかった.より一般に任意の長方形分割を生成しうる確率モデルとしてGilbert tessellationが知られているが,これは統計的な振る舞いの解析が困難であることが知られている.そこで本稿では,有限確率モデルの無限拡張によって長方形分割のための確率過程を構成する方法を提案する.はじめに,確率過程構成の常套手段であるKomogorovの拡張定理を用いた方法を示し,その問題点を明らかにした後,より洗練された構成法として有限のベイズ階層モデルに関する射影系をOrbanzの拡張定理によって無限拡張する方法を提案する.
著者
上田 修功
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.16, no.2, pp.299-308, 2001 (Released:2002-02-28)
参考文献数
18
被引用文献数
1 1

When learning a nonlinear model, we suffer from two difficulties in practice: (1) the local optima, and (2) appropriate model complexity determination problems. As for (1), I recently proposed the split and merge Expectation Maximization (SMEM) algorithm within the framework of the maximum likelihood by simulataneously spliting and merging model components, but the model complexity was fixed there. To overcome these problems, I first formally derive an objective function that can optimize a model over parameter and structure distributions simultaneously based on the variational Bayesian approach. Then, I device a Bayesian SMEM algorithm to e.ciently optimize the objective function. With the proposed algorithm, we can find the optimal model structure while avoiding being trapped in poor local maxima. I apply the proposed method to the learning of a mixture of experts model and show the usefulness of the method.
著者
大木 基至 竹内 孝 植松 幸生 上田 修功
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

モバイルネットワークサービス提供社の課題の一つが安定した高品質なサービス提供である.しかしながら,ネットワークトラフィックの急増や設備の経年劣化がスループットの低下などの品質劣化やネットワーク故障を引き起こすことがある.そのような問題において,サービス利用者はサービス提供社よりも早くサービスの使用不能や品質劣化を発見することがある.利用者は彼らの体感をすぐにソーシャルサービス上で発信したり,故障情報を得るためのWeb検索などを迅速に行う.これらのデータから異常を検知することで,故障検知および予測に役立つと考えられる.この論文では,複数のユーザ行動データを用いて,故障を検知および予測するための機械学習モデルアプローチを提案する.モバイルネットワークサービスの実データを用いた複数の実験により,提案するフレームワークの有用性を検証する.