著者
荻野 広樹 吉田 哲也
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.17, pp.1-6, 2011-02-28

本稿では,Non-negative Matrix Factorization (NMF) が局所表現に対応する特徴ベクトルで張られる特徴空間においてデータを近似して表現することに着目し,近似表現に用いる特徴空間が類似するという転移仮説に基づき,特徴空間を保存することにより転移学習を実現する手法を提案する.提案法では元ドメインにおいて NMF を用いて学習した特徴ベクトルからトピックグラフを構築し,NMF における目的関数に特徴空間の類似性を表現する正則化項を追加した目的関数を定義し,この目的関数の最小化を行うアルゴリズムを適用して転移学習を行う.提案する正則化項が両ドメインでのトピックグラフの類似性の表現に対応し,また,トピックグラフに対するグラフラプラシアンに対応することを示す.さらに,提案アルゴリズムの収束性を示す.提案法を文書クラスタリングにおける転移学習に適用し,提案法の効果を示すとともに他手法との比較を通じて有効性を示す.We propose a method called Topic Graph based NMF for Transfer Learning (TNT) based on Non-negative Matrix Factorization (NMF). Since NMF learns feature vectors to approximate the given data, the proposed method tries to preserve the feature space which is spanned by the feature vectors to realize transfer learning. Based on the learned feature vectors in the source domain, a graph structure called topic graph is constructed, and the graph is utilized as a regularization term in the framework of NMF. We show that the proposed regularization term represents the similarity between topic graphs in both domains, and that the term corresponds to graph Laplacian of the topic graph. Furthermore, we propose an extended learning algorithm based on the standard multiplicative update rules and prove its convergence. The proposed approach is evaluated over document clustering problem, and the results indicate that the proposed method improves performance via transfer learning.
著者
桑田 修平 前田 康成 松嶋 敏泰 平澤 茂一
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2012, no.8, pp.1-6, 2012-05-10

推薦問題を扱うためのより一般化されたマルコフ決定過程モデルに対して,ベイズ基準のもとで最適な推薦ルールを履歴データから求める方法を提案する.提案法の特徴は,ある商品を推薦した後に何が買われたのかを考慮していること,さらに,一回の推薦結果だけでなく一定期間内に行った複数の推薦結果を評価している点にある.ここで,従来の推薦手法と大きく異なる点は,推薦ルールを求めるためのプロセスを統計的決定問題として厳密に定式化したことにある.その結果,推薦する目的に対して最適な推薦が行えるようになった.人工データを用いた評価実験により,提案する推薦手法の有効性を示す.In this paper, we proposed a general markov decision process model for the recommendation system. Furthermore, based on the bayesian decision theory, we derived the optimal recommendation lists from the proposed model using historical data. Our method takes into account not only the purchased items but also the past recommended items within a given period. Here, the unique thing about this paper is that we formulate the process to get the recommendation lists as the statistical decision problem. As a result, we can obtain the most suitable recommendation lists with respect to the purpose of the recommendation. We show the experimental results by using artificial data that our method can obtain more rewards than the conventional method gets.
著者
榎原 博之 田中 裕也 石川 琢士
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2011, no.10, pp.1-6, 2011-05-10

自然界には粘菌という単細胞生物が存在する.粘菌は森の土の中などに数多く存在しており,採餌行動の際には自分自身の体で栄養を運ぶネットワークを構築する.本研究では,粘菌の採餌行動のシミュレーションプログラムを元に,巡回セールスパーソン問題 (TSP) を解く粘菌アルゴリズムを提案する.まず,粘菌の作るネットワークをシミュレーションし,そこから巡回路を作成し,TSP に対応させる.最終的には 2-opt 法による局所探索法を用いて,解の改善を行う.ベンチマーク問題 (TSPLIB) を用いて計算機実験を行い,評価を行う.The slime mold is single-celled which exists in the natural world. It exists a lot in the soil of the forest etc. and in the foraging action it constructs the network in which nourishment is carried by own body. In this research, we propose a algorithm which solves the travelling salesperson problem (TSP) based on the simulation program of the foraging action of the slime mold. First,we simulate a network made by the slime mold, and make a TSP tour. Finally, in order to improve the solution, we use 2-opt which is the local search method. We experiment on the computer by using the benchmark problems(TSPLIB), and we evaluate the slime mold algorithm.
著者
黒田 佳世 榎本 友里枝 高田 雅美 城 和貴
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.35, pp.1-6, 2010-12-09

本稿では,本の見開き画像をテキスト化する際に生じる誤認識を修正する機能をもつポータルサイトを設計する.対象とする画像は,国会図書館が所有する近代書籍のデジタル画像とする.このデジタル画像に対して,近代書籍専用の活字文字認識を適用することによりテキスト化は可能であるが,誤認識が生じる.これを修正するために,デジタル画像とテキスト文書を用いる.提案するポータルサイトでは,テキスト文書と画像データを対応させるメタデータを作成することによって,テキストに対応する画像を表示させることを可能にする.In this paper,we present a design of a portal site which has functions for correcting erratums.These erratums are caused when the facing images,which are owned by Digital Library from Meiji Era in National Diet Library,are transformed into text documents.Although those images can be transformed by using an OCR,which is specialized in early-modern printed books,the OCR infrequently cause erratums.So,to correct them, we take by means of those images and text documents. In this case,we make the metadata by which text can be corresponded to image .
著者
茨木 志織
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2010, no.39, pp.1-2, 2010-12-09

カーネル法を用いたクラスタリングの 1 つにスペクトラルクラスタリングがある.本研究では,ノイズを含んだデータに対し,そのノイズをランダム行列の手法を用いて取り除くことにより,スペクトラルクラスタリングの精度を上げる手法を提示する.カーネルにはガウスカーネルを用いて,Wishart 行列の固有値分布とガウスカーネルで写像した特徴空間における内積行列の固有値分布が等価であることを利用し,ノイズを推定する.The spectral clustering is known as one of methods for clustering by using kernel technique. In this study, we shall show a method of improving spectral clustering by removing the noise from data with the theory of random matrices. We will use the Gaussian kernel and estimate the noise since the spectral distribution of Wishart matrix is equivalent to one of the matrix constituted from inner products of Gaussian kernel.
著者
三浦 和起 日野 英逸 村田 昇
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.9, pp.1-6, 2010-12-09

時系列の予測は古くからある重要な問題であり,特に株価の予測は経済動向の予測や資産運用の指針として需要が高い.コンピュータ性能の発達と共に,学習理論を用いた経済時系列データに関する研究が活発に行われているが,株価のメカニズムを捉えることは依然として困難な問題である.本稿では,単一の予測モデルにより株価を一点で予測するのではなく,複数の予測モデルの学習を行い,各モデルに適切な重みを付けることで予測値の分散を低減する手法を提案する.基礎となる予測モデルは遺伝的プログラミングを用いて構成する.各予測モデルの重みは,学習用データと予測モデルの出力値とのクロスエントロピーが最小となるように定める.提案した予測手法の有用性を,人工データ及び日経平均株価の 1 分足の予測によって検証する.Prediction of time series data is a long standing important problem. Especially, prediction of stock price is much in demand for forecasting the economic trend and guideline for asset maintenance. Although there are growing number of studies on learning theory based time series prediction, the prediction of stock prices is still being very difficult task. In this study, the stock prices is predicted not only using one predictor, but using a set of predictors generated by the method of Genetic Programming (GP). Each element predictor is given non-negative weight, and the weight is optimized to minimize the cross entropy between the true learning stock prices and the weighted sum of predicted values. The proposed stock price prediction method is evaluated using both an artificial data and real-world stock price data.
著者
北川 哲平 福井 健一 佐藤 一永 水崎 純一郎 沼尾 正行
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.25, pp.1-9, 2010-09-21

複雑系において,事象過程の急激な遷移は潜在的に重要な相互作用の表れであるが,そのような事象の発生頻度は低い.本研究では,事象系列において比較的稀であるが,状態が遷移するときに共起する事象を抽出する Essential Event Extractor(E3) 法を提案した.E3 法では,自己組織化マップ (SOM) を符号化のためにベクトル量子化 (VQ) として,また共起グラフを生成するためにキーグラフを用いる.そして,VQ のトポロジーマップにおける発生密度推定を参照することで,共起グラフ上で事象遷移を得る.本論文では,燃料電池の損傷試験で観測されるAE事象系列に対して E3 法を適用し,燃料電池の損傷メカニズムを解明するために,有用な損傷事象系列を得た.Although sudden changes of the event phase in complex system may indicate potential essential forces, such events are rare. In the present paper, we propose an essential event extractor (E3) scheme to extract relatively rare but co-occurring event sequences in event transitions. In E3, the self-organizing map (SOM) is used as vector quantization (VQ) and KeyGraph as a co-occurrence graph. Afterwards, event transitions on the KeyGraph can be obtained by using occurrence density estimation on the topology map of VQ. We demonstrate the E3 using an acoustic emission (AE) event sequence observed during a damage test of fuel cells and obtain essential co-occurring damage sequences.
著者
水田 昌孝 熊野 雅仁 小野 景子 木村 昌弘
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.10, pp.1-6, 2010-12-09

我々は以前に,文書ストリームからバースト潜在トピック抽出する t-LDA 法を提案した.t-LDA 法は,潜在トピックを抽出するために文書生成確率モデル LDA (Latent Dirichlet Allocation) を用い,バーストトピックを同定するために時間フィルタを導入している.そして,LDA と時間フィルタに基づいて,時間情報を持つ 2 つの文書間の類似度を構築し,階層的クラスタリング法を適用することで文書ストリームからバースト潜在トピックを抽出している.本稿では,人工データを用いた実験により t-LDA 法の定量的な有効性を検証し,オンラインニュースデータを用いた実験により t-LDA 法の有効性を実証する.We previously proposed the t-LDA method that extracts bursty latent topics from a documet stream. The method utilizes Latent Dirichlet Allocation (LDA), which is a probabilistic generative model of documents, for extracting latent topics, and introduce a time-filter for identifying bursty topics. It constructs a measure of similarity between two documents with time-stamps on the basis of LDA and the time-filter, and extract bursty latent topics from a document stream by applying a hierarchical agglomerative clustering method. In this paper, we quantitatively verify its effectiveness by using synthetic data, and demonstrate its effectiveness by using real online news data.
著者
黒田 卓也 岩澤 博人 北 栄輔
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.19, pp.169-172, 2009-02-26

進化的計算手法の一つに文法進化(GE)がある.Original GEの問題点を改善するために,3つの異なるスキームを用いた改良型GEが提案されている.本研究では,解析例において日経平均株価の予測問題にOriginal GEと改良型GEを適用する.解析結果より,スキーム1+2またはスキーム1+2+3を用いることで,改良型GEはOriginal GEよりも収束速度が改善することがわかった.Grammatical Evolution (GE) is one of evolutionary algorithms. Three schemes have been presented for improving the search performance of original GE. In this paper, the original GE and the dvanced GE are compared on the prediction problem of NIKKEI stock average. The results show that the advanced GE with scheme 1+2 or 1+2+3 overtakes the original GE.