著者
松林 達史 幸島 匡宏 林 亜紀 澤田 宏
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.6, pp.713-720, 2015-11-01 (Released:2015-10-27)
参考文献数
22
被引用文献数
6 7

In marketing science field, modeling of purchase behavior and analysis of brand choice are important research tasks. This paper presents a method that enables such analysis by time-series pattern extraction based on Non-negative Tensor Factorization (NTF). The development of the scanning devices and electronic payments (e.g. online shopping, mobile-phone wallet and electronic money) has led to the accumulation of more detailed POS data including the information about purchase shop, amount of payment, time, location and so on and it brings possibilities for more deep understanding of purchasing behaviors. On the other hand, due to the increase of the number of attributes, it is still difficult to effectively and efficiently handle large feature quantities. In this paper, we consider feature quantities as high-order tensor. Then, using NTF for simultaneous decomposition of multiple attributes, we show analytic effectiveness of pattern factorization for real Beer Item/Brand purchase data. By applying NTF considering three axes: USER-ID × TIME-STAMP × ITEM-ID,we find several temporal tendencies depending on the season.In addition, by focusing on the purchase-pattern correlations between beer items and brands, we find that the tendencies of brand choice strategies appear on the graph drawing results.
著者
清水 仁 松林 達史 納谷 太 澤田 宏
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.34, no.5, pp.wd-B_1-8, 2019-09-01 (Released:2019-09-01)
参考文献数
33

The theme park problem is a platform where methods of guiding visitors to relieve congestion are developed and evaluated by reproducing a crowded theme park on a computer. In the theme park problem, the attraction selection model is an important element in the simulator. In previous studies, multinomial logit model was mainly used for attraction selection. However, when we observed real amusement parks, we found that we can not reproduce the characteristics of waiting time of real attraction by this model. In this research, we propose a multinomial linear model as a model of attraction selection. This model can express the rational behavior of visitors that waits for a while when waiting times of all attractions are too long for them. We showed that this model can reproduce characteristics of waiting time using multiagent simulator (MAS). We also developed a method to estimate the parameters of the proposed model from the aggregated data of the output of MAS. As a result of numerical experiments, it was confirmed that the performance of the parameter estimation was good. The proposed model and method for parameter estimation can be applied not only to the theme park problem but also to various problems related to human behavior of selection.
著者
幸島 匡宏 松林 達史 澤田 宏
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.6, pp.745-754, 2015-11-01 (Released:2015-10-27)
参考文献数
18
被引用文献数
4

In this paper, we propose a new Non-negative Matrix Factorization (NMF) method for consumer behavior pattern extraction. NMF is one of the pattern extraction method and is formulated to factorize a non-negative matrix into the product of two factor matrices. Since various types of datasets are represented by non-negative matrices, NMF could be applied in wide range of research fields including marketing science, natural language processing and brain signal processing. However, more effective extension method is required in a purchase log analysis in marketing operation since marketer needs to extract interpretable patterns from sparse matrix in which most of the elements are zero. Therefore, we propose Non-negative Micro Macro Mixed Matrix Factorization (NM4F) which uses attribution information of both users and items to improve interpretability and capability to deal with sparsity. NM4F is formulated as a method which could simultaneously factorize multiple matrices using shared factor matrices and linear constraint between factor matrices. This formulation enables to increase an amount of available information and to extract consistent patterns with several different aspect. We derive the parameter estimation algorithm by multiplicative update rules. We confirmed the effectiveness of the proposed method in terms of both quality and quantity by using real consumer panel dataset. In addition, we discuss a relation between extracted patterns by the visualization results using graph drawing.
著者
松林 達史 清武 寛 幸島 匡宏 戸田 浩之 田中 悠介 六藤 雄一 塩原 寿子 宮本 勝 清水 仁 大塚 琢馬 岩田 具治 澤田 宏 納谷 太 上田 修功
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.34, no.5, pp.wd-F_1-11, 2019-09-01 (Released:2019-09-01)
参考文献数
29

Forming security plans for crowd navigation is essential to ensure safety management at large-scale events. The Multi Agent Simulator (MAS) is widely used for preparing security plans that will guide responses to sudden and unexpected accidents at large events. For forming security plans, it is necessary that we simulate crowd behaviors which reflects the real world situations. However, the crowd behavior situations require the OD information (departure time, place of Origin, and Destination) of each agent. Moreover, from the viewpoint of protection of personal information, it is difficult to observe the whole trajectories of all pedestrians around the event area. Therefore, the OD information should be estimated from the several observed data which is counted the number of passed people at the fixed points.In this paper, we propose a new method for estimating the OD information which has following two features. Firstly, by using Bayesian optimization (BO) which is widely used to find optimal hyper parameters in the machine learning fields, the OD information are estimated efficiently. Secondly, by dividing the time window and considering the time delay due to observation points that are separated, we propose a more accurate objective function.We experiment the proposed method to the projection-mapping event (YOYOGI CANDLE 2020), and evaluate the reproduction of the people flow on MAS. We also show an example of the processing for making a guidance plan to reduce crowd congestion by using MAS.
著者
田中 佑典 倉島 健 藤原 靖宏 岩田 具治 澤田 宏
雑誌
第8回Webとデータベースに関するフォーラム論文集
巻号頁・発行日
vol.2015, pp.197-204, 2015-11-17

シングルソースデータからユーザの購買行動を引き起こした要因を推定するための購買行動モデルを提案する.シングルソースデータとは,商品の購買履歴と広告閲覧履歴とを各ユーザ ID に紐づけて収集したものである.1) 個人の嗜好,2) 他者から受ける影響,3) メディア広告から受ける影響の 3 つの要因に基づく確率過程にしたがって起こるものとしてユーザの購買行動をモデル化する.提案モデルは購買行動が起こった時刻において各要因がどの程度影響しているかを分析することにより,購買行動を引き起こした要因を推定することができる.実シングルソースデータを用いた評価実験では,提案モデルが比較手法よりも高精度にユーザの購買行動を予測可能なことを確認した.この結果は,提案モデルがユーザの購買行動をより正しく説明できることを示しており,提案モデルにより推定された購買要因が妥当であることを示唆するものである.さらに,企業による TV 広告がどの程度購買につながったかという観点で広告効果を分析した結果について報告する.
著者
竹内 孝 石黒 勝彦 木村 昭悟 澤田 宏
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.7, no.1, pp.71-83, 2014-03-28

行列分解には,観測行列に含まれる零要素の割合が大きくなるにつれて低ランク近似の汎化性能が低下する問題がある.本稿では,この問題を解決するための統計的機械学習アプローチとして複合非負値行列因子分解(Non-negative Multiple Matrix Factorization: NM2F)を提案する.NM2F は,観測行列と2つの補助行列の間に共通の潜在構造を仮定し,これらの行列を同時に分解する.本稿では,NM2F を非負値行列因子分解(Non-negative Matrix Factorization: NMF)の一般化として定式化し,補助関数法により一般化KLダイバージェンスを用いた場合のパラメータ推定法を示す.さらにNM2F は,ブロック未定義領域ありNMFとポアソン分布を用いた確率的生成モデルと等価であることを示す.人工データと実データを用いた実験から,NM2F と既存手法の汎化性能を比較し,NM2F の定量的な優位性を示す.また,実データを用いた実験では,NM2F が複数の行列から多角的な基底を抽出する定性的な利点を示す.
著者
竹内 孝 石黒 勝彦 木村 昭悟 澤田 宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 = IEICE technical report. IBISML, Information-based induction sciences and machine learning (ISSN:09135685)
巻号頁・発行日
vol.112, no.279, pp.67-74, 2012-10-31
参考文献数
25

本稿では,非負値制約下における複数行列の同時分解法(Stacked Non-negative Matrix Factorization:sNMF)を提案する.sNMFは,行列同士の関係を利用して複数の非負値行列を同時に分解する手法であり,NMFを一般化したモデルとして定式化される.sNMFは,未定義領域有りNMFの特殊な例とも解釈できる.本稿では,データマイニングの分野で関心を集めている,ソーシャルメディアからの話題トピックと話題に関するユーザクラスタの同時抽出問題にsNMFを適用した.NMFと比較して,定量的にも定性的にもsNMFの利用によって解析精度の向上が確認された.
著者
染谷信孝 澤田宏之 濱本 宏 諸星知広
出版者
日本土壌微生物学会
雑誌
土と微生物 (ISSN:09122184)
巻号頁・発行日
vol.74, no.2, pp.66-76, 2020 (Released:2020-10-31)

軟腐病は,土壌伝染性の多犯性細菌病である。植物組織を軟化腐敗させ,その際には独特の臭気を伴う。我が国では主に野菜類の主産地で問題となり,気象条件によってしばしば大きな被害を生じる。病原細菌種は主にPectobacterium carotovorumおよびその亜種とされてきたが,近年の分類体系の変遷から,現在では10 種以上が軟腐病の病原となることが分かってきた。我が国において過去に軟腐病の病原として分離・同定されてきた細菌株についても,P. carotovorum以外の種が混在している可能性がある。本病は土壌,灌漑水など様々な環境中に存在し,宿主植物の周辺で急激に増殖し,一定密度を越えると発病に至る。本病の防除は,銅剤や抗生物質などによる化学的防除が基本となるが,生物農薬の普及も進みつつある。近年の研究成果を活用した,農業現場での迅速な病原細菌の検出技術および新規防除技術開発が期待されている。
著者
竹内 孝 石黒 勝彦 木村 昭悟 澤田 宏
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.7, no.1, pp.71-83, 2014-03-28

行列分解には,観測行列に含まれる零要素の割合が大きくなるにつれて低ランク近似の汎化性能が低下する問題がある.本稿では,この問題を解決するための統計的機械学習アプローチとして複合非負値行列因子分解(Non-negative Multiple Matrix Factorization: NM2F)を提案する.NM2F は,観測行列と2つの補助行列の間に共通の潜在構造を仮定し,これらの行列を同時に分解する.本稿では,NM2F を非負値行列因子分解(Non-negative Matrix Factorization: NMF)の一般化として定式化し,補助関数法により一般化KLダイバージェンスを用いた場合のパラメータ推定法を示す.さらにNM2F は,ブロック未定義領域ありNMFとポアソン分布を用いた確率的生成モデルと等価であることを示す.人工データと実データを用いた実験から,NM2F と既存手法の汎化性能を比較し,NM2F の定量的な優位性を示す.また,実データを用いた実験では,NM2F が複数の行列から多角的な基底を抽出する定性的な利点を示す.Analyzing highly sparse data often results in poor generalizing performances of matrix factorization. To compensate data sparseness, in this paper, we introduce a novel machine learning technique called Non-negative Multiple Matrix Factorization (NM2F). NM2F factorizes multiple matrices simultaneously under a non-negative constraint. We formulate NM2F as a generalization of Non-negative Matrix Factorization (NMF) with the generalized Kullback-Leibler divergence. We derive multiplicative update rules for parameter estimation. We evaluate NM2F and other existing techniques in both the quantitative and qualitative ways. NM2F shows better performance than other techniques on both synthetic and real-world data sets.
著者
吉川 友也 岩田 具治 澤田 宏
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.30, no.2, pp.485-490, 2015-03-01 (Released:2015-03-05)
参考文献数
13

Group recommendation is a task to recommend items to groups such as households and communities. In this paper, we propose a non-linear matrix factorization method for group recommendation. The proposed method assumes that each member in groups has its own latent vector, and behavior of each group is determined by the probability distribution of the members' latent vectors. Recommending items is performed by using non-linear functions that map the distributions of the groups into scores for items. The non-linear functions are generated from Gaussian processes, which are defined by the similarities between distributions of the groups. We can efficiently calculate the similarities by embedding each distribution as an element in a reproducing kernel Hilbert space. We demonstrate the effectiveness of the method using two synthetic datasets and two real datasets in two prediction tasks.
著者
服部 正嗣 澤田 宏 殿岡 貴子 坂田 岳史 藤田 早苗 小林 哲生 亀井 剛次 納谷 太
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.3M1GS1203, 2020 (Released:2020-06-19)

児童や生徒は、期末テストや模試等で問題を解くことによってその時点での学習状況を把握している。これに加えて共通の問題を解いた集団のテスト結果を適切に分析できれば、テスト後の学習に有用な情報を得ることができると考えられる。本研究では、集団のテスト結果を対象にVariational Autoencoderを適用し、児童生徒の各問題への回答傾向および同様の解かれ方をしている問題の集合について分析する。具体的には、生徒一人ひとりが各問題に正答したか誤答したかを入力とし、同じ出力を得られるようAutoencoderを学習する。学習の際に、従来の損失関数に加えて入力がすべて0、1(誤答、正答)であるならば潜在変数もすべて0,1となるような制約など、潜在変数が正答率と相関するような複数の制約を加えた。このことによって得られたVariational Autoencoderの潜在変数を用いると児童生徒や問題についての解釈を加えることが可能であり、問題の集合や解くために同様の能力を要求されると考えられる問題の集合や各児童生徒が前述の問題の集合のいずれが得意でいずれが不得意かについての知見が得られた。
著者
澤田 宏 山下 茂 名古屋 彰
雑誌
情報処理学会研究報告システムLSI設計技術(SLDM)
巻号頁・発行日
vol.1998, no.87(1998-SLDM-089), pp.107-112, 1998-09-21

変数の重なりのない単純な関数分解f(X Y)=h(g(X) Y)は,関数分解の特別な形であり,1出力関数に対する最適な組合せ回路の形を提供する.本稿では,多入力1出力の組合せ回路Fにおいて,回路F全体の論理関数fが上記の分解を持つ場合に,この分解を適用することで回路を改善する手法を提案する.分解後の関数gとhを実現する新たな組合せ回路GとHは,元の回路Fのいくつかの入力に,ある定数値を代入することで求めることができる.実験結果より,組合せ回路最適化プログラムの前処理として,本手法が特に有効であることがわかった.
著者
幸島 匡宏 松林 達史 澤田 宏
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.520-529, 2017-04-01

近年,網羅的なデータ収集の困難さや個人情報保護の観点から,ユーザ個人を単位とする粒度の細かいデータと年代・性別などの属性情報でまとめられたユーザ集団を単位とする粒度の粗いデータといった,異なる粒度のデータを扱う機会が増えている.本研究では,個人単位・集団単位のデータの組のように,粒度の異なる複数のデータを組み合わせて分析するための新たな手法を提案する.提案手法は,非負値行列分解に基づく新たな確率モデルである.このモデルは粒度の粗い方のデータの背後に存在するデータを潜在変数として導入することで導かれる.実購買履歴を用いた実験を通して,提案手法は既存手法を上回る性能を示したこと,低解像度のデータ数が増えるに従い性能向上が達成されることを確認した.更に上記提案手法に基づく拡張手法を導出することで,提案手法が様々な異粒度データ分析問題を考える際の基盤的アプローチとなりうることを示す.
著者
田中 佑典 倉島 健 藤原 靖宏 岩田 具治 澤田 宏
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.2, pp.580-593, 2017-02-15

本稿では,シングルソースデータを入力としてユーザの購買行動を引き起こした要因を推定する手法を提案する.シングルソースデータとは,各ユーザに対して収集された購買履歴およびメディア広告の閲覧履歴である.提案モデルでは,ユーザの購買行動が(a)個人の嗜好,(b)他ユーザからの社会的影響,(c)メディア広告の影響の3つの要因を考慮した確率過程に従って生成されると仮定する.ユーザ間および企業とユーザ間の潜在的な影響関係を推定し,それらをモデルに組み込むことによってユーザの購買要因を特定する.実データを用いた評価実験では,ユーザの購買予測精度を比較することにより提案モデルの妥当性を示した.さらに,実データを用いて人気商品や影響力のあるユーザおよび企業の抽出,購買を引き起こした要因の分析,および,推定された購買要因に基づくユーザセグメントを行った結果について述べる.This paper proposes a method for inferring the factors that trigger purchases from single-source data. Single-source data are the histories of item purchases and media advertisement views for each individual. We assume a sequence of purchase events to be a stochastic process incorporating the following three factors: (a) user preference, (b) social effects received from other users, and (c) media advertising effects. As our model incorporates the latent relationships between users and advertisers, it can identify the purchase triggers. Experiments using real-world single-source data sets show that our model can achieve high prediction accuracy for purchases. We also show that our model can discover the key information, i.e., popular items, influential users, and influential advertisers, and estimate the relative impact of the three factors on purchases. Furthermore, our model can find user segments based on the estimated purchase triggers.
著者
澤田 宏之
出版者
日本土壌微生物学会
雑誌
土と微生物 (ISSN:09122184)
巻号頁・発行日
vol.57, no.1, pp.39-_63-64_, 2003-04-01 (Released:2017-05-31)
参考文献数
104
被引用文献数
1

マメ科植物の根粒菌(共生窒素固定菌)を含むことが確認されている菌種は現時点(2003年2月)で12属44種(新種に相当すると考えられる4つの分離菌も含めた)に及ぶ。これらは,16SrDNA系統樹において根粒菌として1か所にまとまることはなく,AlphaproteobacteriaからBetaproteobacteriaにかけて分布する以下の9つの単系統群(1〜9)に分散すること,根粒菌以外の菌種(以下の括弧内に示した)と混在しながらそれぞれの単系統群を構成していることが認められた。単系統群1:根粒菌としてはRhizobiumおよびAllorhizobium属細菌が含まれている(非根粒菌であるAgrobacteriumおよびBlastobacter属細菌も単系統群1の構成メンバーとして混在している),2:SinorhizobiumおよびEnsifey属細菌(分類上の所属が不明とされている非根粒菌も混在),3:Mesorhizobium属細菌(非根粒菌であるAminobacterおよびPseudaminobacter属細菌も混在),4:Bradyrhizobium属細菌およびBlastobacter denitrificans(非根粒菌であるAgromonas, Nitrobactey, AfipiaおよびRhodopseudomonas属細菌も混在),5:"Methylobacterium nodulans"(非根粒菌のMethylobacterium属細菌も混在),6:Azorhizobium属細菌(非根粒菌であるXanthobacterおよびAquabacter細菌も混在),7:"Devosia neptuniae"(所属不明とされる非根粒菌も混在),8:Burkholderia属細菌(非根粒菌のBurkholderia細菌も混在),9:Ralstonia taiwanensis(非根粒菌のRalstonia属細菌も混在)。このうち,単系統群5,8および9については,いずれも単系統性が高く,多相分類学的な特徴付けも十分になされていることから,「根粒菌と非根粒菌が混在している状態の単系統群が,全体として1つの属にまとめられている」という現行の分類体系は今後とも存続していくものと思われる。それ以外の6つの単系統群に関しては,A)人為分類に基づく現行の分類体系を今後もそのまま存続させていく;B)分子系統解析の結果を重視し,単系統群全体を1つの属としてまとめる;C)単系統群の中に認められるより小さな系統ごとに属として独立させる,という3つの選択肢のうちのBあるいはCを有力候補としながら,属レベルの分類体系(定義と範囲)に関する研究・議論がこれから活発に進められていくであろう。
著者
唐 恒進 松林 達史 澤田 宏
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

本研究では,k-meansクラスタリング法の高速化手法を提案する.クラスタリングの代表的手法であるk-means法は,N個のオブジェクトをK個のクラスタに分割するため,各周期当たりNK回の距離計算を行う必要がある.そのためオブジェクト数やクラスタ数の増加に伴い,計算量が大幅に増加する問題が生じる.提案手法では,オブジェクトとセントロイド間の距離計算を効率的に省略し,最適化計算の高速化を実現した.
著者
吉川 友也 岩田 具治 澤田 宏
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

ソーシャルネットワーク上では,情報はリンクを介してノード間を伝わる.どのように情報が広がるかは,ネットワーク構造や情報の内容によって決まると考えられる.本論文では,情報の内容の違いによって拡散の挙動が異なることを表すために,トピック依存情報拡散モデルを提案する.また,EMアルゴリズムに基づいたモデルパラメータ更新式を導出し,観測した拡散現象からモデルパラメータが推定できることを示す.
著者
竹内 孝 石黒 勝彦 木村 昭悟 澤田 宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 = IEICE technical report. IBISML, Information-based induction sciences and machine learning (ISSN:09135685)
巻号頁・発行日
vol.112, no.279, pp.67-74, 2012-10-31
参考文献数
25

本稿では,非負値制約下における複数行列の同時分解法(Stacked Non-negative Matrix Factorization:sNMF)を提案する.sNMFは,行列同士の関係を利用して複数の非負値行列を同時に分解する手法であり,NMFを一般化したモデルとして定式化される.sNMFは,未定義領域有りNMFの特殊な例とも解釈できる.本稿では,データマイニングの分野で関心を集めている,ソーシャルメディアからの話題トピックと話題に関するユーザクラスタの同時抽出問題にsNMFを適用した.NMFと比較して,定量的にも定性的にもsNMFの利用によって解析精度の向上が確認された.