著者
森岡 涼子 津田 宏治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.476, pp.161-167, 2011-03-21

産業連関表とは、産業の各部門間の取引額を表形式にまとめたもので、マクロ経済解析の基礎を成すものである。本研究では、これまで情報理論や脳科学の分野で用いられてきた情報幾何を産業連関表に適用し、産業構造の変化に関する解析を行うことを目的とする。情報幾何の有効な特徴は、直交葉層化を用いることによって、解析対象を階層的に分解できる点にある。本論文では、産業連関表を、行和・列和(周辺和)と、それ以外の部分(相互作用行列)に分解することによって、各産業部門の規模と、部門間の相互作用を分離して観察することを可能にする。本手法を1970年から2006年までのJIP産業連関表に適用した結果、オイルショック、バブル崩壊、アジア金融危機などに伴う経済構造の変化が、元の連関表よりも、相互作用行列の方に顕著に表れていることを確認した。また、情報幾何的分解から、技術革新の影響を考慮に入れた連関表の推定法が導き出せることを示し、従来のRAS法との比較を行う。
著者
藤木 淳 赤穂 昭太郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.476, pp.85-92, 2011-03-21
被引用文献数
7

本稿では,N次元空間のデータにN-1次元超平面をあてはめる問題について考察する.まず数多く提案されている回帰や主成分分析を系統的に分類し,データ点と超平面のL_pノルムの和を最小化する手法のいくつかにおいて,アフィン超平面をあてはめる場合はN個のデータ点を通る大域的最適解が,線型超平面をあてはめる場合はN-1個のデータ点を通る大域的最適解が存在することを証明する.また,データ点と超平面のL_2ノルムの関数の和を最小とするM推定などは,最適解の附近で重み附き最小2乗法で近似できることを利用して,L_2ノルムに基づく回帰超平面に対するあてはめ度を定義する.
著者
小林 靖之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.114, no.306, pp.17-24, 2014-11-10

標本マハラノビス距離(標本MD)を標本共分散行列の固有値・固有ベクトルで展開する際の主成分要素やその部分和の従う分布はF分布に従うとされるが,小さい学習サンプル数では成立しない.そこで標本MDの主成分要素やその部分和の分布について,数理統計学の手法であるデルタ法を用いてX^2分布やガンマ分布による近似モデルを提案し,数値実験で妥当性を検証しF分布よりも良好な結果を得た.
著者
大枝 真一 天野 恵理子 山西 健司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.113, no.286, pp.123-130, 2013-11-05

試験は学習者のスキルを測る手段として用いられる.したがって,試験の各設問には解くために必要なスキルが設定されており,学習者がそのスキルを習得していなければ各設問に正答する事はできない.その設問とスキルの関係は関係行列としてQ-matrixと呼ばれ,見識者によって定義されていた.先行研究では,試験結果からNon-negative matrix factorization(NMF)を用いてQ-matrixを自動的に抽出する試みがなされている.しかしながら,それらは学習者のスキルの時間変化を考慮していなかった.教育過程による学習効果をより深く理解するためには,時間とともにどのように潜在的にスキルが習得されていくか解析することが非常に重要である.本研究ではNMFをオンライン化することにより,蓄積された試験結果からQ-matrixを抽出するとともに,時間変化する学習者の潜在スキル状態も抽出することを試みる.また,論理値で構成される行列を因子分解するBoolean matrix factorization(BMF)とNMFとの抽出結果の比較を行う.計算機実験の結果,学習初期から終期の試験結果から学習者の潜在スキルの習得過程を可視化することが可能であることがわかった.
著者
蓮実 梢 石田 貴士 秋山 泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.114, no.105, pp.185-191, 2014-06-18

標的となるタンパク質を定めて行う薬剤開発において,薬剤標的タンパク質の選定はとても重要となる.この標的タンパク質探索には,既に病原体のゲノム情報等を利用して探索を行うための統合的なデータベースシステムが提案されてきたが,その生化学経路情報については統合の対象とされていなかった.しかし,この情報を用いることであるタンパク質が病原体の生命維持に対して致命的であるかという議論が可能となるため,生化学経路情報の統合は標的タンパク質の探索のために有用であると考えられる.そこで本研究では,顧みられない熱帯病の新薬の標的タンパク質を探索するための統合データベースシステムiNTRODBに,トリパノソーマ科寄生原虫に関する生化学経路情報を追加し,またそこにゲノム等に関連する情報を表示するインタフェースを開発することで,標的タンパク質の探索の更なる効率化を目指した.
著者
伊庭 幸人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.111, no.87, pp.43-50, 2011-06-13

与えられた確率分布のもとで「珍しい現象」を効率的にサンプリングする手法は,情報処理,非線形科学,ネットワーク理論,実験数学,ランダム系の統計物理など,さまざまな分野で有用である.マルコフ連鎖モンテカルロ法(MCMC),とくにその一種であるマルチカノニカル法を用いると,着目する統計量の周辺確率がたとえば10^<-20>から10^<-200>に及ぶような極めて珍しい事象を実効的に偏りなくサンプリングすることが可能である.本稿の前半では,この手法を解説し,さまざまな応用例(ランダム行列・ランダムグラフの大偏差の計算,最適ネットワークの探索,カオス力学系における珍しい軌道の探索と確率計算,ランダムスピン系への応用など)を紹介する.後半では,脳科学や非線形科学のデータ解析で重要なサロゲート法への応用を提案し,簡単な実装例を示す.
著者
木脇 太一 牧野 貴樹 合原 一幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.112, no.279, pp.103-106, 2012-10-31

Restricted Boltzmann Machine(RBM)の過学習問題を緩和するために隠れ変数のエントロピーを正規化項として用いる学習手法を提案する.従来のRBMには不要な複雑性を取り除くための機構が欠如していたため,データの複雑性に関係なく必要以上に複雑な表現を学習してしまう,いわゆる過学習が問題となっていた.本手法ではデータに合わせて最適なRBMの複雑性が動的に調節される,いわゆるモデル選択をRBM上に実現する.本稿ではこの正則化項に基づく学習アルゴリズムを統計力学の手法を用いて導出する.
著者
宮崎 大 渡辺 澄夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.114, no.306, pp.213-218, 2014-11-10

LASSO (Least Absolute Shrinkage and Selection Operator)回帰は回帰問題の罰則項としてパラメータの要素の絶対値の総和を用いる方法であり,推定されるパラメータがスパースである場合に有効であると考えられている.LASSO回帰は様々な統計的推測の問題への応用が試みられているが,罰則項の大きさの決定方法については未だに十分には確立されていない.本論文ではLASSO回帰の罰則項の決定問題をベイズ法の事前分布の最適化問題であると考え,事後分布が正規分布で近似できてもできなくても予測損失の漸近的な不偏推定を与える情報量規準WAICを用いて最適化する方法を提案し,その有効性を実験的に検討し,次の4点を明らかにする.(1)LASSO回帰の平均予測損失をWAICで推定することができる.(2)真のパラメータがスパースであるとき,LASSO回帰は有効であり,平均予測損失を最小にするハイパーパラメータをWAICの最小化により推測することができる.(3)真のパラメータがスパースでないときLASSO回帰は有効ではなく,有効でないことをWAICの値を観測することで知ることができる.(4)LASSO回帰においては周辺尤度を最大にするハイパーパラメータはWAICを最小にするハイパーパラメータと同じではなく,また周辺尤度の最大化は平均予測損失の最小化と等価ではない.
著者
呉 双 川本 淳平 菊池 浩明 佐久間 淳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.113, no.139, pp.67-74, 2013-07-11

統計的分析を行う際に個人情報を保護することは,機械学習やデータマイニングにおいて多くの注目を集めている.この研究において我々は,異なる人間がそれぞれデータを持っている時に,実際にデータを合わせることなく予測を行うためのプライバシー保護ロジスティック回帰の提案を行う.ロジスティックシグモイド関数は非線形関数であるため,暗号上で扱えないという問題がある.そのため,我々の提案ではロジスティックシグモイド関数の近似として多項式フィッティングを用いている.
著者
田部井 靖生 津田 宏治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.111, no.87, pp.103-110, 2011-06-13

近年,データの大規模化に伴いバイナリコードを用いた類似度検索はますます重要度を増している.従来の空間分割に基づく手法(e.g., cover tree)とは異なり,数値ベクトルはハッシュテーブルにより効率的に扱うことができる離散シンボルへと変換され処理される.しかし,ハッシュテーブルに基づく手法はベクトル空間の幾何的性質を扱うことが困難であり既存の手法は必ずしも効率的とは言えない.そこで,本稿ではウェーブレット木(Grossi et al., SODA'03)によるバイナリコードの効率的な検索手法を提案する.提案手法は幾何的制約により探索空間を効率よく枝刈りすることができ,ハッシュテーブルを使った手法よりも効率的である.実験により,提案手法は約8000万の大規模画像データに対しても適応可能であることを示す.
著者
小川 将史 井上 真郷
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.114, no.306, pp.321-328, 2014-11-10

本研究では,組み合わせ最適化問題である『複数巡回セールスマン問題』の厳密な最適解の探索を行う.この問題では,全ての都市を何れかのセールスマンが一度ずつ訪れて共通の出発地点に全員戻るのに要する時間を最小にしなければならない.ゼロサプレス型二分決定グラフ(ZDD)とsimpathアルゴリズムを応用することにより,条件を満たす解を全列挙し,最適解の効率的な探索が可能なアルゴリズムを提案する.
著者
竹田 晃人 小渕 智之 高橋 和孝
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.265, pp.231-238, 2010-10-28

情報理論と物理学における統計力学の関係はこれまでに数多く指摘されているが,本稿では近年Merhavにより調べられた階層構造を持つランダム符号に関する統計力学的性能解析法について議論する.統計力学的見地ではランダム符号はランダムエネルギー模型と呼ばれる可解なスピングラスの模型として捉えられることが知られている.それを踏まえ,本研究では前述の階層的ランダム符号が一般化離散ランダムエネルギー模型という可解なスピングラスの模型と完全に対応することを述べ,かつこの対応関係を利用することでデータ圧縮(情報源符号化)・通信路符号化における階層的ランダム符号の性能を直接かつ系統的に調べることが可能であることを示す.
著者
YAMADA Makoto SIGAL Leonid RAPTIS Michalis
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.112, no.279, pp.1-8, 2012-10-31

Discriminative, or (structured) prediction, methods have proved effective for variety of problems in computer vision; a notable example is 3D monocular pose estimation. All methods to date, however, relied on an assumption that training (source) and test (target) data come from the same underlying joint distribution. In many real cases, including standard datasets, this assumption is flawed. In presence of training set bias, the learning results in a biased model whose performance degrades on the (target) test set. Under the assumption of covariate shift we propose an unsupervised domain adaptation approach to address this problem. The approach takes the form of training instance re-weighting, where the weights are assigned based on the ratio of training and test marginals evaluated at the samples. Learning with the resulting weighted training samples, alleviates the bias in the learned models. We show the efficacy of our approach by proposing weighted variants of Kernel Regression (KR) and Twin Gaussian Processes (TGP). We show that our weighted variants outperform their un-weighted counterparts and improve on the state-of-the-art performance in the public (HUMANEVA) dataset.
著者
河原 吉伸 津田 宏治 鷲尾 隆 武田 朗子 湊 真一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.476, pp.63-68, 2011-03-21
参考文献数
14

特徴選択は,所与の特徴(パラメータや属性,関数などの集合)の中から問題解決に有効なその一部を取り出すタスクであり,機械学習や統計科学,データマイニングなどにおける最も重要な課題の一つである.この問題は近年,解釈性や計算効率の有用性から,疎な解を誘導しやすいノルムを用いた正則化損失関数最小化の枠組みで議論される場合が多い.損失関数の多くは集合関数として見た場合,劣モジュラ性を有するため,本稿では,特徴選択を劣モジュラ関数最適化として定式化する.これは,最も疎な解を誘導しやすいl_0ノルムを用いた正則化損失関数最小化を直接扱っている事に相当する.著者らは,2分決定図(Binary Decision Diagram; BDD)を用いた解空間の表現,及び,特徴を選択する評価関数の劣モジュラ性を用いた効率的な探索により,厳密解を含む最適性の高い解を列挙する方法を提案する.さらに,提案手法の有用性に関する検証例を示す.
著者
高橋 俊允 冨岡 亮太 山西 健司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.476, pp.169-176, 2011-03-21

拡大しつつある話題のリアルタイムな検出は,ソーシャルネットワーキングサービスの普及などによる,リアルタイムなコミュニケーションの発展により重要性を増している.従来はデータが持つ自然言語情報の解析による話題検出が中心であったが,近年はインターネットの発展などによりコンテンツが多様化し,自然言語情報のみによる話題検出はより困難になってきている.そこで本研究ではソーシャルネットワーク上の投稿に対して,それらが持つリンク情報すなわちユーザ間の言及関係を用いた話題拡大の検出手法を提案する.リンク情報について確率モデルを設定し,それに基づく変化点検出によって話題の拡大を捉える.また,Twitterの実データを用いて実験を行い,キーワードの出現頻度による検出と比較した結果,話題拡大の検出に対する提案手法の有効性を確認することができた.
著者
柏木 隆宏 黄瀬 浩一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.111, no.194, pp.133-138, 2011-08-29

莫大な数の部分空間を用いて3次元物体を高速に認識する手法を提案する.通常,データベース中の部分空間とクエリとなる特徴量の類似度は,その部分空間へ射影した際の射影長を計算することで求められる.そのため,データベース中の部分空間の数が莫大になると,全ての部分空間との類似度を計算し,物体を認識するために,莫大な処理時間が必要となる.そこで我々は,莫大な数の部分空間のデータベースに対して,近似的に探索を行い,高速に物体を認識する手法を提案する.また,近似探索を行った場合でも認識率を維持するため,近似を用いて高速に部分空間の絞り込みを行い,絞り込んだ部分空間において正確な類似度の比較を行う手法も提案する(2段階処理).更に,この手法を相互部分空間法にも適用し,3次元物体の高速で高精度な認識を実現する.実験を行った結果,近似を用いて類似度の高い部分空間を求めて物体を認識した場合,近似を用いない場合に比べて処理時間を300分の1にすることができた.また,近似を用いて相互部分空間法を行うことで,近似を用いた部分空間法と比べて,認識率が60%以上向上した.
著者
阿部 尚之 島田 敬士 長原 一 谷口 倫一郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.111, no.194, pp.195-200, 2011-08-29

Webの集合知を活用し,未知の画像に対してその撮影内容に関するラベル付けを行う画像アノテーションという研究が盛んに行われている.従来の画像アノテーションは,収集した全ての訓練データセットから画像特徴とラベル特徴の関係を学習するものが多かった.しかし,それらのデータには人力である未知画像とまったく関係のない不要なデータも数多く含まれている.そこで本稿では,未知画像に付与されている位置情報と画像構図を利用して,そのような不要なデータを排除することで,画像アノテーションの精度を向上させる手法を提案する.実験では,提案手法と従来手法の比較実験を100シーンで行い,その得られた結果について報告をする.
著者
大濱 郁 喜田 拓也 有村 博紀 阿部 敏久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.476, pp.9-16, 2011-03-21

我々は,人間行動履歴の地理的クラスタリングについて議論する.本論文では,この問題を,二次元時系列データのセグメンテーション問題として定式化し,二つのクラスタリング手法,LS-linHMMとX-linHMMを提案する.前者のLS-linHMMは,線形制約付きHMMを用いたクラスタリングと情報量規準を用いたモデル選択を組み合わせ,クラスタ数の自動推定を行う.また,X-linHMMは,x-meansのアイデアを取り入れた2状態線形HMMによる階層的クラスタリングであり,LS-linHMMよりも高速なクラスタリングを実現している.今回,これらの手法を,GPSタグ付き写真コンテンツのクラスタリングに適用することを試みる.また,実データを用いた実験により,単純なx-meansよりも提案手法が効果的に動作することを確認した.
著者
倉橋 一成 大橋 靖雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.76, pp.195-202, 2010-06-07

近年コンピューターの発展に伴い,予測を行うための様々なアルゴリズムが提案されている.予測モデル・予測アルゴリズムは変数縮小と予測の無数にある組み合わせから選びながら作成することになり,アルゴリズムの選択基準は数理的な仮定がデータに合うか,誤分類率が低いかなどである.このとき,アルゴリズムの選択全体を通してCross Validationを行なわないと真の誤分類率にバイアスが入ることを示し,どのような推定値にバイアスが無いのかを考察する.