著者
福永 津嵩 浜田 道昭
出版者
一般社団法人 日本画像学会
雑誌
日本画像学会誌 (ISSN:13444425)
巻号頁・発行日
vol.56, no.2, pp.163-167, 2017-04-10 (Released:2017-04-13)
参考文献数
18

バイオイメージング技術やロボットによる自動測定技術の進歩によって,人間の目ではとても全てを観察する事が出来ないほど大規模な生物画像データが産出されるようになってきた.これらの大規模データから生物学的な知見を得るために,機械学習技術を利用して生物画像の分類やクラスタリングを行うといった研究が近年盛んに行われるようになりつつある.本解説では,このような生物画像における機械学習技術の活用例として,「能動学習・半教師あり学習を利用した生物画像データの自動分類」「電子顕微鏡画像を用いたタンパク質立体構造の単粒子解析」「遺伝子変異体の大規模行動データ解析に基づく遺伝子型と表現型の関係性解析」という3つの研究事例について,実際の画像データや生物学的背景の議論も含めながら紹介する.
著者
福永 津嵩
出版者
特定非営利活動法人 日本バイオインフォマティクス学会
雑誌
JSBi Bioinformatics Review (ISSN:24357022)
巻号頁・発行日
vol.1, no.1, pp.3-11, 2020 (Released:2020-10-05)
参考文献数
66

大規模な生命情報データの表現方法として、サンプルを行、計測した各要素を列とする行列形式は典型的な表現方法である。またこの行列データから相関関係や依存関係にある列のペアを検出する解析は、一般的なデータ解析手法であるといえる。この相関関係や依存関係を定量化する手法として、相関係数や相互情報量といった指標がよく利用されるが、これらの指標は擬似相関や偽陽性を多く検出する危険があることが知られている。近年では、このような偽陽性を防ぐための手法として生成モデルに基づくアプローチが利用されており、特にデータのとる値が離散(カテゴリカル)である場合は逆イジング法と呼ばれる。本総説では、この逆イジング法のモデルとパラメータの学習方法、およびタンパク質構造解析を中心とした生命情報データ解析への応用例について紹介し、今後の展開について議論する。
著者
松谷 太郎 宇恵野 雄貴 福永 津嵩 浜田 道昭
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2017-BIO-50, no.33, pp.1-6, 2017-06-16

がんゲノムの変異パターンと,その背景にある変異源の分布は変異シグネチャー (Mutation Signature : MS) と呼ばれ,本研究では機械学習の手法を用いてこれを明らかにする.MS の推定は発がんメカニズムの解明の後押しになるなど重要な課題であり,先行研究では非負値行列因子分解や混合メンバーシップモデルを使った学習が行われていたが,MS の数が予測困難である等の問題点がある.本研究では MS ごとの変異の生成過程に対して潜在的ディリクレ再配置 (LDA) と呼ばれるトピックモデルを採用し,サンプルごとの体細胞突然変異からその背後にある生成モデルを推定する.学習に変分ベイズ法を用いることで,変分下限から MS 数を予測することが可能となり,シミュレーションベースではその推定に成功した.また,COSMIC データベースを用いた実データ解析にも着手している.