著者
鈴木 脩司 石田 貴士 秋山 泰
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.20, pp.1-6, 2010-12-09
被引用文献数
1

近年,DNA 配列等の配列決定技術の向上により高速に配列データを得ることが可能となった.これにより DNA 配列及びタンパク質配列のデータベースのデータ量が爆発的に増加している.このため大量の配列データに対して巨大な DB への相同性検索を行う機会が多くなってきてる.しかし,大規模なデータを用いた相同性検索では,BLAST など従来のツールでは解析が間に合わないという問題がある.本研究では Suffix Array を用いてクエリのインデックスを,FM-index を用いて DB のインデックスを構築し,これらのインデックスを用いてミスマッチをある程度許して短い領域で高いスコアとなる部分を見つけ,その部分の周辺をアラインメントするアルゴリズムを提案した.その結果,従来用いられてきた BLAST 以上の精度を保ったまま,約 10 倍の高速化を達成した.In recent years, a lot of biological sequence data can be determined easily and the size of DNA/protein sequence databases is increasing explosively because of the improvement of sequencing technologies. However, such a huge sequence data causes a problem that even general homology search analyses by using BLAST become difficult in terms of the computation cost. Therefore, we designed a new homology search algorithm that finds alignment candidates based on the suffix array of queries and the FM-index of a database. As results, the proposed method achieved about 10-fold speed up than BLAST.
著者
秋山 泰 瀬々 潤 関嶋 政和
出版者
東京工業大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-04-01

本研究では、無限次数多重検定法(LAMP)を開発し、ヒト乳がん細胞等における制御因子の同定に適用した。形状相補性に基づくドッキング手法MEGADOCKを発展させ、キナーゼ等の標的タンパク質の網羅的解析を実施し、結果をデータベース化した。また化合物プレ・スクリーニングを行うSpressoシステムを開発した。分子動力学計算により熱揺らぎに基づく結合ポケットの変形を評価することにより、バーチャルスクリーニングの性能が向上することも見出した。
著者
齊藤 有紀 石田 貴士 関嶋 政和 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.15, pp.1-6, 2013-06-20

近年,薬剤開発に必要な時間や費用が増大しており,薬剤開発の期間短縮や費用削減が求められている.そのための手法としてコンピュータ上でのシミュレーションを用いて,ターゲットとなるタンパク質を阻害する薬物の構造を設計する手法が注目を浴びている.一方で,薬物として使用する化合物は,体内で代謝・排泄されなければならないという条件がある.この条件を満たす薬物の選定のために行われるのが薬物クリアランス経路予測である.そこで我々は,コンピュータ上で行われるシミュレーションのひとつである,タンパク質と化合物のドッキング計算による結合自由エネルギー計算を,薬物クリアランス経路の予測に応用し,これまで我々が開発してきたクリアランス経路予測システムの精度改善を行った.
著者
鈴木 脩司 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.14, pp.1-7, 2013-06-20

メタゲノム解析では DNA 配列をアミノ酸配列に変換して相同性検索を行うが、次世代シークエンサの登場によって得られるようになった大量の DNA 断片配列の処理に多くの時間がかかるようになっている。このため、我々はあらかじめデータベースを部分文字列に分割して、類似度が高い部分文字列をまとめておき、まずその代表点に対して検索を行うことで効率よく検索する手法を開発した。
著者
小幡 康文 石田 貴士 夏目 徹 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.13, pp.1-8, 2013-06-20

タンパク質タンデム質量分析は生命科学や創薬などの分野で幅広く利用されている.近年は機器の高速化により,時間当たりで得られるスペクトルの量が増加し,更にタンパク質データベースサイズも増加している.そのためスペクトルの解析に高速な計算機が必要となっている.本研究では,質量分析プログラムであるCoCoozoを対象に質量分析の高速化を図り,アルゴリズムの改良と,それに加えてマルチスレッド化とGPGPU化の実装も行った.その結果,プレカーサ情報が有る場合の解析について,従来に比べて8.9倍の高速化を実現した.更に,プレカーサ情報が無い場合の解析について,12コアCPUを用いた場合で従来に比べて15.9倍,さらにGPUを用いた場合で,従来に比べて18.1倍の高速化を実現した.
著者
杉浦 典和 石田 貴士 関嶋 政和 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.25, pp.1-7, 2012-06-21

代表的な de novo アセンブラの一つである Velvet は,大規模なゲノムのアセンブリにおいて消費メモリ量の多さが課題とされている.本稿ではハッシュテーブルを分割することで,特に消費メモリ量の多い前半の velveth の消費メモリを削減する手法を提案した.またハッシュテーブルを分割する手法として,新たにリード分割法を提案した.リード分割法の提案により,従来より提案されている k-mer 値に応じた分割法に比べ,少数計算機で実行する際の実行時間の削減に成功した.Velvet is one of the most representative de novo assembler. However it has a problem that its memory consumption is too large for large scale assembling. Here, we propose a method to decrease the memory consumption of velveth which is the first half of Velvet and requires generally larger memory than the remaining half part. We propose a novel hash dividing method by dividing reads. By using this method, we have succeeded to decrease the elapsed time compared to the existing method, which divides a hash table corresponding the k-mer value.
著者
大上 雅史 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.21, pp.1-3, 2012-06-21

タンパク質間ドッキング予測ソフトウェア MEGADOCK では,従来は形状相補性と静電相互作用の 2 つの効果を評価関数としていたが,本研究では新たに Atomic Contact Energy による疎水性相互作用モデルを提案し,MEGADOCK に追加した.MEGADOCK などの FFT を用いて計算されるグリッドベースのドッキング予測では,通常 3 つの効果を計算するために 2 回以上の相関関数計算を要するが,提案手法ではレセプターのみを考慮する新しい簡易型スコア関数によって,3 つの効果を 1 回の FFT 計算で同時に計算することが可能となり,高速性を損なわずに精度を向上させることに成功した.In this study, we proposed a new hydrophobic interaction model which applied Atomic Contact Energy for our protein-protein docking software called MEGADOCK in which we previously used only two score terms, namely, shape complementarity and electrostatic interaction. Using the proposed score function, MEGADOCK can calculate three phisico-chemical effects with only one correlation function. Therefore we succeeded improvement of accuracy without loosing speed.
著者
下田 雄大 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.20, pp.1-3, 2012-06-21

タンパク質ドッキング計算では,高速フーリエ変換 (Fast Fourier Transform,FFT) を応用した高速計算法が知られているが,FFT を用いる場合,評価関数が畳込み和の形式に限定され,設計の自由度が低くなるという欠点がある.そこで,本研究ではより複雑な評価関数を用いることを想定し,FFT を用いない実空間上でのドッキング計算を考える.FFT を利用しないことで生じる計算コストの増大に対し,高スコアの複合体構造の偏在を利用してヒューリスティックに高スコアの複合体構造のみを階層的に探索することで計算結果を変えずに計算時間を短縮するための手法を提案する.In protein-protein docking, a fast calculation method using fast Fourier transform (FFT) is well known, but the form of the evaluation function is limited to the sum of convolution. In this study, we developed an efficient docking calculation method without using FFT in order to use various evaluation functions. Against the increase of computational cost, we proposed the heuristic method that hierarchically searches only high-score complex structures using the locality of high-score complex structures.
著者
藤原 隆之 松崎 由理 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.19, pp.1-3, 2012-06-21

タンパク質間ドッキング予測ソフトウェア "MEGADOCK" では,目的関数に形状相補性と静電相互作用の 2 つの項を用いているが,その最適なバランスは対象毎に一定ではなく,それを決定することは困難である.そのため,先行研究として予測精度改善のため目的関数のうち静電相互作用項の重みをタンパク質の表面電荷等の特徴から動的に調整する手法が提案されたが,いくつかの問題を含んでいた.そこで,本研究では従来手法の再検証を行い,サポートベクター回帰を用いた改良を提案する.改良された手法では従来使用されたデータセットにおいて予測性能の向上が確認され,その上で新たなデータセットへの適用も行った。The protein-protein docking software "MEGADOCK" uses the two terms in its target function; shape complementarity and electrostatic. However, the optimal balance between those two terms is defferent for each protein. Thus, dynamic adjustment of the weight of the electrostatic term based on the surface charge of a protein was proposed in a previous work. In this work, we improved the method by using support vector regression and additional characteristics of a protein. By using our new method, we achieved the better prediction performance for the data used in the previous study. We also applied the method to new data set.
著者
秋山 泰
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.46, no.3, pp.239-245, 2005-03-15
参考文献数
4

生物学と情報科学の両方の基礎を持った人間を育てるにはどうすれば良いのだろうか.それぞれを中途半端に教えるよりも, 初めにどちらかの基礎をしっかり教えるべきだとの論が多く見られる.初心者を教えた経験のある人にはそれはまさに実感だと思うが, しかしよく反省してみればそれは旧弊な教え方しかできない教育体制の問題ではないのか.それとも両学問のエッセンスを同時に修得することはそもそも困難なのだろうか.本稿では, バイオインフォマティクスの研究者または技術者に求められる要件を述べ, なぜ我が国でバイオインフォマティクス技術者が不足し, その養成が難しいと言われているのかを考察する.また, 我が国における人材養成の現状について, 最近設置されている人材養成ユニットなどを紹介する.平成16年に開始されたバイオインフォマティクス技術者の認定制度も紹介する.