著者
鈴木 脩司 石田 貴士 秋山 泰
出版者
情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.20, pp.1-6, 2010-12-09

近年,DNA 配列等の配列決定技術の向上により高速に配列データを得ることが可能となった.これにより DNA 配列及びタンパク質配列のデータベースのデータ量が爆発的に増加している.このため大量の配列データに対して巨大な DB への相同性検索を行う機会が多くなってきてる.しかし,大規模なデータを用いた相同性検索では,BLAST など従来のツールでは解析が間に合わないという問題がある.本研究では Suffix Array を用いてクエリのインデックスを,FM-index を用いて DB のインデックスを構築し,これらのインデックスを用いてミスマッチをある程度許して短い領域で高いスコアとなる部分を見つけ,その部分の周辺をアラインメントするアルゴリズムを提案した.その結果,従来用いられてきた BLAST 以上の精度を保ったまま,約 10 倍の高速化を達成した.In recent years, a lot of biological sequence data can be determined easily and the size of DNA/protein sequence databases is increasing explosively because of the improvement of sequencing technologies. However, such a huge sequence data causes a problem that even general homology search analyses by using BLAST become difficult in terms of the computation cost. Therefore, we designed a new homology search algorithm that finds alignment candidates based on the suffix array of queries and the FM-index of a database. As results, the proposed method achieved about 10-fold speed up than BLAST.
著者
長崎 孝夫 中川 大志 秋山 泰有
出版者
一般社団法人日本機械学会
雑誌
熱工学講演会講演論文集
巻号頁・発行日
vol.2001, pp.397-398, 2001-11-03

Numerical simulations have been made on the flow and heat-and-mass transfer in a falling liquid film. The development of a two-dimensional wave was successfully predicted, which consists of a large solitary wave and ripple waves in front of it. Heat and mass transfer is enhanced by the wave, and the enhancement is remarkable in the case of mass transfer with high Sc number. Three-dimensional calculations indicate that a two-dimensional wave becomes unstable with the increase of Re number, resulting in U-shaped three-dimensional waves. The Sh number increases with the transition from 2D to 3D waves.
著者
柳澤 渓甫 小峰 駿汰 久保田 陸人 大上 雅史 秋山 泰
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2017-BIO-50, no.38, pp.1-8, 2017-06-16

バーチャルスクリーニングにおける大規模なタンパク質 - 化合物ドッキング計算の高速化のために,化合物の部分構造であるフラグメントのドッキング計算結果を保存し,他の化合物の評価時に計算結果を再利用する方法が提案されている.しかし,従来提案されてきた手法はディスクアクセスを大量に発生させ,高速化率が十分ではなかった.さらなる高速化のためには,メモリ上に計算結果を保持してディスクアクセスを減らすことが考えらえるが,メモリ容量には上限があるため効率的な計算結果の保持を実現することが重要になる.本研究では,最適な計算結果の保持順番の導出を重み付きオフラインキャッシュ問題として定式化し,これを最小費用流問題に帰着させ,さらにこの帰着させたグラフの特徴を利用した高速な厳密解アルゴリズムを提案した.従来提案されていた非巡回有向グラフに対する最小費用流問題の厳密解アルゴリズムに比べて約 7 倍の高速化を達成した.
著者
青山 健人 角田 将典 松崎 由理 石田 貴士 秋山 泰
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.9, no.2, pp.15-33, 2016-07-14

近年,次世代シーケンサなどに代表される実験技術の向上による爆発的な生物学データの増加に対応するため,スーパーコンピュータを用いた効率的なデータ解析,処理技術の開発は喫緊の課題となっている.ゲノム情報のうちタンパク質に翻訳されるエクソン領域の配列のみを網羅的に解析するエクソーム解析は,ゲノム配列全体を対象とする場合と比べて処理量は大幅に削減されるため効率的な解析が可能となるが,一方で将来の個別化医療に向けた解析では,数百人から千人規模のデータを現実的な時間で処理する必要があり,小型のPCクラスタでは処理が追いつかない大規模な解析が必要である.本研究では,理化学研究所のスーパーコンピュータ「京」上にエクソーム解析パイプラインを開発し,大規模エクソーム解析を目的とした生命情報解析環境を構築した.「京」上で実際に動作するエクソーム解析パイプラインの構築に加え,パイプラインの各処理でMPIによるMaster-Workerモデルでタスク分散処理を行うことで投入ジョブ数を軽減し,さらにタスクの分割などを改良することで,並列性能を改善して処理の高速化を図った.
著者
吉川 舜亮 石田 貴士 関嶋 政和 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.1, pp.1-7, 2013-06-20

近年,次世代シーケンサの開発により大量のゲノム情報を高速かつ低価格で読み取ることが可能となった一方で,一度に読み取ることができるリードの長さが第一世代のシーケンサが数百塩基であるのに比べて第二世代以降のシーケンサでは数十から百数十塩基と短くなっており,それに伴って様々なショートリード向けのアセンブラが考案されている.本研究では,まず高速,省メモリのアセンブラとして近年提案された Sparse Assembler の性能評価を行い,主に最大メモリ使用量,実行時間の面で優れる一方で,出力されるコンティグの質は他のアセンブラに劣ることを確認した.そこで本研究では多くの研究で使用実績のある Velvet にこのアルゴリズムを適用することで,Velvet のアルゴリズムを基本としながらも従来のものより短時間かつ少ないメモリ使用量のアセンブラを実装することを目指した.
著者
鈴木 脩司 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.24, pp.1-7, 2012-06-21

我々は以前に suffix array を用いた高速な相同性検索システムを提案したが,近年の次世代シークエンサーの進歩が目覚ましく,得られる配列データは増加しており,さらなる高速化が必要とされている.このため,本研究では従来システムの改良を試み,長さ L hash のすべての文字列の suffix array の検索結果を予め計算しておき,これを保存しておく.そして,検索の際は L hash 文字目までの検索には保存しておいたものを読み出すことで高速化した.また,このシステムを用いてエピゲノム解析へも対応するために,バイサルファイト処理を行った DNA 断片配列のマッピングができるように改良を行った.We developed the system for fast homology search using suffix array. However, next generation sequencers are improving gradually and become to produce larger data than previous sequencers. Thus, we have developed a new faster system. To accelerate search using suffix array, we store the results of searching patterns whose length is less than Lhash and use them as caches. In addition, we enhanced our system to map bisulfite reads for epigenomics.
著者
秋山 泰
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.46, no.3, pp.239-245, 2005-03-15
参考文献数
4

生物学と情報科学の両方の基礎を持った人間を育てるにはどうすれば良いのだろうか.それぞれを中途半端に教えるよりも, 初めにどちらかの基礎をしっかり教えるべきだとの論が多く見られる.初心者を教えた経験のある人にはそれはまさに実感だと思うが, しかしよく反省してみればそれは旧弊な教え方しかできない教育体制の問題ではないのか.それとも両学問のエッセンスを同時に修得することはそもそも困難なのだろうか.本稿では, バイオインフォマティクスの研究者または技術者に求められる要件を述べ, なぜ我が国でバイオインフォマティクス技術者が不足し, その養成が難しいと言われているのかを考察する.また, 我が国における人材養成の現状について, 最近設置されている人材養成ユニットなどを紹介する.平成16年に開始されたバイオインフォマティクス技術者の認定制度も紹介する.
著者
蓮実梢 石田貴士 秋山泰
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.34, pp.1-7, 2014-06-18

標的となるタンパク質を定めて行う薬剤開発において,薬剤標的タンパク質の選定はとても重要となる.この標的タンパク質探索には,既に病原体のゲノム情報等を利用して探索を行うための統合的なデータベースシステムが提案されてきたが,その生化学経路情報については統合の対象とされていなかった.しかし,この情報を用いることであるタンパク質が病原体の生命維持に対して致命的であるかという議論が可能となるため,生化学経路情報の統合は標的タンパク質の探索のために有用であると考えられる.そこで本研究では,顧みられない熱帯病の新薬の標的タンパク質を探索するための統合データベースシステム iNTRODB に,トリパノソーマ科寄生原虫に関する生化学経路情報を追加し,またそこにゲノム等に関連する情報を表示するインタフェースを開発することで,標的タンパク質の探索の更なる効率化を目指した.In structure based-drug design, selecting a drug target protein is very important. For the target protein selection, several database systems integrating various related information, such as genomic information of pathogens and phenotypic information, have been proposed. However, biological pathway information, which may facilitate understanding the importance of proteins, has not been integrated. In this research, we integrated the biological pathway information about Trypanosomatidae family, protozoans parasites into a database system iNTRODB, which has been developed for selecting drug target protein of neglected tropical diseases. We also developed an interface to display pathway information with genome and protein information to improve the search process of drug target proteins.
著者
大上 雅史 松崎 由理 松崎 裕介 佐藤 智之 秋山 泰
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.3, no.3, pp.91-106, 2010-10-25

タンパク質間相互作用 (Protein-Protein Interaction,PPI) に関するネットワークの解明は,細胞システムの理解や構造ベース創薬に重要な課題であり,網羅的 PPI 予測手法の確立が求められている.タンパク質立体構造データ群から網羅的に相互作用の可能性を予測するために,我々は立体形状の相補性と物理化学的性質に基づくタンパク質ドッキングの手法を研究してきた.本研究のプロジェクトの一環として新たに開発した MEGADOCK システムは,高速なドッキング計算を行うための様々な工夫を取り入れており,なかでも rPSC スコアと呼ぶスコア関数は,既存ツールの ZDOCK と比べて同等の精度を維持しながらも約 4 倍の速度向上を実現し,網羅的計算を現実のものとした.本論文では MEGADOCK システムの構成および計算モデルについて述べる.ベンチマークデータセットに適用した結果,従来手法を大きく上回る最大 F 値 0.415 を得た.さらにシステム生物学の典型的な問題の 1 つである細菌走化性シグナル伝達系のタンパク質群に MEGADOCK を応用した.その結果,既知の相互作用の再現をベンチマークデータと同等の精度 (F 値 0.436) で行うことに成功し,かつ生物学的に相互作用の可能性が高い組合せであるにもかかわらず,現在までに報告されていないものとして,CheY タンパク質と CheD タンパク質の相互作用の可能性を示唆した.
著者
蓮実梢 石田貴士 秋山泰
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.34, pp.1-7, 2014-06-18

標的となるタンパク質を定めて行う薬剤開発において,薬剤標的タンパク質の選定はとても重要となる.この標的タンパク質探索には,既に病原体のゲノム情報等を利用して探索を行うための統合的なデータベースシステムが提案されてきたが,その生化学経路情報については統合の対象とされていなかった.しかし,この情報を用いることであるタンパク質が病原体の生命維持に対して致命的であるかという議論が可能となるため,生化学経路情報の統合は標的タンパク質の探索のために有用であると考えられる.そこで本研究では,顧みられない熱帯病の新薬の標的タンパク質を探索するための統合データベースシステム iNTRODB に,トリパノソーマ科寄生原虫に関する生化学経路情報を追加し,またそこにゲノム等に関連する情報を表示するインタフェースを開発することで,標的タンパク質の探索の更なる効率化を目指した.In structure based-drug design, selecting a drug target protein is very important. For the target protein selection, several database systems integrating various related information, such as genomic information of pathogens and phenotypic information, have been proposed. However, biological pathway information, which may facilitate understanding the importance of proteins, has not been integrated. In this research, we integrated the biological pathway information about Trypanosomatidae family, protozoans parasites into a database system iNTRODB, which has been developed for selecting drug target protein of neglected tropical diseases. We also developed an interface to display pathway information with genome and protein information to improve the search process of drug target proteins.
著者
蓮実 梢 石田 貴士 秋山 泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.114, no.105, pp.185-191, 2014-06-18

標的となるタンパク質を定めて行う薬剤開発において,薬剤標的タンパク質の選定はとても重要となる.この標的タンパク質探索には,既に病原体のゲノム情報等を利用して探索を行うための統合的なデータベースシステムが提案されてきたが,その生化学経路情報については統合の対象とされていなかった.しかし,この情報を用いることであるタンパク質が病原体の生命維持に対して致命的であるかという議論が可能となるため,生化学経路情報の統合は標的タンパク質の探索のために有用であると考えられる.そこで本研究では,顧みられない熱帯病の新薬の標的タンパク質を探索するための統合データベースシステムiNTRODBに,トリパノソーマ科寄生原虫に関する生化学経路情報を追加し,またそこにゲノム等に関連する情報を表示するインタフェースを開発することで,標的タンパク質の探索の更なる効率化を目指した.
著者
梶浦 正浩 秋山 泰 安西 祐一朗
雑誌
全国大会講演論文集
巻号頁・発行日
vol.38, pp.480-481, 1989-03-15

古くから親しまれているペントミノやテトロミノなどのパズルを、相互結合型ニューラルネットワークの一種であるボルツマンマシンで解いた例を紹介する。
著者
蓮実 梢 石田 貴士 秋山 泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.114, no.105, pp.185-191, 2014-06-25

標的となるタンパク質を定めて行う薬剤開発において,薬剤標的タンパク質の選定はとても重要となる.この標的タンパク質探索には,既に病原体のゲノム情報等を利用して探索を行うための統合的なデータベースシステムが提案されてきたが,その生化学経路情報については統合の対象とされていなかった.しかし,この情報を用いることであるタンパク質が病原体の生命維持に対して致命的であるかという議論が可能となるため,生化学経路情報の統合は標的タンパク質の探索のために有用であると考えられる.そこで本研究では,顧みられない熱帯病の新薬の標的タンパク質を探索するための統合データベースシステムiNTRODBに,トリパノソーマ科寄生原虫に関する生化学経路情報を追加し,またそこにゲノム等に関連する情報を表示するインタフェースを開発することで,標的タンパク質の探索の更なる効率化を目指した.
著者
鈴木 脩司 石田 貴士 秋山 泰
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.20, pp.1-6, 2010-12-09
被引用文献数
1

近年,DNA 配列等の配列決定技術の向上により高速に配列データを得ることが可能となった.これにより DNA 配列及びタンパク質配列のデータベースのデータ量が爆発的に増加している.このため大量の配列データに対して巨大な DB への相同性検索を行う機会が多くなってきてる.しかし,大規模なデータを用いた相同性検索では,BLAST など従来のツールでは解析が間に合わないという問題がある.本研究では Suffix Array を用いてクエリのインデックスを,FM-index を用いて DB のインデックスを構築し,これらのインデックスを用いてミスマッチをある程度許して短い領域で高いスコアとなる部分を見つけ,その部分の周辺をアラインメントするアルゴリズムを提案した.その結果,従来用いられてきた BLAST 以上の精度を保ったまま,約 10 倍の高速化を達成した.In recent years, a lot of biological sequence data can be determined easily and the size of DNA/protein sequence databases is increasing explosively because of the improvement of sequencing technologies. However, such a huge sequence data causes a problem that even general homology search analyses by using BLAST become difficult in terms of the computation cost. Therefore, we designed a new homology search algorithm that finds alignment candidates based on the suffix array of queries and the FM-index of a database. As results, the proposed method achieved about 10-fold speed up than BLAST.
著者
秋山 泰 瀬々 潤 関嶋 政和
出版者
東京工業大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-04-01 (Released:2013-05-15)

(1)「化合物データベースのネットワーク解析による複数標的分子候補列挙」では、現在データが増加しているゲノムワイド関連解析に対し、解析の速度を高速にするためにGPGPUの利用して高速化する手法を開発した[ACM BCB 2015]。また、有意なネットワーク探索に関し、公開されているシロイヌナズナデータによる疑似実験を行って、開花速度と日照時間に関連したネットワークが抽出できることを確認できたため、薬剤反応の検出へと進める。(2)「形状相補性に基づくドッキング手法による分子ーキナーゼの大規模な組合せ探索」では、キナーゼタンパク質としてCDK2を選択し、プロテアーゼとしてデング熱ウイルスのプロテアーゼを選び、大規模なドッキングによる新規阻害化合物探索の研究を進めた。GLIDEソフトウェアを用いる際にタンパク質立体構造データの選び方によって評価値が大きく影響を受ける件については、分子動力学法等によって生成される構造アンサンブルから、どのような構造データを選ぶべきかを検討した。またGLIDEに代わる独自のドッキングソフトウェア、あるいはそれを助けるプレフィルタリング手法についての研究を進めた。(3) 「水分子を考慮した複数分子標的薬のリード化合物生成」では、生体分子と水分子の系に対して分子動力学シミュレーションを行い、その熱揺らぎを考慮した蛋白質の立体構造を獲得するためにクラスタリングを行い、その代表構造を獲得する手順を開発した。この手法によって得られている代表構造が実際に創薬標的として適切かについて、さらに検討を行っていくと共に広く応用を進めていく。
著者
齊藤 有紀 石田 貴士 関嶋 政和 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.15, pp.1-6, 2013-06-20

近年,薬剤開発に必要な時間や費用が増大しており,薬剤開発の期間短縮や費用削減が求められている.そのための手法としてコンピュータ上でのシミュレーションを用いて,ターゲットとなるタンパク質を阻害する薬物の構造を設計する手法が注目を浴びている.一方で,薬物として使用する化合物は,体内で代謝・排泄されなければならないという条件がある.この条件を満たす薬物の選定のために行われるのが薬物クリアランス経路予測である.そこで我々は,コンピュータ上で行われるシミュレーションのひとつである,タンパク質と化合物のドッキング計算による結合自由エネルギー計算を,薬物クリアランス経路の予測に応用し,これまで我々が開発してきたクリアランス経路予測システムの精度改善を行った.
著者
鈴木 脩司 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.14, pp.1-7, 2013-06-20

メタゲノム解析では DNA 配列をアミノ酸配列に変換して相同性検索を行うが、次世代シークエンサの登場によって得られるようになった大量の DNA 断片配列の処理に多くの時間がかかるようになっている。このため、我々はあらかじめデータベースを部分文字列に分割して、類似度が高い部分文字列をまとめておき、まずその代表点に対して検索を行うことで効率よく検索する手法を開発した。
著者
小幡 康文 石田 貴士 夏目 徹 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.13, pp.1-8, 2013-06-20

タンパク質タンデム質量分析は生命科学や創薬などの分野で幅広く利用されている.近年は機器の高速化により,時間当たりで得られるスペクトルの量が増加し,更にタンパク質データベースサイズも増加している.そのためスペクトルの解析に高速な計算機が必要となっている.本研究では,質量分析プログラムであるCoCoozoを対象に質量分析の高速化を図り,アルゴリズムの改良と,それに加えてマルチスレッド化とGPGPU化の実装も行った.その結果,プレカーサ情報が有る場合の解析について,従来に比べて8.9倍の高速化を実現した.更に,プレカーサ情報が無い場合の解析について,12コアCPUを用いた場合で従来に比べて15.9倍,さらにGPUを用いた場合で,従来に比べて18.1倍の高速化を実現した.