著者
鈴木 脩司 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.14, pp.1-7, 2013-06-20

メタゲノム解析では DNA 配列をアミノ酸配列に変換して相同性検索を行うが、次世代シークエンサの登場によって得られるようになった大量の DNA 断片配列の処理に多くの時間がかかるようになっている。このため、我々はあらかじめデータベースを部分文字列に分割して、類似度が高い部分文字列をまとめておき、まずその代表点に対して検索を行うことで効率よく検索する手法を開発した。
著者
小幡 康文 石田 貴士 夏目 徹 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.13, pp.1-8, 2013-06-20

タンパク質タンデム質量分析は生命科学や創薬などの分野で幅広く利用されている.近年は機器の高速化により,時間当たりで得られるスペクトルの量が増加し,更にタンパク質データベースサイズも増加している.そのためスペクトルの解析に高速な計算機が必要となっている.本研究では,質量分析プログラムであるCoCoozoを対象に質量分析の高速化を図り,アルゴリズムの改良と,それに加えてマルチスレッド化とGPGPU化の実装も行った.その結果,プレカーサ情報が有る場合の解析について,従来に比べて8.9倍の高速化を実現した.更に,プレカーサ情報が無い場合の解析について,12コアCPUを用いた場合で従来に比べて15.9倍,さらにGPUを用いた場合で,従来に比べて18.1倍の高速化を実現した.
著者
Kazuki Fujikawa Kazuhiro Seki Kuniaki Uehara
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.12, pp.1-4, 2013-06-20

More and more biomedical documents are digitally written and stored. To make the most of the rich resources, it is crucial to precisely locate the information pertinent to user's interests. An obstacle in finding information in natural language text is negations, which deny or reverse the meaning of a sentence. This is especially problematic in the biomedical domain since scientific findings and clinical records often contain negated expressions to state negative effects or the absence of symptoms. This paper reports on our work on a hybrid approach to negation identification combining statistical and heuristic approaches and describes an implementation of the approach, named NegFinder, as a Web service.
著者
大野 亮仁 藤 博幸 山名 早人
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.11, pp.1-7, 2013-06-20

G タンパク共役受容体 (G-protein-coupled receptor,以下 GPCR) は,内在性リガンドと結合することで細胞外からの様々なシグナルを細胞内に伝達しており,新薬開発の重要なターゲットとして注目されている.しかし,GPCR と化合物の組合せは膨大であるため,計算機による正確な結合予測手法が求められている.先行研究として,GPCR を構成するアミノ酸配列全長が持つ化学的性質と化合物の化学的性質を用いて結合を予測する手法がある.しかし,GPCR には立体構造が既知のものがあり,その細胞外側の領域にリガンド結合部位が決まっている.よって,リガンド結合部位のアミノ酸が結合に強く影響を与えると考えたため,リガンド結合部位のアミノ酸に注目すべきと考えた.本研究では,全長配列を使用する代わりに,リガンド結合部位のアミノ酸のみを利用することで予測の改善を試みた.特徴量として結合部分のアミノ酸と化合物の化学記述子を用い,SVM により GPCR と化合物の結合を予測したところ,アミノ酸配列全長を用いた時に比べ Accuracy が 3.6%,F 値は 0.038,AUC は 0.002 向上した.
著者
Yuuichi Nakano Mitsuo Iwadate Hideaki Umeyama Y-H.Taguchi
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.10, pp.1-8, 2013-06-20

Type III secretion system (T3SS) effector protein is a part of bacterial secretion systems. T3SS exists in the pathogenic and symbiotic bacteria. How the T3SS effector proteins in these two classes differ from each other should be interesting. In this paper, we proposed the usage of principal component analysis based linear discriminant analysis that discriminates T3SS effector proteins between plant pathogenic, animal pathogenic and plant symbiotic bacteria by the accuracy of 0.77. We also hypothesized that the feature vector proposed by Yahara et al represents protein structure, possibly protein folds defined in Structural Classification of Proteins (SCOP) database.
著者
大羽成征 中江健 吉本潤一郎
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.9, pp.1-5, 2013-06-20

スパイク統計に基づいて神経細胞間の機能的結合を知るための手法として、一般化線形モデル (GLM) に基づく応答関数推定法が提案されている。GLM によれば古典的な 2 ニューロン間クロスコレログラム解析で生じる擬似相関起源の偽陽性を排除できる。しかし、GLM によっても原理的に避けられない偽陽性要因が存在する。本発表ではそのうち 2 つを指摘する。第一は、スパイク検出時刻決定の誤差、第二は時間方向に非線形性の強いダイナミクスを GLM でフィッティングすることによって生じる歪みである。本発表ではまた、これらの偽陽性を避けるために、応答関数可視化法に関する小さなトリック 「GLM クロスコレログラム」 を提案する。これとクラスタリング法と組み合わせて、機能的結合パターンの典型例を見つけることで、通常手法を使った場合に導かれたであろう解釈誤りの可能性を減らせることを示す。
著者
松田 雄馬 小川 雅嗣 矢野 雅文
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.7, pp.1-6, 2013-06-20

常に状況が変化する実空間から物体を知覚する際,大脳視覚野は,限られた時間の中で得られる不完全な情報から,物体を推定する必要がある.こうした不完全情報の代表として,遮蔽された形状を認識する取り組みが行われているが,限られた時間の中でこれを行う枠組みは未だ提案されていない本稿では,著者 (Matsuda) らが既に提案している,遮蔽された不完全な輪郭情報から完全な輪郭情報を推定する手法をベースにして,限られた時間の中で有効に機能する,遮蔽された形状を認識する認識手法を提案する.
著者
木村 学人 山川 俊貴 井上 貴雄 藤井 正美 鈴木 倫保 庭山 雅嗣
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.6, pp.1-4, 2013-06-20

皮質脳波計測プローブに NIRS を組み合させた埋め込み型多機能脳活動計測フレキシブルプローブを開発した.これは脳の電気的活動と血液動態の変化を同時計測することが可能なデバイスであり,頭皮上にプローブを設置して測定する EEG や頭皮上 NIRS と比較して低ノイズで高空間分解能な計測が可能である.また fMRI,SPECT,PET と比較して高時間分解かつ簡便な計測が実現できる.本報告では,計測原理と構造を簡単に述べ,近赤外光の平均光路長ならびに浸透深さに関するモンテカルロシミュレーションの結果を示す.また試作デバイスのフレキシブル回路技術を用いた製造方法について述べる.提案デバイスにより,てんかん焦点位置のより高精度な特定や脳科学研究の発展へ寄与することが期待できる.
著者
Yudai Suzuki Kazunari Yokoyama Naomi Sakuramoto Y-H.Taguchi
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.5, pp.1-2, 2013-06-20

Soil microbiological biodiversity has recently been shown to be causally related to soil diseases. In this study, we attempted to elucidate soil microbiological interactions by numerically analyzing the carbon-resource consumption rates in soils provided by a number of domestic companies and research institutes.
著者
吉田光佑 清水優 吉本潤一郎 土岐茂 高村真広 岡本泰昌 山脇成人 銅谷賢治
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.4, pp.1-2, 2013-06-20

うつ病の診断及び治療等において従来の経験に頼った手法ではなく、機能的核磁気共鳴 (fMRI) 技術を用いる研究が盛んに行われている。本研究では、言語流暢性課題におけるうつ病患者の fMRI データを対象に、L1 正則化付きロジスティック回帰を用いることで、より精度の高い客観的診断および関わりのある脳領域の特定を行った。
著者
川島 悠一 權 娟大 宮崎 智
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.3, pp.1-5, 2013-06-20

ハイスループットスクリーニングやコンビナトリアルケミストリーの導入により急速にリード化合物が見出されている.また,薬理活性の最適化を行うドラッグデザインにより効率的な創薬が行われるようになった.しかし,薬理活性のみを指標にしたハイスループット評価などでは吸収や代謝など薬物動態学的特性や安全性に問題を抱える化合物が数多く選択されてしまう.薬物動態 (ADME) や毒性の評価が in silico で可能となれば創薬の効率化につながる.そこで本研究は,医薬品の立体構造と薬物動態に基づく ADME 予測モデルを構築した.医薬品の立体構造から得られる構造特徴パラメータ (記述子) を説明変数,重要な薬物動態パラメータである血中半減期を目的変数とし,予測モデルの構築を試みた.
著者
林 知里 權 娟大 宮崎 智
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.2, pp.1-6, 2013-06-20

ゲノム解析が進んだ結果,ゲノム DNA 中にはタンパク質の遺伝子以外の分子情報をコードしている領域や発現の制御に関わる領域が存在することが明らかになった.これらの領域の中で,主な機能として発現制御等に関わる RNA 分子の遺伝子をコードしている領域があり,この領域から転写された RNA は non-coding RNA(ncRNA) と呼ばれている.ncRNA は他の遺伝子の転写制御に関わりを持つと考えられているが,未だその機能が解明されていないものも多い.一方で,ある疾患に特異的に発現する ncRNA が発見されており,ncRNA が創薬ターゲットになる可能性を持っている.また,現在発見されている ncRNA の多くはタンパク質遺伝子間に存在するが,あるタンパク質遺伝子のイントロンに ncRNA が存在することが分かっている.本研究では,タンパク質遺伝子と ncRNA のゲノム上の位置関係に着目し,疾患関連遺伝子を制御する創薬ターゲットとしての ncRNA を予測することを目的とする.本稿では,イントロンに存在する ncRNA に着目した生物種間での比較結果を報告する.
著者
高木里穂 高田雅美 梅田智広 城和貴
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.20, pp.1-6, 2012-11-29

本稿では定在波レーダを用いて人間の呼吸を観察するシステムの開発を行う.乳幼児突然死症候群という病気がある. 1 歳までの健康にみえた乳児が予兆なしに突然呼吸停止し,死亡してしまう症状のことである.この症候群を予防するには呼吸循環系の異常を早期に発見する必要がある.そこで呼吸循環系の異常を検出するために定在波レーダを用いる.定在波レーダは物体との変位を計測することができる.この変位を計測し周波数解析を行い呼吸の周波数帯域を観察することにより,ある一定の距離にいる乳児の呼吸の動きを観察するIn this paper, we present the development of a respiration monitoring system with a standing wave radar. There is a disease called sudden infant death syndrome. A well-looking baby of up to one year stops his/her breathing without any reason, and comes to die. To prevent babies from this disease, some kind of systems that check baby's breathing circulating system to detect abnormal foretaste is required. Such error detection for baby's breathing circulating can be realized by a standing wave radar, which measures the distance of target objects presicely. Measuring series of displacements to the breast of a baby, we apply Fourier transform analysis for the frequency band of baby's breathing, and we get periodical observation of baby's breathing.
著者
西野 順二 西野 哲朗
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2011, no.31, pp.1-4, 2011-11-24

不完全情報多人数ゲームのうち大貧民を含むトリック型ゲームでは冒頭の偶然手番で選ばれたカードの分配状態が明らかでなく、ゲームの進展に応じて徐々に情報が明らかになる。このようなゲームを対象としてモンテカルロ木探索によって最良な決定をしようとするとき未知情報である相手情報すなわち状態の推定は重要と考えられる。しかし実験的には状態の推定を行わないときと比較して、その効果はあまり大きな寄与がみとめられなかった。本論文ではこの事実にもとづいて、不完全情報ゲームの状態推定が、多人数ゲームのモンテカルロ木探索において果たす効果について、状態の集合を最適な着手による同値類に分けることで、定性的な分析を行った。とりうる状態数が選択可能な合法手に対して非常に大きいため、複数の状態を仮定して探索するモンテカルロ木探索にたいして、状態の確定的な推定はあまり重要ではないことを示した。A trick based card game is an imperfect information game that has a chance move at the beginning of the game and then the whole situation is closed for each other players. This information is partially reveal as the game goes on. A situation estimation process is thought as a very important factor to make program playing the game using Monte Carlo tree search. In this paper grouping analysis on the situation set according to similarity of derived moves from the situation group, in order to discusses the effectiveness of the situation estimation process with UCT search. As a result, we show that the mass of situations causes ineffectiveness of the situation detection and its usage.
著者
Miyuki Owada Y-h.Taguchi
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.17, pp.1-2, 2012-06-21

Promoter methylation is an important factor for gene expression regulation. Especially, it can control target gene regulation semipermanently. Thus, for example, it is used for tissue specific gene expression regulation. Recently, brain tissue promoter methylation patterns turn out to be more personalized than those in other tissues. In this paper, we try finding which genes are specifically methylated among individuals.Promoter methylation is an important factor for gene expression regulation. Especially, it can control target gene regulation semipermanently. Thus, for example, it is used for tissue specific gene expression regulation. Recently, brain tissue promoter methylation patterns turn out to be more personalized than those in other tissues. In this paper, we try finding which genes are specifically methylated among individuals.
著者
大熊 祐太 瀬尾 茂人 竹中 要一 松田 秀雄
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.26, pp.1-7, 2012-06-21

遺伝子の機能は研究され, 遺伝子に付加される機能情報は日々増加し続けている.こうした遺伝子機能情報を利用した解析手法の一つに, 2つの実験条件の比較を目的とした遺伝子機能グループ解析がある.しかし, この解析手法では遺伝子機能の時間変化を解析することができない.そこで本研究では, 時系列データをスライディングウィンドウ方式で分割し, すべての分割期間に対して遺伝子機能グループ解析手法を実行することで時系列に対応できる遺伝子機能グループ解析を提案する.その結果, ある遺伝子機能が特定の期間で有意に発現していることを示した.Gene function is researched and gene functional information which is annotated on gene is increasing continuously. Gene Set Analysis is one of a method using gene functional information, and we use it when we want to compare two groups. However, this method can not be applied to time-series gene expression profile. In this reserch, I propose a method to analyze gene function groupsand handle time-series data. The method extracts a time period in which works from a time-series gene expression profile.
著者
杉浦 典和 石田 貴士 関嶋 政和 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.25, pp.1-7, 2012-06-21

代表的な de novo アセンブラの一つである Velvet は,大規模なゲノムのアセンブリにおいて消費メモリ量の多さが課題とされている.本稿ではハッシュテーブルを分割することで,特に消費メモリ量の多い前半の velveth の消費メモリを削減する手法を提案した.またハッシュテーブルを分割する手法として,新たにリード分割法を提案した.リード分割法の提案により,従来より提案されている k-mer 値に応じた分割法に比べ,少数計算機で実行する際の実行時間の削減に成功した.Velvet is one of the most representative de novo assembler. However it has a problem that its memory consumption is too large for large scale assembling. Here, we propose a method to decrease the memory consumption of velveth which is the first half of Velvet and requires generally larger memory than the remaining half part. We propose a novel hash dividing method by dividing reads. By using this method, we have succeeded to decrease the elapsed time compared to the existing method, which divides a hash table corresponding the k-mer value.
著者
大上 雅史 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.21, pp.1-3, 2012-06-21

タンパク質間ドッキング予測ソフトウェア MEGADOCK では,従来は形状相補性と静電相互作用の 2 つの効果を評価関数としていたが,本研究では新たに Atomic Contact Energy による疎水性相互作用モデルを提案し,MEGADOCK に追加した.MEGADOCK などの FFT を用いて計算されるグリッドベースのドッキング予測では,通常 3 つの効果を計算するために 2 回以上の相関関数計算を要するが,提案手法ではレセプターのみを考慮する新しい簡易型スコア関数によって,3 つの効果を 1 回の FFT 計算で同時に計算することが可能となり,高速性を損なわずに精度を向上させることに成功した.In this study, we proposed a new hydrophobic interaction model which applied Atomic Contact Energy for our protein-protein docking software called MEGADOCK in which we previously used only two score terms, namely, shape complementarity and electrostatic interaction. Using the proposed score function, MEGADOCK can calculate three phisico-chemical effects with only one correlation function. Therefore we succeeded improvement of accuracy without loosing speed.
著者
下田 雄大 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.20, pp.1-3, 2012-06-21

タンパク質ドッキング計算では,高速フーリエ変換 (Fast Fourier Transform,FFT) を応用した高速計算法が知られているが,FFT を用いる場合,評価関数が畳込み和の形式に限定され,設計の自由度が低くなるという欠点がある.そこで,本研究ではより複雑な評価関数を用いることを想定し,FFT を用いない実空間上でのドッキング計算を考える.FFT を利用しないことで生じる計算コストの増大に対し,高スコアの複合体構造の偏在を利用してヒューリスティックに高スコアの複合体構造のみを階層的に探索することで計算結果を変えずに計算時間を短縮するための手法を提案する.In protein-protein docking, a fast calculation method using fast Fourier transform (FFT) is well known, but the form of the evaluation function is limited to the sum of convolution. In this study, we developed an efficient docking calculation method without using FFT in order to use various evaluation functions. Against the increase of computational cost, we proposed the heuristic method that hierarchically searches only high-score complex structures using the locality of high-score complex structures.
著者
藤原 隆之 松崎 由理 石田 貴士 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.19, pp.1-3, 2012-06-21

タンパク質間ドッキング予測ソフトウェア "MEGADOCK" では,目的関数に形状相補性と静電相互作用の 2 つの項を用いているが,その最適なバランスは対象毎に一定ではなく,それを決定することは困難である.そのため,先行研究として予測精度改善のため目的関数のうち静電相互作用項の重みをタンパク質の表面電荷等の特徴から動的に調整する手法が提案されたが,いくつかの問題を含んでいた.そこで,本研究では従来手法の再検証を行い,サポートベクター回帰を用いた改良を提案する.改良された手法では従来使用されたデータセットにおいて予測性能の向上が確認され,その上で新たなデータセットへの適用も行った。The protein-protein docking software "MEGADOCK" uses the two terms in its target function; shape complementarity and electrostatic. However, the optimal balance between those two terms is defferent for each protein. Thus, dynamic adjustment of the weight of the electrostatic term based on the surface charge of a protein was proposed in a previous work. In this work, we improved the method by using support vector regression and additional characteristics of a protein. By using our new method, we achieved the better prediction performance for the data used in the previous study. We also applied the method to new data set.