著者
グエンカムリー 瀬尾 茂人 竹中 要一 松田 秀雄
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2010-BIO-20, no.7, pp.1-8, 2010-02-25

医薬品開発の大きな課題の一つとして,新たな薬の候補となる化合物を効果的に発見するため,化合物集合の中から特定のタンパク質に作用する可能性のある候補化合物を計算機によって探索する過程がある.候補化合物の探索には化合物の構造類似性が用いられていることが多いがデータベースに登録されている化合物量が日々増加しており,類似化合物検索の高速化が必要とされている.本研究では,化合物の部分構造情報を数値化した構造キーと,その類似尺度の一つとして Tanimoto 係数を用いた高速な類似化合物検索方法を提案する.提案手法では,化合物集合をクラスタリングするより類似化合物検索を高速化する.また,提案手法を従来手法と比較し,提案手法を評価する.
著者
繁田 浩功 間下 以大 金子 雄 菊田 順一 瀬尾 茂人 竹村 治雄 松田 秀雄 石井 優
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-33, no.3, pp.1-6, 2013-03-14

生体イメージング技術の向上により生体内の動態を画像として観察することが可能となり,疾病のメカニズム解明や創薬等への応用が期待されている.一方で統計的信頼性を得るために膨大な画像を解析する必要性が生じている.本研究では,生体骨組織内の血管透過性の制御機構を解明するため,二光子励起顕微鏡を用いて得られた生体画像に対して,血液が骨髄腔に染み出す血管透過性を評価する手法を提案する.提案手法では,対象となる時系列画像に対してグラフカットを用いて骨髄腔領域をセグメンテーションし,その染み出し量を定量的に評価する.評価実験の結果,専門家の手による抽出結果を用いた結果とほぼ同様の結果が得られた.このことから,本手法は染み出しの程度について統計的かつ定量的な評価の一つとして利用できると思われる.
著者
草田 義昭 瀬尾 茂人 竹中 要一 野口 眞三郎 松田 秀雄
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2016-BIO-45, no.7, pp.1-6, 2016-03-11

遺伝子発現プロファイルの臨床応用は,近年精力的に研究が行われている.しかしマイクロアレイを用いたデータ解析においては,”バッチ効果” を取り除くことが不可欠であり,さらに逐次サンプルが追加される臨床現場では,1 サンプル毎に正規化が完結することが求められている.我々は,ノンパラメトリックZ標準化 (NPZ) 法を提案し,既存の手法と比較検討を行った.まず,公共のデータベースからエストロゲン受容体 (ER) とヒト上皮増殖因子受容体 2 (HER2) の免疫組織化学 (IHC) 染色の結果を有する 2,813 症例 (24 データセット) のマイクロアレイの発現データを抽出した.続いて,CEL ファイルからバックグランド補正及び,log2 変換のみを行ったもの (Raw), 既存の 4 つの正規化法 [Microarray Suite 5.0(MAS5),frozen robust multiarray analysis (fRMA),radius minimax (RMX)]. に対して,下記の 6 つの数値変換 [無変換,シングルアレイ数値変換(RANK,,Z,NPZ,,YuGene),マルチアレイ数値変換 (ComBat)] を加えて,各々の ER と HER2 の IHC 染色の結果と mRNA の発現の一致率を比較した.シングルアレイ数値変換を行うことで IHC 染色と mRNA の発現の一致率は改善した.一方で,マルチアレイ数値変換は,主成分分析ではバッチ効果を他の手法に比して除去しているように図示されたが,実際には IHC 染色との一致率が低下していた.さらに,乳癌の予後と数値変換の検討の結果,MAS5 後に NPZ を加えることで,無変換,マルチアレイ数値変換と比べて 2 群の差が明瞭となった.今回,我々は乳癌のデータセットを用いて数値変換の与える影響について検討を行った.シングルアレイ数値変換を追加することで,臨床における発現データのバッチ効果の除去に有効である可能性が示唆された.
著者
河村 元 瀬尾 茂人 竹中 要一 松田 秀雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.15, pp.39-46, 2008-03-04
参考文献数
15

創薬プロセスでは化合物の化学的、生物学的な活性情報を用いた薬物探索が非常に重要である.化合物の活性を見つけるための構造類似性検索は、化合物の構造の有無をピットで表わしたフィンガープリントとTanimoto係数を用いた化合物類似尺度を用いて評価されることが多い.しかしながら、実際の化合物探索では少数の教師データを用いて精度を向上させながら大量のデータから活性化合物を見つけ出す手法が重要になってくる.そこで本研究では従来のtanimoto係数とRandam ForestのProximity Measureを用いた化合物類似尺度を線形判別分析によって組み合わせる評価法を提案する.特に、proximity MeasureとTanimoto係数は学習手法と非学習手法という本質的に異った評価方法に基づいているので、これらの組合せによって活性化合物予測の精度が向上することが期待される.この手法を化合物データベースのいくつかのデータセットにおいて評価する.これらの結果から、提案手法が化合物活性の探索において有効であることが示される.Chemical and biological activities of compounds provide valuable information for discover ing new drugs. Since the number of compounds that are known to have some activities of a biological class is small in the drug discovery process, the accuracy of the prediction should be increased in databases that have a large number of un-annotated compounds and a small number of annotated compounds of the biological activity. In this paper, we propose a new similarity scoring method composed of a combination of the Tanimoto coefficient and the proximity measure of random forest. The score contains two properties that are derived from unsupervised and supervised methods for predicting active compounds. Thus, the proposed method is expected to indicate compounds that have accurate activities. By evaluating the performance of the prediction compared with the two scores of the Tanimoto coefficient and the proximity measure, we demonstrate that the prediction result of the proposed scoring method is better than those of the two methods by using the Linear Discriminant Analysis (LDA) method. It is also shown that the proposed method can identify active compounds in datasets including several un-annotated compounds.
著者
大熊 祐太 瀬尾 茂人 竹中 要一 松田 秀雄
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.26, pp.1-7, 2012-06-21

遺伝子の機能は研究され, 遺伝子に付加される機能情報は日々増加し続けている.こうした遺伝子機能情報を利用した解析手法の一つに, 2つの実験条件の比較を目的とした遺伝子機能グループ解析がある.しかし, この解析手法では遺伝子機能の時間変化を解析することができない.そこで本研究では, 時系列データをスライディングウィンドウ方式で分割し, すべての分割期間に対して遺伝子機能グループ解析手法を実行することで時系列に対応できる遺伝子機能グループ解析を提案する.その結果, ある遺伝子機能が特定の期間で有意に発現していることを示した.Gene function is researched and gene functional information which is annotated on gene is increasing continuously. Gene Set Analysis is one of a method using gene functional information, and we use it when we want to compare two groups. However, this method can not be applied to time-series gene expression profile. In this reserch, I propose a method to analyze gene function groupsand handle time-series data. The method extracts a time period in which works from a time-series gene expression profile.