著者
瀬々 潤
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2014-BIO-40, no.4, pp.1-5, 2014-12-11

遺伝子網羅的に発現量を観測するマイクロアレイが超並列シーケンサを利用する RNA-seq になり,遺伝子発現の解析に新たな統計手法が必要となっている.要因の一例として,マイクロアレイでは相対的な発現量として採取されいた遺伝子発現量に関し,計数による計量が行える定量性の高さが挙げられる.また,反復実験が一般的となり,発現量の変化を統計的指標に基づいて検出する傾向が高まっている.このような実験の変化に対して,新たに考慮すべき統計解析が存在し,RNA-seq の発現量解析には,Cuffdiff,edgeR, DESeq など独特のソフトウエアが利用されている.本発表では,これらで利用されている統計解析についてレビューを行う.
著者
湯浅 友子 權 娟大 宮崎 智
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012-BIO-32, no.22, pp.1-6, 2012-11-29

近年,酸化ストレスが生体に様々な影響を及ぼすことで,疾患の原因となっていることが分かってきた.しかし,酸化ストレス起因疾患に関連する遺伝子などの情報を提供するようなデータベースは存在しない.そのようなデータベースが構築され,その疾患だけに特有的な遺伝子が見つかれば,その遺伝子を標的とした副作用の少ない新薬開発につながる可能性がある.そこで本研究では,酸化ストレス起因疾患の新薬開発支援の観点から,疾患特有的遺伝子を順位付けして提供するデータベース検索システムを構築した.本システムで提供される酸化ストレス起因疾患関連遺伝子群は,与えられた疾患に対して特有的に関連する遺伝子群を生物医学文献から抽出し,それらの特有性に応じて順位付けするアルゴリズムにより得られたものである.酸化ストレス起因疾患名は,人手により 「酸化ストレス,活性酵素,ラジカル」 などのキーワード 20 個程を選択し,これらのキーワードを用いて文献・書籍を検索することによって網羅的な選出を試みた.
著者
繁田 浩功 間下 以大 金子 雄 菊田 順一 瀬尾 茂人 竹村 治雄 松田 秀雄 石井 優
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-33, no.3, pp.1-6, 2013-03-14

生体イメージング技術の向上により生体内の動態を画像として観察することが可能となり,疾病のメカニズム解明や創薬等への応用が期待されている.一方で統計的信頼性を得るために膨大な画像を解析する必要性が生じている.本研究では,生体骨組織内の血管透過性の制御機構を解明するため,二光子励起顕微鏡を用いて得られた生体画像に対して,血液が骨髄腔に染み出す血管透過性を評価する手法を提案する.提案手法では,対象となる時系列画像に対してグラフカットを用いて骨髄腔領域をセグメンテーションし,その染み出し量を定量的に評価する.評価実験の結果,専門家の手による抽出結果を用いた結果とほぼ同様の結果が得られた.このことから,本手法は染み出しの程度について統計的かつ定量的な評価の一つとして利用できると思われる.
著者
草田 義昭 瀬尾 茂人 竹中 要一 野口 眞三郎 松田 秀雄
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2016-BIO-45, no.7, pp.1-6, 2016-03-11

遺伝子発現プロファイルの臨床応用は,近年精力的に研究が行われている.しかしマイクロアレイを用いたデータ解析においては,”バッチ効果” を取り除くことが不可欠であり,さらに逐次サンプルが追加される臨床現場では,1 サンプル毎に正規化が完結することが求められている.我々は,ノンパラメトリックZ標準化 (NPZ) 法を提案し,既存の手法と比較検討を行った.まず,公共のデータベースからエストロゲン受容体 (ER) とヒト上皮増殖因子受容体 2 (HER2) の免疫組織化学 (IHC) 染色の結果を有する 2,813 症例 (24 データセット) のマイクロアレイの発現データを抽出した.続いて,CEL ファイルからバックグランド補正及び,log2 変換のみを行ったもの (Raw), 既存の 4 つの正規化法 [Microarray Suite 5.0(MAS5),frozen robust multiarray analysis (fRMA),radius minimax (RMX)]. に対して,下記の 6 つの数値変換 [無変換,シングルアレイ数値変換(RANK,,Z,NPZ,,YuGene),マルチアレイ数値変換 (ComBat)] を加えて,各々の ER と HER2 の IHC 染色の結果と mRNA の発現の一致率を比較した.シングルアレイ数値変換を行うことで IHC 染色と mRNA の発現の一致率は改善した.一方で,マルチアレイ数値変換は,主成分分析ではバッチ効果を他の手法に比して除去しているように図示されたが,実際には IHC 染色との一致率が低下していた.さらに,乳癌の予後と数値変換の検討の結果,MAS5 後に NPZ を加えることで,無変換,マルチアレイ数値変換と比べて 2 群の差が明瞭となった.今回,我々は乳癌のデータセットを用いて数値変換の与える影響について検討を行った.シングルアレイ数値変換を追加することで,臨床における発現データのバッチ効果の除去に有効である可能性が示唆された.
著者
芦田 和重 佐藤 哲大 中村 建介 湊 小太郎
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013, no.1, pp.1-8, 2013-03-14

DNA の塩基配列中の変異が原因とされるガンなどの疾病について,変異箇所を特定することで診断や治療が行える可能性が期待されている.解析対象の塩基配列中のどの位置にどのような変異が発生しているかを特定する技術は変異コールと呼ばれており,ゲノム解析の中心となる技術の一つである.正確な変異箇所の特定のため高精度の変異コールが必要とされているが,現在の変異コールは精度が低く,アライメントの手法次第では INDEL が検出できない場合や,INDEL 検出の精度を上げることにより SNP 検出の精度が下がるなどの問題がある.そのため,解析の手法を変えた複数回の解析が推奨されており,解析に必要な時間やコストが増大する原因となっている.この問題を解決するため,より精度の高い変異コールツールを開発する必要がある.本研究では,真正細菌の塩基配列中から SNP と INDEL を高精度に同時検出できる変異コールの実現を目的とし,既存のツールによる変異コールの問題点の指摘と,独自のアルゴリズムによる変異コールツールの作成を行った.また,複数の真正細菌を対象とし,作成したツールの精度検証を行った.その結果,SNP 検出の精度を下げない INDEL 検出の実現と,既存のツールによる変異コールでは検出できなかった INDEL の検出に成功した.Identifying mutations in genome DNA sequences is one of most fundamental methods to diagnose or predict hereditary disease or cancer. The technology of specifying mutation is called "mutation calling", and is one of the most important technologies in genomics. Although the highly precise mutation calling is needed for pinpointing mutation, the present mutation calling process has low accuracy and there are some problems. In a certain alignment algorithm, INDEL is undetectable; and the precision of SNP calling falls by raising accuracy of INDEL calling. Therefore, two or more analyses with different tools are recommended, but it causes increasing time and cost. To solve these problems, it is necessary to develop a mutation calling tool with higher-precision. The purpose of this research is to build the mutation calling tool which can detect SNP and INDEL simultaneously with high precision. We investigated some problems of the mutation calling by the known procedure and created a new tool with original algorithm. Moreover, accuracy verification of our tool was performed by analysing two eubacteria. As a result, it enabled the INDEL calling which does not lower the accuracy of SNP calling, and identifying of INDEL which was not detectable in the mutation call by the known procedure.
著者
望月 正弘
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2015-BIO-43, no.4, pp.1-2, 2015-09-05

コンピュータによる予測で医薬品候補化合物を選別する技術バーチャル・スクリーニングは,創薬の効率化に重要である.発表者は,並列生物情報処理イニシアティブが主催するオープン創薬コンテストへの参加を通じて,提案手法の有効性を検証した.本手法は,(1) スクリーニング対象化合物とターゲットを阻害する既知化合物の物理化学的性質の類似性を定量的に評価し “薬らしさ” に欠ける化合物を排除する段階と (2) 化合物の構造情報に加えてアッセイの実験条件を特徴量として用いた機械学習による薬剤活性予測の段階の 2 段階から構成される.最終的に医薬品候補として予測した化合物のうち,182 化合物が実際にアッセイの対象とされ,9 個のヒット化合物を得た.
著者
前田 英志
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2011, no.8, pp.1-7, 2011-11-24

本論文では,不動産賃貸市場における価格最適化のモデルを提案する.このモデルは,価格弾力性の分析に基づき理論家賃を算出するものである.手順としては,1.市場に従って家賃が変動する物件を選出する 2.エリアおよび物件属性を元にセグメンテーションを行い同一分析対象の物件群を選択する.3.セグメント単位で相場家賃に対する契約家賃の価格弾力性を元に理論家賃を算出する.このモデルにより,従来家賃設定担当者の経験に基づき近隣の競合他社に追随した受動的な価格設定が行われていた不動産賃貸市場において,理論的なプライシングのアプローチが可能となる.このモデルを適用した不動産会社において,市場の期待を超える入居率の向上を狙い通り実現し,その有効性を確認した.This paper proposes a price optimization model for the real estate leasing market. Our model calculates theoretical rent prices based on elasticity analysis. In this model, first the properties experiencing fluctuation according to the market are identified using a theoretical approach. Next, such properties are divided based on their characteristics, such as locations and features. Last, the optimized rent is calculated based on the elasticity between the rent over market and the utilization rate. This model enables a theoretical pricing approach to be used rather than the conventional passive approach based only on the experience of real estate employees. After applying this model to the real estate industry, we proved its effectiveness by realizing results which lead to an improvement in the utilization rate beyond the expectations of the market.
著者
北村 祐貴 狩野 均
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2009-BIO-19, no.12, pp.1-8, 2009-12-10

近年、インターネット上のスパムメールによる被害が深刻な問題になっている。そのため、スパムメールと正規メールを精度よく分類するためのスパムフィルタが多数提案されている。本論文では、分類の前処理として k-means 法によるクラスタリングを行うことにより分類精度を向上させる手法を提案する。前処理後の分類方法としては、通常のベイジアンフィルタまたは SVM フィルタを用いる。まず、学習に使うメール集合に対して k-means 法を適用し、その後クラスタごとにどのような特徴が表れているかを分析する。その結果に基づいてクラスタごとにフィルタの調整を行うことで分類精度の向上を達成した。TREC Public Corpus を用いた評価実験から、本手法の有効性を確認することができた。
著者
小林 健太 加藤 有己 谷口 丈晃 丸山 徹 伊藤 通浩 五斗 進 竹山 春子 藤渕 航
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2015-BIO-42, no.58, pp.1-2, 2015-06-16

多数の難培養微生物で構成される海洋環境の理解を促進するために,メタゲノム解析に注目が集まっている.しかしながら,メタゲノムのリード群を完全にアセンブルすることは困難を極めることが知られている.近年,次世代シークエンシング技術の発展とともに,1 細胞ゲノムデータが利用できるようになってきた.本稿では,近年の利用可能な技術の動向を踏まえ,メタゲノムおよび 1 細胞配列データが与えれたとき,アセンブリ,遺伝子の構造および機能推定を行うパイプラインを発表する.具体的に,リードの前処理,アセンブリとアノテーションに特化したパイプラインを提供し,遺伝子アノテーションのマップの可視化を可能とするものである.
著者
遠藤 友基 外山 史 千葉 親文 森 博志 東海林 健二
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2015, no.6, pp.1-6, 2015-03-13

本論文では,次世代シーケンサから得られた大量のデータに対して,大規模なゲノムのアセンブリが可能となるように,消費メモリ量の少ない de novo アセンブリアルゴリズムを提案する.実験では,E. coli K-12 strain MG1655 及びヒトの 14 番染色体から得られたリードに対してアセンブリを行った.その結果,本手法は E. coli に対しては従来手法の約 20%,ヒト 14 番染色体に対しては他手法の約 60% の消費メモリ量で de novo アセンブリが可能であることを確認した.In this paper, we propose an algorithm for de novo assembly with lower memory. In our experiments using the E. coli K-12 strain MG 1655, the average maximum memory consumption of the proposed method was approximately 20% of that of the popular assemblers. Moreover, in the experiments using human chromosome 14, the average amount of memory of our method was approximately 60% of that of the popular assemblers.
著者
Yoshiki Murakami Toshihito Tanahashi Rika Okada Hidenori Toyoda Takashi Kumada Masaru Enomoto Akihiro Tamori Norifumi Kawada Y-H. Taguchi Takeshi Azuma
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.2, pp.1-5, 2014-12-11

Although microarray has been an important tool that can perform extensive gene expression analyses, next generation sequencing (NGS) has recently arisen as an alternative methodology that can measure gene expression. In this paper, we have compared microarray and NGS quantitatively using microRNA measurements in hepatocellular carcinoma (HCC) and found that these two are coincident with each other. NGS also turned out to be used for biomarker between HCC and normal tissue if the recently proposed principal component analysis based unsupervised feature extraction was applied.Although microarray has been an important tool that can perform extensive gene expression analyses, next generation sequencing (NGS) has recently arisen as an alternative methodology that can measure gene expression. In this paper, we have compared microarray and NGS quantitatively using microRNA measurements in hepatocellular carcinoma (HCC) and found that these two are coincident with each other. NGS also turned out to be used for biomarker between HCC and normal tissue if the recently proposed principal component analysis based unsupervised feature extraction was applied.
著者
粟津妙華 高田雅美 城和貴
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.17, pp.1-6, 2012-11-29

国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして WEB 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがルビである.現在のルビを直線的に除去する技術は,規格に沿った現在の書籍を対象としたものであるため,現在の書籍とは違う特性を持つ近代書籍には適用できない.そこで,本研究では,遺伝的プログラミングを用いて,曲線的に出版者・時代ごとの専用ルビ除去式の生成を行う.In National Diet Library, books which are possessed in library as "the digital library from meiji era" are open to the public on WEB. Since these are shown as image data and cannot search using document contents, an automatic text conversion is needed. However, ruby is a disturbing text conversion. Since existing techniques of linearly removing ruby had developed for books of the current standard, the techniques are inapplicable to early-modern Japanese books, which have a specific characteristic different from characters of current books. In this paper, we propose a method to remove ruby from early-modern Japanese books using Genetic Programming.
著者
桜井 都衣 山根 順子 小林 健太 山根木 康嗣 谷口 丈晃 加藤 有己 藤渕 航
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.5, pp.1-2, 2014-09-12

2006 年に iPS 細胞が発見されて以降,実際に幹細胞由来の人工組織が医療の現場で活用されるという時代の到来が現実味を帯びて来た.それと同時にこれまで以上に細胞というものを熟知し,個々の細胞の性質の判断基準を明らかにする必要性も著しく高まっている.当研究室では,以前公開された SHOGoiN というヒト細胞解析データのためのデータベースの延長として,細胞というシステムを科学的な解析結果と知識に基づき明確に定義するためのデータベース (Stem Cell Informatics Database) の構築を行っている.現在の Stem Cell Informatics Database は,近年盛んに行われ始めているシングルセル技術を用いたトランスクリプトーム解析やメチローム解析データ及び実験条件などのメタデータ,ヒト組織画像とそこから抽出された細胞形態解析データ,そして解剖学的な位置情報に対応させたヒト細胞の分類表などを格納している.また今後は,細胞という複雑な概念のモデル化,語彙・知識の統合管理を可能にするためのオントロジーの構築や細胞情報解析のためのツールなども行い,搭載する予定である.Researchers have actively investigated potential applications of the induced pluripotent stem cell (iPS cell) for disease modeling, drug screening, and regenerative medicine since its discovery in 2006, and now it is about to start one of the projects for clinical trials. In parallel with the medical practice, there has been arising a need of more precise knowledge of the cell of its disposition, while facing a lack of the information system that enables us to store such complex biomedical knowledge regarding cells in well-organized way. Here we introduce our cell knowledge repository called "Stem Cell Informatics Database" that is an extended work of the previous SHOGoiN database. It has been designed to integrate information comprehensively for defining cells with diverse knowledge and scientific data from biomedical research. In the Stem Cell Informatics Database, there are several indispensable contents, such as gene expression profiles and images of cells, curated assay metadata, and the cell taxonomy associated with anatomical location information. Stem Cell Informatics Database is now under development, and we are currently working on i) creating our own ontology to formally describe/model knowledge about the cells, and ii) developing analysis tools for gene expression data produced in single cell experiments. Depositing all of those in one database, this will provide a framework of integrative system for cell knowledge dictionary.
著者
伊藤 祥平 但馬 康宏 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2013, no.4, pp.1-3, 2013-12-04

UEC コンピュータ大貧民大会ではモンテカルロ法を用いたクライアントが優勝している.そこでプレイアウト中の相手着手を実際の着手に近づけることでモンテカルロ法によるクライアントの強化を考える.本研究ではゲーム中の実際の相手着手を学習する方法としてナイーブベイズを用いる.これにより高速な相手のモデル化を行う.さらに、学習素性の工夫により精度の向上を行った.この結果,作成されたモデルの精度は過去の優勝クライアント snowl に対し,4 割程度の近似ができた.Monte-Carlo method is also useful for DAIHNMIN and the client using this method has won the UEC computer DAIHINMIN tournament. We try to accelerate the strength of Monte-Carlo method by making effective opponent models which are close to the real opponents' moves. Stronger opponent models, more effective playouts our client has. We use Naive Bayes as the learning method to modeling the opponents. This method is one of the fastest algorithm for learning and classification. In addition, its accuracy is enough to modeling the opponents. In this paper, we show two modeling by Naive Bayes. The first method is the simple modeling, and the second is improved the move data structure. The accuracy is approximately 40% by our improved method to model snowl which is the champion client in 2010.
著者
Daichi Nogami Yuuichi Nakano Y-H.Taguchi
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.28, pp.1-2, 2013-06-20

Inference of subcellular location only using sequence information is important. In this paper, we proposed the application of principal component analysis-based linear discriminant analysis for subcellular location information. It achieved the performance of Area Under the Curve under Receiver Operating Characteristic curve mostly more than 0.95 if less than 80% sequence identity non-redundancy was applied.
著者
Shodai Katsukawa Y-H.Taguchi
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.27, pp.1-2, 2013-06-20

Type II diabetes (T2D) was a critical symptom also related to other diseases including cancers. Thus, suppression of T2D is important. In this paper, we investigated microRNAs as candidates of drug targets and biomarkers. A recently proposed principal component analysis based linear discriminant analysis allows us to specify numerous miRNAs differently expressed between type II diabetes patients and healthy control. Type II diabetes, Impaired Fasting Glucose patients, and normal control are successfully discriminated by blood miRNAs.
著者
樋口 翔 野田 淳史 曰野 英逸 村田 昇
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.26, pp.1-6, 2013-06-20

動物は脳内のニューロンの協調的な活動により情報を処理している.この協調の様子をグラフとして表現し,その構造を推定することは,脳内における情報処理の仕組みの理解につながる.ニューロンのシナプス結合には向きが存在するため,ニューロンの結合モデルとしては有向グラフが適切であり,また,グラフ構造推定手法としても有向グラフに適用可能な手法が要求される.本研究では,digraph Laplacian によって有向グラフを簡潔に表現し,グラフ上で情報が遷移する様子をモデル化する.さらに,モデルのパラメータ推定手法を提案する.ニューロンモデルから作成したデータを用いて,提案手法によって有向グラフ構造の推定が可能であることを実験的に示す.
著者
丹野 智博 堀江 和正 小林 高彰 森田 昌彦
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.25, pp.1-5, 2013-06-20

層状ニューラルネットにおいて,入力するアナログ値を多次元の 2 値パターンに変換すると,多変数関数近似器としての性能が大きく向上することが報告されている.本研究では,このパターンコーディングをパターン分類問題に適用した場合の有効性について検討する.2 次元 2 クラス分類問題を対象として数値実験を行った結果,単純パーセプトロンに適用してもあまり効果はないが,さらに多層化する (多層パーセプトロンに適用する) か,選択的不感化を行うことによって,非常に複雑な決定境界を容易に学習できるようになることがわかった.また,境界の複雑さを表す指標を提案し,それが分類誤差と高い相関をもつことを示した.この指標は,パターンコーディングを適用すべきか,どの分類器を用いるべきかを判断するのに有用だと考えられる.
著者
山村 頼子 久保 孝富 山川 俊貴 池田 和司
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.23, pp.1-6, 2013-06-20

局所脳冷却には,てんかん発作を抑制する効果があることが知られている.このことから,局所脳冷却の埋め込み型てんかん抑制装置への応用が期待されている.しかし,局所脳冷却がてんかん発作を抑制するメカニズムは未だ明らかになっていない.本研究では,温度依存的に反応速度が変化する Hodgkin-HuxIey 型イオンチャネルモデルを用いて新皮質の神経ネットワークのシミュレーションを構築し,冷却に伴うイオンチャネルの反応速度の低下がてんかん発作に与える影響を検討した.
著者
齊藤 有紀 石田 貴士 関嶋 政和 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.15, pp.1-6, 2013-06-20

近年,薬剤開発に必要な時間や費用が増大しており,薬剤開発の期間短縮や費用削減が求められている.そのための手法としてコンピュータ上でのシミュレーションを用いて,ターゲットとなるタンパク質を阻害する薬物の構造を設計する手法が注目を浴びている.一方で,薬物として使用する化合物は,体内で代謝・排泄されなければならないという条件がある.この条件を満たす薬物の選定のために行われるのが薬物クリアランス経路予測である.そこで我々は,コンピュータ上で行われるシミュレーションのひとつである,タンパク質と化合物のドッキング計算による結合自由エネルギー計算を,薬物クリアランス経路の予測に応用し,これまで我々が開発してきたクリアランス経路予測システムの精度改善を行った.