著者
プンサップ・アンヤーニー 加藤有己 阿久津 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.128, pp.137-142, 2007-12-21

生体高分子の機能の解明にはその折り畳み構造を理解する必要があるとされている.特に,機能的非コード RNA が注目を集めている.RNA の立体構造を予測することは困難であるため,シュードノットを含む,または含まない2次構造を予測する研究が行われてきた.本稿では,整数計画法を2次構造予測に適用する手法を提案する.ここで,シュードノットを含まない構造と,任意の平面的シュードノット構造を予測するための2つの定式化を導入する.さらに,提案手法を使った構造予測に関するいくつかの実験結果を示す.Understanding the function of biological molecules requires knowledge of their folded structures. In particular, noncoding functional RNAs have received much attention. Due to the difficulty in predicting the three dimensional structure of RNA, research efforts have shifted to the prediction of secondary structure both with and without pseudoknots. In this paper, we present a method of applying integer programming (IP) to RNA secondary structure prediction. We introduce respective IP formulations for predicting pseudoknot-free structure as well as arbitrary planar pseudoknotted structure. Furthermore, we show some experimental results on structure prediction using the proposed method.
著者
小林 健太 加藤 有己 谷口 丈晃 丸山 徹 伊藤 通浩 五斗 進 竹山 春子 藤渕 航
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2015-BIO-42, no.58, pp.1-2, 2015-06-16

多数の難培養微生物で構成される海洋環境の理解を促進するために,メタゲノム解析に注目が集まっている.しかしながら,メタゲノムのリード群を完全にアセンブルすることは困難を極めることが知られている.近年,次世代シークエンシング技術の発展とともに,1 細胞ゲノムデータが利用できるようになってきた.本稿では,近年の利用可能な技術の動向を踏まえ,メタゲノムおよび 1 細胞配列データが与えれたとき,アセンブリ,遺伝子の構造および機能推定を行うパイプラインを発表する.具体的に,リードの前処理,アセンブリとアノテーションに特化したパイプラインを提供し,遺伝子アノテーションのマップの可視化を可能とするものである.
著者
桜井 都衣 山根 順子 小林 健太 山根木 康嗣 谷口 丈晃 加藤 有己 藤渕 航
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.5, pp.1-2, 2014-09-12

2006 年に iPS 細胞が発見されて以降,実際に幹細胞由来の人工組織が医療の現場で活用されるという時代の到来が現実味を帯びて来た.それと同時にこれまで以上に細胞というものを熟知し,個々の細胞の性質の判断基準を明らかにする必要性も著しく高まっている.当研究室では,以前公開された SHOGoiN というヒト細胞解析データのためのデータベースの延長として,細胞というシステムを科学的な解析結果と知識に基づき明確に定義するためのデータベース (Stem Cell Informatics Database) の構築を行っている.現在の Stem Cell Informatics Database は,近年盛んに行われ始めているシングルセル技術を用いたトランスクリプトーム解析やメチローム解析データ及び実験条件などのメタデータ,ヒト組織画像とそこから抽出された細胞形態解析データ,そして解剖学的な位置情報に対応させたヒト細胞の分類表などを格納している.また今後は,細胞という複雑な概念のモデル化,語彙・知識の統合管理を可能にするためのオントロジーの構築や細胞情報解析のためのツールなども行い,搭載する予定である.Researchers have actively investigated potential applications of the induced pluripotent stem cell (iPS cell) for disease modeling, drug screening, and regenerative medicine since its discovery in 2006, and now it is about to start one of the projects for clinical trials. In parallel with the medical practice, there has been arising a need of more precise knowledge of the cell of its disposition, while facing a lack of the information system that enables us to store such complex biomedical knowledge regarding cells in well-organized way. Here we introduce our cell knowledge repository called "Stem Cell Informatics Database" that is an extended work of the previous SHOGoiN database. It has been designed to integrate information comprehensively for defining cells with diverse knowledge and scientific data from biomedical research. In the Stem Cell Informatics Database, there are several indispensable contents, such as gene expression profiles and images of cells, curated assay metadata, and the cell taxonomy associated with anatomical location information. Stem Cell Informatics Database is now under development, and we are currently working on i) creating our own ontology to formally describe/model knowledge about the cells, and ii) developing analysis tools for gene expression data produced in single cell experiments. Depositing all of those in one database, this will provide a framework of integrative system for cell knowledge dictionary.
著者
加藤有己 関 浩之 嵩 忠雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.99, pp.33-40, 2006-09-15

シュードノットを含むRNA の2次構造をモデル化する形式文法がいくつか提案されている.本論文では,文脈自由文法の自然な拡張でありシュードノットを表現できる多重文脈自由文法(MCFG)に着目し,確率MCFG(SMCFG)と呼ばれる確率モデルに拡張する.次に,多項式時間で確率最大の導出木を求める構文解析アルゴリズム及びEM アルゴリズムに基づく確率パラメータ推定アルゴリズムを与える.さらに,SMCFG の構文解析アルゴリズムを用いたRNA シュードノット構造予測に関する実験結果を示す.Several formal grammars have been proposed for modeling RNA secondary structure including pseudoknots. In this paper, we focus on multiple context-free grammars (MCFGs), which are natural extension of context-free grammars and can represent pseudoknots, and extend MCFGs to a probabilistic model called stochastic MCFG (SMCFG). We present a polynomial time parsing algorithm for finding the most probable derivation tree and a probability parameter estimation algorithm based on the EM algorithm. Furthermore, we show some experimental results on RNA pseudoknot prediction using the SMCFG parsing algorithm.
著者
田中 翔 加藤 有己 関 浩之
出版者
一般社団法人情報処理学会
雑誌
研究報告バイオ情報学(BIO) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.25, pp.37-40, 2009-02-26

シュードノットを含むRNAの2次構造予測に対するアプローチとして,文脈自由文法(CFG)より表現能力の高い形式文法(MCFQTAG等)の構文解析アルゴリズムに基づく手法が提案されている。また,汎用性と精度の向上を目指し,複数の1次構造同士の比較解析に基づく2次構造予測法もいくつか提案されている。本稿では,比較解析ができるようにMCFを拡張したペア確率多重文脈自由文法(Pair-SMCFG)を新たに定義し,これに基づくRNAの2次構造予測法を提案する。長さ70程度のRNA配列に対して2次構造予測を行ったところ,RNAの特定のファミリーに対する文法の特化を全く行わないという条件下であっても,適合率63.2%,再現率62.0%という結果を得た。Several methods for the prediction of RNA secondary structure including pseudoknots have been proposed based on parsing algorithms for formal grammars such as MCFG and TAG, of which generative power is greater than CFG. Also, comparative sequence analysis, which compares several RNAs and predicts their secondary structures, is a promissing approach. In this paper, we define pair-stochastic multiple context-free grammar (Pair-SMCFG) and propose a prediction method based on Pair-SMCFG. Pair-SMCFG is an extension of MCFG for comparative sequence analysis. Experimential results show that for RNA which have about 70 bases, the precision and recall of our algorithm are 63.2% and 62.0% respectively.