著者
Yuki Sugawara Masaaki Kotera Kenichi Tanaka Kimito Funatsu
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.20, pp.7-17, 2019 (Released:2019-06-11)
参考文献数
27

Fluorescent substances are used in a wide range of applications, and the method that effectively design molecules having desirable absorption and emission wavelength is required. In this study, we used boron-dipyrromethene (BODIPY) compounds as a case study, and constructed high precision wavelength prediction model using ensemble learning. Prediction accuracy improved in stacking model using RDKit descriptors and Morgan fingerprint. The variables related to the molecular skeleton and the conjugation length were shown to be important. We also proposed an applicability domain (AD) estimation model that directly use the descriptors based on Tanimoto distance. The performance of the AD models was shown better than the OCSVM-based model. Using our proposed stacking model and AD model, newly generated compounds were screened and we obtained 602 compounds which were estimated inside the AD in both absorption wavelength and emission wavelength.
著者
Norihito Kawashita Hiroyuki Yamasaki Tomoyuki Miyao Kentaro Kawai Yoshitake Sakae Takeshi Ishikawa Kenichi Mori Shinya Nakamura Hiromasa Kaneko
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.16, pp.15-29, 2015 (Released:2015-10-29)
参考文献数
192
被引用文献数
3 6

We have reviewed chemoinformatics approaches for drug discovery such as aromatic interactions, aromatic clusters, structure generation, virtual screening, de novo design, evolutionary algorithm, inverse-QSPR/QSAR, Monte Carlo, molecular dynamics, fragment molecular orbital method and matched molecular pair analysis from the viewpoint of young researchers. We intend to introduce various fields of chemoinformatics for non-expert researchers. The structure of this review is given as follows: 1. Introduction, 2. Analysis of Aromatic Interactions, 2.1 Aromatic Interactions, 2.2 Aromatic Clusters, 3. Ligand Based Structure Generation, 3.1 Virtual Screening, 3.2 De Novo Ligand Design, 3.3 Combinatorial Explosion, 3.4 Inverse-QSPR/QSAR, 4. Trends in Chemoinformatics-Based De Novo Drug Design, 5. Conformational Search Method Using Genetic Crossover for Bimolecular Systems, 6. Interaction Analysis using Fragment Molecular Orbital Method for Drug Discovery, 7. Matched Molecular Pair Analysis and SAR Analysis by Fragment Molecular Orbital Method, 8. Chemoinformatics Approach in Pharmaceutical Processes, 9. Conclusion.
著者
仙石 康雄 松岡 誠 杉木 真一郎 田中 成典 栗田 典之 関野 秀男
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.5, pp.1-8, 2004 (Released:2004-03-24)
参考文献数
13
被引用文献数
1 1

巨大分子の電子状態を計算する手法の1つとして、Fragment 分子軌道(FMO)法がある。FMO法は分子をフラグメントに分割して計算することにより、通常の分子軌道(MO)計算では計算不可能な巨大分子の電子状態を計算できる。FMO法の計算精度およびコストはフラグメントの分割方法に大きく依存する。我々は、密度汎関数法(DFT)に基づくFMO法を独自に開発し、これを用いてDNAの電子状態を塩基分割及び塩基対分割の二種類のフラグメント分割方法で計算した。これらの計算から得られた分子の全エネルギーとMO分布について通常のDFT法による結果と比較した結果、塩基ごとに分割したFMO計算は、塩基対ごとに分割したFMO計算と同程度の計算精度で、全エネルギーとMO特性を得ることができることが明らかになった。
著者
小野 直亮 横山 直己 黄 銘 Md. Altuf-Ul Amin 中本 雅俊 太田 大策
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.18, pp.110-116, 2017 (Released:2017-08-01)
参考文献数
16

マイクロアレイや次世代シーケンサーを用いた網羅的発現変動解析において、多数の実験条件の組み合わせの中から有意に細胞の表現型に影響を与えているものを見つけ出す必要があり、そのためには分散分析(ANOVA)を始めとする多変量解析のための統計分析手法が必要となる。本研究ではRNA-seqを用いたユーグレナ(Euglena gracilis)の発現解析のデータをもとに、Bayes ANOVAを用いた発現変動解析により代謝経路のなかで有意に変動している遺伝子を抽出するアプローチを紹介する。培養条件の変化(好気環境から嫌気・微好気への変化)及び、増殖フェイズの変化(指数増殖期から定常期への変化)に応答して発現の変動した遺伝子を解析した。置換検定にもとづいてベイズ因子の分布を計算することにより、一般には検出の基準が不明瞭なベイズ因子によるモデル比較に対し、有意水準やFDRによる定量的な検出の基準を与えることを可能にしている。
著者
小川 拓水 岡澤 敦司 太田 大策
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.18, pp.51-57, 2017 (Released:2017-08-01)
参考文献数
15

リピドミクスは試料中に含まれる脂質の総体を研究対象とする学問分野である。主要な膜脂質であるグリセロリン脂質は、1 分子のグリセロール骨格に 1 分子の極性頭部と 2 分子の脂肪酸がエステル結合しており、極性頭部の種類によってクラス分類がなされている。その構造多様性をもたらす要因は、極性頭部の種類、2 分子の脂肪酸の種類 (炭素鎖長と不飽和結合数) であるが、それらの組み合わせを考慮した場合、試料中に含まれることが予想される脂質分子種の数は膨大なものとなる。しかし、公共のデータベースに収集されている脂質の実測データは,膨大な数の脂質分子種に対して未だ限定的であり、このことが個々の脂質分子種の同定作業を困難なものにしていた。一方、MS 測定においてそれぞれの脂質クラスに特徴的なイオン開裂反応が起こることが知られていた。そのためリピドミクスでは、計算機上 (インシリコ) で脂質分子種の MS/MS 測定を行って仮想的な MS/MS スペクトルを生成し、それらを参照ライブラリ (インシリコ MS/MS ライブラリ) として利用した脂質同定ツールが開発されてきた。本稿では、これらの脂質同定ツールのリピドミクスへの貢献について概説する。
著者
松田 史生
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.18, pp.24-30, 2017 (Released:2017-08-01)
参考文献数
17

液体クロマトグラフィー/質量分析計 (LC/MS) を用いたメタボロミクスでは、生体試料中代謝物のカタログ化を目指し、プロダクトイオンスペクトル(MS/MSスペクトル)に基づく代謝物アノテーションが試みられている。その基盤としてMassBankが収集した標準化合物データが重要な役割を果たしてきた。本稿では、代謝物アノテーション法をさらに発展させる試みの一つして、プロダクトイオンスペクトルの構造情報をMS/MS文字列とその正規表現として記述する方法を紹介する。代謝物アノテーションの情報処理要素技術である、プロダクトイオンスペクトルの品質評価、類似性検索、検索結果の品質評価、化合物オントロジーによる部分アノテーションに再検討を加え、解決すべき課題の抽出を試みる。
著者
小田 彰史
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.14, pp.36-43, 2013 (Released:2013-10-02)
参考文献数
26

多数の共著者とともに論文を発表した数学者ポール・エルデシュにちなんで、エルデシュとの距離を測るエルデシュ数が考案された。エルデシュ数は論文著者を頂点、共著関係を辺として作成したグラフにおけるエルデシュまでの距離で定義される。この概念はあくまでも数学者コミュニティにおけるジョークとして提案されているが、数学からはかけ離れた分野の研究者も比較的小さいエルデシュ数を持つことがあり、学問の各分野が決して孤立したものではないことを示す格好の教材となっている。本研究では学問全体における情報化学の位置を初学者にわかりやすく示すため、日本の情報化学者のエルデシュ数について検討する。それに際して、エルデシュ数2を持つ細矢治夫を中心としたサブグラフを導入し、細矢からの距離細矢数を用いることでエルデシュ数を近似的に求められることを示した。さらに情報化学者以外のエルデシュ数についても論じ、エルデシュ数が研究者コミュニティのつながりが密であることを示すよい教材となることを確認した。
著者
山城 直也 宮尾 知幸 荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.10, pp.96-103, 2009 (Released:2009-08-20)
参考文献数
16
被引用文献数
5 1

大気中の二酸化炭素濃度の上昇を抑制するための手法として、二酸化炭素地中貯留技術が注目されている。しかし、その実用化のためにはコストの高さが大きな課題となっており、特に二酸化炭素を分離回収する過程におけるコストが全体の大部分を占めると試算されている。そこで本研究ではアルカノールアミン溶液を用いた化学吸収法による二酸化炭素の分離回収に着目し、より優れたアルカノールアミンの設計を目指した。アルカノールアミン溶液は低温下で二酸化炭素を吸収し、加熱により吸収した二酸化炭素を放散する性質があり、二酸化炭素の分離回収に利用することが可能である。吸収液に求められる性質として、二酸化炭素を放散させるために必要な熱量が少なく、吸収速度が速いことが挙げられる。そこで、これらの要求を満たすような吸収液の開発を目的とした。まず、反応熱、吸収速度の実験データを基に、アミンの構造情報からこれらを予測する回帰モデルをPLS (partial least squares)法、GAPLS (genetic algorithm based-PLS)法を用いて構築した。その結果、GAPLS法では反応熱に対してR2=0.999、Q2=0.990、吸収速度に対してR2=0.957、Q2=0.914となり、予測精度の高いモデルが構築された。このモデルを用いて、コンピュータ内で仮想的に発生させた新規構造の物性値を予測することで、有望な物性を持つと予想される吸収液の探索を行った。その結果、実験データよりも良好な物性を示すと考えられる候補構造が複数得られた。
著者
Francesca Grisoni Gisbert Schneider
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.20, pp.35-42, 2019 (Released:2019-12-26)
参考文献数
65

Computer-assisted de novo drug design has been a central research topic in the field of chemoinformatics for approximately 30 years. Professor Kimito Funatsu’s research has been a formative component in these developments. His seminal work has contributed inverse quantitative-structure-activity relationship (QSAR) models for small molecule and peptide design. This article highlights a class of recurrent neural networks, so-called long short-term memory (LSTM) networks for generative molecular design, which further the conceptual approach of inverse QSAR. We review the LSTM method for molecular design along with selected practical applications.
著者
Kenji Hori Aki Hasegawa Noriaki Okimoto Suzuko Yamazaki
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.20, pp.50-55, 2019 (Released:2019-12-26)
参考文献数
18

Information of transition states of similar reactions is the key to locating those of unknown reactions. In order to utilize this feature, we are constructing a database, called QMRDB, which gathers results of quantum mechanical calculations for elementary reactions as well as those for related molecules. Another database (TSDB) stores information of name reactions in organic synthesis. Retrieval results from these databases are used for analyzing reaction mechanisms which have not been experimentally examined. We developed a cloud system managing both the two databases and theoretical calculations. The present paper describes the summary of the TSDB cloud system and how to use it to perform in silico screenings for synthesizing drug candidates.
著者
佐方 冬彩子 小寺 正明 田中 健一 中野 博史 浮田 昌一 白沢 楽 冨谷 茂隆 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.19, pp.7-18, 2018 (Released:2018-09-27)
参考文献数
23

材料開発において未知の材料を効率的に探索するには、組成の情報のみから物性を予測する手法の開発が必要である。本研究では、無機材料の組成式を記述子に変換して説明変数とし、物性との関係を表す回帰モデルを構築した。さまざまな物性の予測に対応できるよう情報を損失なく変換するために、組成式中の各元素の個数や割合を表す記述子、原子量、原子半径、電気陰性度といった元素の物理学的パラメータを使用した記述子など、合計387個の記述子を提案した。ケーススタディとして、これらの記述子を用いてRandom Forestによるモデルを構築し、結晶の生成エネルギー、密度、屈折率という3種類の物性の予測を行って R2 値がそれぞれ 0.970、0.977、0.766という結果を得た。また、統計的に選択されそれぞれの物性予測モデルの構築に寄与した記述子が、化学的知見から考えても妥当なものであったことからこの手法の有用性を確認した。
著者
Ryohei Eguchi Naoaki Ono Hisayuki Horai Md.Altuf-Ul Amin Aki Morita Hirai Jun Kawahara Shoji Kasahara Tomoaki Endo Shigehiko Kanaya
出版者
日本化学会 情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.18, pp.58-75, 2017 (Released:2017-08-01)
参考文献数
86
被引用文献数
3

Systematic representation of alkaloid biosynthetic pathways based on ring skeletons has been proposed because the skeleton nucleus of an alkaloid is the main criterion for determination in biosynthetic pathways. So the idea of ring skeletons was extended to apply classification of alkaloid compounds based on ring skeletons and to systematize alkaloid compounds and to examine the performance of this approach to predict biosynthetic pathways based on module elements. We constructed a 2-dimensional binary matrix corresponding to 2546 SRS and 478 pathway-known alkaloid compounds. Here, if ith substring skeleton is present in a target compound, the ith element was set to 1; otherwise, the ith element was set to 0. Relationship of alkaloid compounds with biosynthetic pathways are examined based on the dendrogram produced by Ward clustering method to the matrix. Of 12,243 alkaloid compounds accumulated in KNApSAcK Core DB (http://kanaya.naist.jp/knapsack_jsp/top.html), 3,124 compounds (25.5 %) correspond to the pathway-known ring skeletons (187 ring skeletons), but the remaining 9,119 (74.5%) compounds do not. By examining the sub-ring skeleton similarity of the remaining compounds, it might be possible to obtain clues of pathway information and systemization of all alkaloid compounds. Therefore, the present work focuses on comprehensive systematization of the alkaloid compounds and construction principles of ring skeletons in alkaloids based on subring skeleton profiling.
著者
Christin Rakers Daniel Reker J.B. Brown
出版者
日本化学会 情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.18, pp.124-142, 2017 (Released:2017-08-01)
参考文献数
72
被引用文献数
9

The identification of new compound-protein interactions has long been the fundamental quest in the field of medicinal chemistry. With increasing amounts of biochemical data, advanced machine learning techniques such as active learning have been proven to be beneficial for building high-performance prediction models upon subsets of such complex data. In a recently published paper, chemogenomic active learning had been applied to the interaction spaces of kinases and G protein-coupled receptors featuring over 150,000 compound-protein interactions. Prediction models were actively trained based on random forest classification using 500 decision trees per experiment. In a new direction for chemogenomic active learning, we address the question of how forest size influences model evolution and performance. In addition to the original chemogenomic active learning findings that highly predictive models could be constructed from a small fraction of the available data, we find here that that model complexity as viewed by forest size can be reduced to one-fourth or one-fifth of the previously investigated forest size while still maintaining reliable prediction performance. Thus, chemogenomic active learning can yield predictive models with reduced complexity based on only a fraction of the data available for model construction.
著者
佐藤 寛子 青木 淳 浅岡 浩子
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.7, pp.141-149, 2006
被引用文献数
1

基盤ソフトウェアのオープンソース化は共通技術の共有化によるソフトウェア技術の発展と次世代の育成と継承のために重要である。しかし、化学ソフトウェアの市場は圧倒的に欧米製のもので占められており、かつ共通技術であっても公開されているソースコードは極めて少ないのが現状である。そこで我々は、基盤技術の1つである化学用グラフィックスソフトウェアのオープンソース化に向けてライブラリの構築を進めてきた。2005年12月26日に、本ライブラリを「ケモじゅん」と命名し、公開を開始した。本稿では、2006年8月10日リリースしたケモじゅんの最新版050の機能と特色について,ケモじゅんプロジェクトの考え方と合わせて報告する.
著者
富木 毅 斎藤 臣雄 植木 雅志 今野 英明 浅岡 丈生 鈴木 龍一郎 浦本 昌和 掛谷 秀昭 長田 裕之
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.7, pp.157-162, 2006
被引用文献数
1 18

我々は、理化学研究所天然化合物バンク(RIKEN NPDepo)の情報基盤として、化合物データベース"理化学研究所天然化合物エンサイクロペディア(RIKEN NPEdia)"を構築した。このデータベースには、奈良先端科学技術大学院大学の金谷教授らが構築した二次代謝物データベース"KNApSAcK (http://kanaya.aist-nara.ac.jp/KNApSAcK/, http://prime.psc.riken.jp/ (mirror site))"から提供されたデータを含め、現在約25,000の化合物データが登録されている。ここに収録されているデータのほとんどは、放線菌、糸状菌、植物などから単離された二次代謝物のものである。それぞれの化合物データは、構造、起源、物理化学的性質、生物学的性質などから構成されている。MOLファイルをダウンロードすることも可能となっている。近日、UVスペクトル、MS/MSスペクトル、NMRスペクトルをデータに組み入れる予定である。このデータベースは、以下の3つの機能:(1)化合物の検索、(2)化合物データの登録、そして、(3)化合物バンクの受発注システムとの連携、を有している。我々は現在、化合物を収集するとともに、化合物データと代謝産物マップ、タンパク質間相互作用マップ、ケミカルゲノミクスマップ(バイオプローブが代謝系のどこに作用するかを示すマップ)との統合を目指している。我々は、NPEdiaが様々な領域の研究者にとって有益で、親しみやすいデータベースとなることを望んでいる。本データベースに関する詳細と最新情報は、我々のWebサイト(http://npd.riken.jp/)をご参照頂きたい。
著者
荒川 正幹 長谷川 清 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.1, pp.1-7, 2000 (Released:2000-08-03)
参考文献数
6
被引用文献数
5 4 6

3次元構造活性相関において活性コンフォメーションと重ね合わせルールを決定することは、モデルの適用能力を左右する重要な因子である。これら因子は互いに密接な関連があり、X線結晶解析などの構造情報がない場合には、容易には推定できない。本論文では、4way PLS法による合理的な活性コンフォメーションと重ね合わせルール推定法を提案する。4way PLS法はPLS法の変数を2次元の行列から4次元配列へと拡張した手法であり、PLS法と比較しノイズに強い安定なモデルを得ることが可能である。本論文では、Glycogen phosphorylase b(GPb)の阻害剤であるGlucose誘導体47サンプルを用いたCoMFA解析に本手法を適用した例を示す。サンプル、フィールド変数、コンフォメーション、重ね合わせルールからなる4次元配列を説明変数とし4way PLS法で阻害活性との関係を検討した。そしてモデル係数値を用い阻害活性に大きく寄与する活性コンフォメーションと重ね合わせルールの推定を行い良好な結果が得られた。またX線結晶解析によるGPbの3次元構造との関係について考察を行った。
著者
荒川 正幹 長谷川 清 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.3, pp.99-106, 2002 (Released:2002-08-23)
参考文献数
15
被引用文献数
1 1

CoMFA法をはじめとする多くの3D-QSAR手法において、対象とする分子構造を適切に重ね合わせることは、解析を成功させるための重要な因子であるため、種々の重ね合わせ手法が提案されている。著者らもHopfield Neural Network(HNN)を用いた新しい分子構造重ね合わせ手法を提案しており、COX-2阻害剤のCoMFA解析に適用し良好な結果を得ている[M. Arakawa, K. Hasegawa, K. Funatsu, Journal of Computer Aided Chemistry, 3, 63-72 (2002)]。本研究ではこの重ね合わせ手法のさらなる有用性を検証するため、human epidermal growth factor receptor-2 (HER2)阻害剤の3D-QSAR解析を行った。HER2阻害剤27化合物について、HNNによる重ね合わせを行い活性配座を推定した後、CoMFA法による3D-QSAR解析を行った結果、R²=0.805、Q²=0.701の良好なPLSモデルが得られた。また、その回帰係数の等高線図についての考察を行い、このモデルが妥当であるとの結論を得た。
著者
荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.13, pp.20-28, 2012 (Released:2012-05-19)
参考文献数
16

我々は、有機化合物の変異原性を予測するためのクラス分類モデルの構築を進めている。複数のSupport Vector Machine(SVM)モデルをサブモデルとして構築し、それらを組み合わせることで予測を行うアンサンブル手法を提案することで、これまでに予測正解率79.6%のモデルを構築することに成功している。しかし一方で、データベースに登録されているデータの一部に誤りが存在することを示唆する結果が得られた。そこで本研究では、誤りが疑われる化合物についてAmes試験を実施することでデータの検証を行った。Hansenらが収集・整理した、6,512化合物からなる復帰突然変異試験のデータセットを用い、アンサンブル手法によって変異原性予測モデルを構築した。そして、データベースに陰性として登録されているにも関わらず、多くのサブモデルによって陽性と判定される化合物を選択し、Ames試験を実施した。その結果、5化合物中の3化合物が陽性であることが判明した。