著者
加藤 涼太 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P12, 2019 (Released:2019-10-22)
参考文献数
7

化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、多くの記述子の中から最適な組合せを見つけなければならず、その中に予測に必要な情報が十分に含まれているか分からないという問題もある。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号および分子のグラフ構造を入力とし、Graph Convolutional Neural Network(GCNN)を用いた予測手法を開発した。記述子を用いる手法と比較した結果、予測タスクによって提案手法が勝る場合も劣る場合もあった。その原因としてモデルの表現力の不足が考えられるため、入力方法やモデル構成を改良することで性能が向上すると考えられる。
著者
藤芳 明生
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.2A02, 2019 (Released:2019-10-22)
参考文献数
6

正規表現によって文字列検索の利便性が飛躍的に向上したように、化学構造検索の利便性向上のため、既存の化学構造表記法SMILESを拡張した正規表現拡張SMILESを提案するとともに、それを用いた化学構造検索手法を紹介する。正規表現拡張SMILESは、発表者が研究を続けている有限グラフオートマトンに容易に変換可能であり、有限グラフオートマトンを用いた部分グラフ探索アルゴリズムを適応することができる。
著者
福島 真太朗
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.2B03, 2019 (Released:2019-10-22)
参考文献数
7

近年,機械学習を用いて物性を予測したり,結晶構造を探索したりする研究が行われている.本研究では,生成モデルを用いた結晶構造生成について考える.この問題に対して,CrystalGANと呼ばれる手法が提案されている.この手法は”A-H-B” (A, B:金属,H:水素)という結晶構造を持つ化合物を探索するために,異なるドメイン間を横断した生成モデルであるDiscoGANを使用する. CrystalGANは,結晶構造生成の簡便な手法である.一方で,POSCARファイルに記録された格子ベクトルと,水素や金属の座標を結合して特徴量を構築するため,結晶の幾何学的構造の反映が十分ではないという問題点がある.本研究ではこの問題点を解決するために,結晶をグラフ構造で表現して幾何学的構造を織り込み生成モデルを学習する方法を提案する.
著者
田中 弥 大沼 かおり 三瓶 真菜 佐々木 一謹 山本 博之
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P04, 2019 (Released:2019-10-22)
参考文献数
4

本プロジェクトでは、メタボローム解析においてしばしば問題となる未知化合物の構造推定に、2種の独立したアプローチで取り組んだ。一方は一般的に用いられるタンデム質量分析 (MS/MS) を用いた推定であり、もう一方は代謝に基づく発表者ら独自の推定である。これにより十種程度の未知化合物の同定に成功してきたが、それには一方の手法がより良い推定を示したものも、両方の手法にて有力候補となったものも含まれていた。置換基の位置のようにMS/MSでは得にくい情報も、前駆体探索により構造推定に取り組むことができた。一方で、前駆体探索が困難な構造の化合物では、MS/MS による推定がより有力であることが考えられる。独立した2手法を用いることでそれぞれが得意な推定対象を補完しあい、また両手法の結果の組み合わせからより精度の高い推定を導くことが可能となった。
著者
柴山 翔二郎 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.2A01, 2019 (Released:2019-10-22)
参考文献数
13

機能性ポリマーの新しい構造を実験で探索するのには限界がある。そこでケモインフォマティクスを利用して材料設計を行うが、新規材料の原料は市販されていないことが多く一般にデータが少ない。本研究ではポリマーを原料分子の記述子と組成比の線形和で表現し回帰モデルに線形モデルを選定することで、39サンプルのポリマーデータからモデル構築した。原料分子の記述子として文献値でなく分子構造に対して計算される分子記述子を使用することで、構造生成にも適用しうるモデルの構築を目指した。構築したモデルを利用して目的物性値に近づけるように原料組成比を最適化し、また、原料の構造生成を行った。フラグメント記述子で原料を表現したため、構造生成にあたりmol2vecを用いてフラグメント記述子の分散表現を活用した。原料組成比を最適化した結果を実際に合成したところデータになかった組み合わせにおいて目的物性値が最も目標値に近づいた。本発表では方法論に焦点を当てて紹介する。
著者
北村 由羽 寺戸 えみ 田中 大輔
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P25, 2019 (Released:2019-10-22)
参考文献数
3

金属-有機構造体 (MOFs) の合成においては, 反応条件のわずかな違いにより様々な 反応状態を経由するため, 結晶構造が異なる結晶生多形が多数生じる可能性がある. 特 に, ランタノイド金属 (Ln) を中心に持つ Ln–MOFs は複数の結晶多形が存在する. 合 成におけるパラメーターは無数に存在し, これらの要素は複合的に影響するため, その 影響の評価が困難であり, 結晶多形を選択的に合成するためには試行錯誤に基づく実 験が必要不可欠であった. 本研究では, 機械学習を活用し, Ln–MOFs 合成における支 配的因子を統計的に評価することを目指した. 実際に, 溶液の濃度, 反応温度や時間, 金属の種類など様々な条件を組合せソルボサーマル合成を行い, 実験データの収集を 行い, 実験結果に対して決定木学習を行った. その結果, 合成に影響を及ぼす支配的因 子はランタノイドの試薬会社であることが明らかとなり, 試薬中に含まれるわずかな 不純物の存在が結晶化に影響を及ぼすことが示唆された.
著者
山本 寛人 田中 健一 山下 俊介 浮田 昌一 中野 博史 白沢 楽 冨谷 茂隆 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P19, 2019 (Released:2019-10-22)
参考文献数
4

電子エネルギー損失分光法(EELS)から得られたスペクトルデータの解析手法について報告する。EELSは電子線を試料に照射し、透過した電子線に磁場をかけて分光し、エネルギー損失から試料の状態を推定する分析手法である。提案手法では、EELSスペクトルデータに2種類の前処理を適用し、主成分分析による解析を行った。ドライエッチング時のダメージの状態把握および、GaInN量子井戸におけるインジウム含有量の推定結果について報告する。
著者
伊藤 真利子 大西 立顕
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P10, 2019 (Released:2019-10-22)
参考文献数
7

化合物空間をネットワークにより表現することで空間の特徴を捉えようとする試みが先行研究でされている.このネットワークでは頂点が化合物を表し,二つの化合物の類似度がある閾値よりも高ければ頂点間にリンクが張られる.しかし,ネットワーク構造は閾値の設定に大きく依存する.そこで本研究では,二頂点間のリンクの重みを化合物の類似度とした重み付きネットワークを考える.生物活性低分子データベースのChEMBLから各ターゲットに対する化合物のデータを取得し,それらの重み付きネットワークの構造を解析した.その結果,極めて強く他の頂点とつながるような頂点は見当たらなかった.またネットワーク全体のコミュニティ構造は弱かった.しかし部分的に,互いに強くつながり合い,全体とは異なる生物活性分布をもつ化合物の集合が見られた.また特に強い(もしくは特に弱い)生物活性値をもつ化合物同士は強くつながり合っていることもわかった.
著者
堀 憲次
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.2B08, 2019 (Released:2019-10-22)
参考文献数
5

合成経路設計システムにより創出される経路は、①多くの場合前駆体の合成が合成困難、②多段階合成では、合成経路の数が発散する、③提案合成反応は標的分子を主生成物として与えない可能性がある、などの理由により標的分子の合成を保証しない。①はSAスコアを計算することで、②はin silicoスクリーニングと実験の組み合わせにより解決できる。本研究では、③について、RDkitを用いて可能性のある反応を予測し、それらについて理論計算を行うことにより、どれが主反応であるかを決める手順を作成することを試みた。これは、複数の生成物が予想される反応では、単にTS構造を求めるだけでは不十分で、最も低い活性化自由エネルギーを与えるTS構造を求めて比較することで始めて、主生成物がどれであるかを判定できることによる。開発された手法をEne反応に対して適用し、主生成物が何であるかについて予測できる可能性が示された。
著者
金谷 重彦 小野 直亮 森田 晶
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P02, 2019 (Released:2019-10-22)
参考文献数
3

メタボローム研究を中心に薬用・植物知識ベース(機能性、配合)、さらにヒト生理活性を統合的に扱うデータベースKNApSAcK Family DB(http://kanaya.naist.jp/ KNApSAcK_Family/)の構築を進めている。メインウインドウを図1に示す。KNApSAcK Core Systemには、生物種と二次代謝物の関係データ情報が整理されており、現在までに、114,238レコードの生物種-二次代謝物の関係、二次代謝物の総数は51,086種となっている。さらに、アルカロイドにおける生合成経路データベースCobWebを開発した。本データベースを活用し、グラフコンボリューションニューラルネットワークにより、代謝経路既知のアルカロイド化合物を生合成開始物質へ分類したところ、非常に良好な識別結果を得た。