著者
沼田 康平 田中 健一 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第43回ケモインフォマティクス討論会
巻号頁・発行日
pp.1A02, 2020 (Released:2020-11-29)
参考文献数
11

材料開発や医薬品開発の現場では、大量の候補から目的の物性・活性を満たす化合物を探索する。ここで、金銭的・時間的コストの改善を目的として、実験回数の低減が求められている。機械学習による予測モデルを活用して実験回数の低減を実現する方法として、Sequential Model-Based Optimization (SMBO) が存在する。モデルとして用いられる既存手法は外挿の予測に適していない一方で、化合物探索においては、既存のデータから離れた物性・性能を達成するために外挿性が求められる。そこで本研究では、外挿に対応可能な非線形回帰手法、Stochastic Threshold Model Trees (STMT) を提案し、SMBOに適用することで効率的な化合物探索を目指した。STMTに対して新たな獲得関数を適用することで、検証に用いたデータセットについて、その探索性能が既存手法よりも優れていることを示した。また、各手法の探索過程について可視化を行い、提案手法が効率的な探索を行えることを確認した。
著者
井上 貴央 田中 健一 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第43回ケモインフォマティクス討論会
巻号頁・発行日
pp.1A12, 2020 (Released:2020-11-29)
参考文献数
5

創薬や材料開発では, 所望の性質を持つ新規有機分子の効率的な探索手法が求められている. 定量的構造物性相関モデルとしてグラフニューラルネットワーク (GNN) と呼ばれる深層モデルを用いることで, 既存の特徴抽出手法を用いるよりも良い予測性能で, 候補構造のバーチャルスクリーニングができる. しかし, 先行研究では学習に多量の化学構造データを利用しており, 興味のある構造・物性データが多量に集まりにくい分子設計の現場では, 十分な予測性能が得られない可能性がある. 本研究では, Message Passing Neural Network (MPNN) と呼ばれるGNNモデルの中で特徴ベクトルに摂動を加えることでグラフデータの拡張を行うPerturbating MPNN (PMPNN) を設計した. QM9データセットでMPNNとの比較を行い, 提案手法の有効性を検証し, 予測に対する摂動の効果を考察した. また, データ拡張により約半数のデータセットでも元と同等の予測性能が得られ, 少量のグラフデータでもうまく特徴抽出できると示唆された.
著者
佐藤 彰准 宮尾 知幸 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第43回ケモインフォマティクス討論会
巻号頁・発行日
pp.1A04, 2020 (Released:2020-11-29)
参考文献数
7

定量的構造活性相関(QSAR)と定量的構造物性相関(QSPR)モデルは、化学構造から生物活性や分子物性を定量的に予測する。通常、分子構造のトポロジカル情報が利用されている(2次元分子表現、2D記述子)。しかし、分子は三次元空間に存在するため、構造情報が重要であると考えられる。多様な化合物に適用可能な3次元分子表現(3D記述子)として、被験分子と参照分子との類似性を示す方法が提案されている。本研究では、この3D記述子をQSAR/QSPRモデリング(回帰タスク)に導入した。さらに、3D記述子の2D記述子と比較し、訓練データの多様性の観点から、3D記述子のメリットを検討した。その結果、量子力学に基づく物性予測では、3D記述子の方が2D記述子よりも優れていることがわかった。また、特定の生物学的標的に対する低分子の活性を予測する課題では、訓練データやテストデータの多様性に関わらず、2種類の表現法による性能の差に一貫した傾向は見られなかった。
著者
中原 真希 向田 志保 岩壁 幸市
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第43回ケモインフォマティクス討論会
巻号頁・発行日
pp.1A05, 2020 (Released:2020-11-29)
参考文献数
9

機械学習を活用した化合物構造の最適化では、高精度なモデルを構築・予測することに加えモデルから材料開発に適用できる新たな知見を得ることも重要である。これまでに、ディープラーニングを用いて化合物の予測根拠を可視化する手法が報告されているが、ディープラーニングでの解析が困難な少数データにも適用できる手法の開発も求められている。本発表では、記述子にフィンガープリントを用いた機械学習モデルから、各部分構造の寄与を部分構造の広がりを考慮した上で統合し、ターゲット分子上に可視化する手法を提案する。また、公開データに対して提案手法を適用し、既知の化学的知見と比較して妥当な予測根拠が得られたことを示す。さらに、提案手法を共重合体の最適化に用いた結果を報告する。