著者
加藤 涼太 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P12, 2019 (Released:2019-10-22)
参考文献数
7

化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、多くの記述子の中から最適な組合せを見つけなければならず、その中に予測に必要な情報が十分に含まれているか分からないという問題もある。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号および分子のグラフ構造を入力とし、Graph Convolutional Neural Network(GCNN)を用いた予測手法を開発した。記述子を用いる手法と比較した結果、予測タスクによって提案手法が勝る場合も劣る場合もあった。その原因としてモデルの表現力の不足が考えられるため、入力方法やモデル構成を改良することで性能が向上すると考えられる。
著者
小寺 正明
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.2Y05, 2018 (Released:2018-10-26)
参考文献数
10

代謝産物とその代謝経路に関する我々の知識は、天然物のほんの一部に過ぎない。既知酵素のリストであるIUBMB Enzyme List は参照経路に基づく代謝経路再構築の基礎である。ところがこのストラテジーは生物種固有の天然物生合成経路や、環境汚染物質の生分解経路には本質的に向いていない。近年私は代謝経路のde novo再構築として、新規化合物を生成するアプローチとは別に、機械学習を用いて既知化合物間を酵素反応でつなぐアプローチを開発した。また、その反応を触媒する酵素の予測として、化学構造からのECサブサブクラス予測手法と、化学構造からの酵素タンパク質予測手法を開発した。これらの研究は有機合成戦略の問題と類似した問題であり共通部分も多いが、利用可能な情報や、取ることができる戦略などの違いがあるのでそれを理解することが大変重要である。
著者
山本 寛人 田中 健一 山下 俊介 浮田 昌一 中野 博史 白沢 楽 冨谷 茂隆 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P19, 2019 (Released:2019-10-22)
参考文献数
4

電子エネルギー損失分光法(EELS)から得られたスペクトルデータの解析手法について報告する。EELSは電子線を試料に照射し、透過した電子線に磁場をかけて分光し、エネルギー損失から試料の状態を推定する分析手法である。提案手法では、EELSスペクトルデータに2種類の前処理を適用し、主成分分析による解析を行った。ドライエッチング時のダメージの状態把握および、GaInN量子井戸におけるインジウム含有量の推定結果について報告する。
著者
加藤 涼太 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.1P02, 2018 (Released:2018-10-26)
参考文献数
10

化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、その中に予測に必要な情報が含まれない可能性や、3次元構造の考慮が難しいという問題が挙げられる。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号を入力とする統計手法を開発した。前処理で座標系の統一等を行った各原子の座標値と原子番号を再帰型ニューラルネットワーク(RNN)の入力として用いモデルを構築した。 オクタノール水分配係数に関して、記述子を用いる既存の手法と比較し、提案手法の予測精度が優れていることを確認した。今後、データセットの形式による影響の除去、複数の立体配座の考慮により、より汎用な手法になると期待される。
著者
菅原 悠樹 小寺 正明 田中 健一 中野 博史 浮田 昌一 白沢 楽 冨谷 茂隆 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.2C08, 2018 (Released:2018-10-26)
参考文献数
8

蛍光物質は液晶ディスプレイや照明、創薬の動物実験などの広い用途で用いられており、重要性が高まってきている。蛍光を示す化合物のなかでもBODIPYと呼ばれる二置換ホウ素原子とジピロメテンの複合体を分子骨格に有する化合物は、シャープなスペクトルを持ち、溶媒環境による波長変化の影響が小さく、量子収率が安定して高いので実用性が期待される。本研究では望ましい物理的性質を持つ新しい候補BODIPY化合物を迅速かつ正確に予測するモデルを提案する。提案モデル(MAE = 17.34、R2 = 0.90)は、量子計算モデル(MAE = 24.71、R2 = 0.84)と比較して、非常に正確な性能を示した。提案モデルが、吸収波長の予測に重要と判断した記述子には化学の知見と一致するものもあり、提案モデルの信頼性を示している。しかし提案されたモデルは溶媒情報を適切に活用できておらず、今後のさらなる改良が期待される。
著者
陳 嘉修 田中 健一 小寺 正明 船津 公人
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
ケモインフォマティクス討論会予稿集
巻号頁・発行日
pp.2B10, 2018 (Released:2018-10-26)
参考文献数
9

In the chemical industry, designing novel compounds with desired characteristics is a bottleneck in the chemical manufacturing development. Quantitative structure–property relationship (QSPR) modeling with machine learning techniques can move the chemical design forward to work more efficiently. A challenge of current QSPR models is the lack of interpretability operating black-box models. Hence, interpretable machine learning methods will be essential for researchers to understand, trust, and effectively manage a QSPR model. Global interpretability and local interpretability are two typical ways to define the scope of model interpretation. Global interpretation is information on structure−property relationships for a series of compounds, helping shed some light on mechanisms of property of compounds. Local interpretability gives information about how different structural motifs of a single compound influence the property. In this presentation, we focus on the designs of interpretable frameworks for typical machine learning models. Two different approaches based on ensemble learning and deep learning to interpretable models will be presented to achieve global interpretation and local interpretation respectively which are equal to or even better than typical trustworthy models. We believe that trust in QSPR models can be enhanced by interpretable machine learning methods that conform to human knowledge and expectations.
著者
井上 貴央 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.2B11, 2018 (Released:2018-10-26)
参考文献数
7

近年、機能性有機分子の開発が盛んに行われている。開発の効率化のための手段として構造生成器が挙げられる。目的物性を有する構造を生成するために設計された構造生成器DAECSに対し、本研究では生成構造の多様化に取り組んだ。構造生成の起点となる構造を生成構造群から選ぶ際に、範囲の制限とクラスタリングを組み合わせることで、生成構造群の多様性の向上を目指した。提案手法を評価するため、ヒスタミンH1受容体に対するリガンド構造の生成を行い、生成構造の分布と生成構造群の任意の2構造間のTanimoto距離の平均を確認した。既往手法と比べて提案手法の方が、生成構造群の分布は散らばっており、平均Tanimoto距離が大きいため、提案手法の生成構造群の多様性が示唆された。また、提案手法の計算効率が良いことを理論的に示した。しかし、ターゲットに近い構造が生成されにくく、生成構造が初期構造に依存するという課題が見出された。
著者
鈴木 天音 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.1P04, 2018 (Released:2018-10-26)
参考文献数
8

所望の活性を持った化学構造を得るinverse-QSARはケモインフォマティクス分野における主要なタスクのひとつである。近年では深層生成モデルを利用した構造生成手法が提案され始めているが、それらはいずれも多量のデータを必要とするものであった。創薬の現場においては、必要としているタンパクに対する活性データが大量に得られている状況は稀である。そこで本研究では多量の教師なしデータと少量の教師付きデータを組み合わせて学習を行う半教師付き学習を構造生成手法に応用した。構造生成手法の中で用いている活性予測の性能評価をalpha2Aアドレナリン受容体に対するリガンドデータについて行い、既往の手法に対して優れた予測精度を持つことを確認した。実際の構造生成、およびその生成結果の検証が今後の課題である。
著者
佐方 冬彩子 小寺 正明 田中 健一 中野 博史 浮田 昌一 白沢 楽 冨谷 茂隆 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.19, pp.7-18, 2018 (Released:2018-09-27)
参考文献数
23
被引用文献数
5

材料開発において未知の材料を効率的に探索するには、組成の情報のみから物性を予測する手法の開発が必要である。本研究では、無機材料の組成式を記述子に変換して説明変数とし、物性との関係を表す回帰モデルを構築した。さまざまな物性の予測に対応できるよう情報を損失なく変換するために、組成式中の各元素の個数や割合を表す記述子、原子量、原子半径、電気陰性度といった元素の物理学的パラメータを使用した記述子など、合計387個の記述子を提案した。ケーススタディとして、これらの記述子を用いてRandom Forestによるモデルを構築し、結晶の生成エネルギー、密度、屈折率という3種類の物性の予測を行って R2 値がそれぞれ 0.970、0.977、0.766という結果を得た。また、統計的に選択されそれぞれの物性予測モデルの構築に寄与した記述子が、化学的知見から考えても妥当なものであったことからこの手法の有用性を確認した。
著者
小寺 正明
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.10-11, 2015 (Released:2015-10-01)
参考文献数
10

化学情報学の生命科学への応用は薬学研究が主流であるが、生命情報学との融合により、さらに幅広い研究への発展が期待される。私の興味の中心はオミックスと呼ばれる生命科学ビッグデータであり、未だ隔たりの大きい二つのオミックス、すなわち遺伝子系オミックスと化合物系オミックスを結びつける融合的研究である。例として、昆虫と植物など異種生物間の化学相互作用ネットワークの群集生態学的視点による解析を紹介したい。