著者
高野 森乃介 金子 弘昌
出版者
日本コンピュータ化学会
雑誌
Journal of Computer Chemistry, Japan (ISSN:13471767)
巻号頁・発行日
vol.18, no.2, pp.115-121, 2019 (Released:2019-08-16)
参考文献数
25

本研究ではポリマー物性として屈折率 (refractive index, RI) およびガラス転移温度 (glass transition temperature, Tg) を対象にして,モノマーの化学構造から計算される構造記述子 X とそのモノマーを重合して得られるポリマーの物性 y との間で,高分子データベースを用いて物性推定モデルを構築し,構築されたモデルを用いて高い RI かつ高い Tg をもつポリマーを重合できると考えられる新規モノマー構造の設計を行った.モノマー構造の前処理方法・構造記述子・回帰分析手法を検討したところ,RDKit で構造記述子を計算し,support vector regression で回帰モデルを構築したときに,推定性能の良好な RI および Tg 推定モデルが得られた.RI と Tg がともに高いポリマーを達成するモノマーを設計するため,breaking of retrosynthetically interesting chemical substructure (BRICS) により仮想的な化学構造を生成し,モデルの適用範囲により推定値の信頼性を評価した後に,モデルを用いて RI および Tg を推定した.その結果,多様な化学構造が得られ,中には良好な RI および Tg の推定値をもつ化学構造が存在することを確認した.提案手法により複数の目標物性のある高分子材料の開発が促進することを期待する.
著者
佐藤 圭悟 金子 弘昌
出版者
日本コンピュータ化学会
雑誌
Journal of Computer Chemistry, Japan (ISSN:13471767)
巻号頁・発行日
vol.18, no.4, pp.187-193, 2019 (Released:2020-01-28)
参考文献数
20

定量的構造活性相関や定量的構造物性相関では,それぞれ化合物の活性・物性 y と化学構造の特徴を数値した分子記述子 x との間の関係を定量的にモデル化する.回帰モデルの予測性能を向上させるため,アンサンブル学習では複数のサブモデルを構築し,サブモデルからの y の予測値を統合して最終的な y の予測値を計算する.各サブモデルの適用範囲 (applicability domain, AD) を考慮することで,AD 内のサブモデルのみ用いてアンサンブル学習における予測性能が向上することは確認されているが,x が異なるサブデータセット間で AD の比較はできず,新しいサンプルごとにサブモデルを選択したり重み付けしたりして y の値を予測することはできなかった.そこで本研究では AD の指標の 1 つである similarity-weighted root-mean-square distance (wRMSD) に着目し,wRMSD に基づいてサブモデルの重み付けを行う wRMSD-based AD considering ensemble learning (WEL) を開発した.wRMSD は y のスケールであるため x の異なるサブモデル間で AD の比較ができ,wRMSD に基づいて各サブモデルからの y の予測値に重み付けすることで,予測値の信頼性の高いサブモデルほど重みを大きくして予測することが可能となる.水溶解度・毒性・薬理活性それぞれが測定された 3 つの化合物データセットを用いた解析をしたところ,WEL を用いることで従来のアンサンブル学習法と比較して AD が広がり予測性能が向上することを確認した.WEL の Python コードは https://github.com/hkaneko1985/wel から利用可能である.
著者
金子 弘昌 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.28-31, 2015 (Released:2015-10-01)
参考文献数
16

本発表では回帰分析におけるモデルの精度およびモデルの適用範囲を議論の対象とする。一般的にはモデルのオーバーフィッティングを避けるようにしてモデルは構築される。しかしモデルがオーバーフィットした場合、もちろんそのモデルの適用範囲は狭くなるが、適用範囲内であれば精度良く予測可能なモデルといえる。今回は水溶解度データを使用してモデルの適用範囲を考慮に入れたモデルの性能の比較を行った。非線形の回帰モデルを構築する手法であるsupport vector regressionのハイパーパラメータを変化させてモデルを構築し、それぞれ予測性能を評価するとともにモデルの適用範囲を設定した。モデルの適用範囲はデータ密度に基づくものである。解析の結果、モデルのオーバーフィッティング自体が問題ではなく、オーバーフィットしたモデルでも適切にモデルの適用範囲を設定することでその範囲内であれば精度良く予測可能であることを示した。
著者
武田 俊一 金子 弘昌 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.100-103, 2015 (Released:2015-10-01)
参考文献数
12

新薬を開発するために新薬となる可能性の高い多様な構造からなるライブラリを構築する手法の開発が求められている。我々はそのような手法として化学空間上の任意の領域に構造を多数生成する手法であるde novo design algorithm for exploring chemical space (DAECS)に注目し、その改良を行った。DAECSはリガンドデータで規定された部分空間上の特定の領域に存在する構造のみを生成することができる。しかしDAECSでは多様性の高い構造を生成することと活性値以外の性質を考慮することができない。本研究ではこの問題を解決するために部分構造を用いた構造変化及び化学空間上のドラッグライクネス分布の可視化を用いた領域選択を導入した。GVKのデータベースより取得したヒトalpha2Aアドレナリン受容体に対するリガンド活性データを用いて手法の優位性を確認したところ、ドラッグライクネスを考慮したうえで高い活性が期待できる構造を多様に生成できることを確認できた。
著者
田中 健一 金子 弘昌 長阪 匡介 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.52-55, 2015 (Released:2015-10-01)
参考文献数
6

化学工学プロセスにおいて実時間測定が困難な変数の値の推定にソフトセンサーが広く利用されている。しかし、触媒の劣化や製造銘柄の変更等に伴い説明変数Xと目的変数yとの関係が変化した場合、変化前のデータから構築されたソフトセンサーでは変化後の予測が困難となる。この問題はソフトセンサーモデルの劣化と呼ばれ、対応策として各種適応型ソフトセンサーモデルが提案されている。本研究では適応型ソフトセンサーモデルの中でJust-In-Time (JIT) モデルの予測精度改善を目指す。JITモデルはクエリのXの値が類似しているデータを選択、もしくは類似度の高いデータに大きな重みを与えて構築されるため、Xの値は類似しているがyの値が異なるデータが存在する際に不適切な回帰モデルとなる。本研究では、Xの全ての領域においてより新しい状態のデータのみを選別したJIT用データベースの管理手法およびJIT用データベースを用いた回帰モデル構築手法を提案する。
著者
宮尾 知幸 金子 弘昌 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.36-39, 2015 (Released:2015-10-01)
参考文献数
6

Inverse-QSPR とはQSPR モデルを反対方向に解析することにより、望ましい物性値を持つ化学構造を生成する手法である。目的変数: y の値に対応する記述子: x の情報をモデルの逆解析により取得し、記述子の情報から化学構造を生成する。発表者らは以前、y を所与とした際のxの事後確率密度関数を導出することにより、効率的にinverse-QSPR 解析が行えることを示した。しかしその際に用いることができる回帰手法は線形重回帰モデルのみであり、非線形性を持つデータに手法を適応することができなかった。本発表では、x の事前分布で規定されたクラスタ毎に回帰モデルを設定することで、擬似的に非線形性を表現する手法と、Gaussian Mixture Regressionによる手法を検討した。ケーススタディとしてシミュレーションデータに対して両手法を適用した結果、非線形を示すデータに対して、両手法は妥当な形状のx の事後分布を生成することができた。