著者
加藤 涼太 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P12, 2019 (Released:2019-10-22)
参考文献数
7

化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、多くの記述子の中から最適な組合せを見つけなければならず、その中に予測に必要な情報が十分に含まれているか分からないという問題もある。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号および分子のグラフ構造を入力とし、Graph Convolutional Neural Network(GCNN)を用いた予測手法を開発した。記述子を用いる手法と比較した結果、予測タスクによって提案手法が勝る場合も劣る場合もあった。その原因としてモデルの表現力の不足が考えられるため、入力方法やモデル構成を改良することで性能が向上すると考えられる。
著者
宮尾 知幸 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.1A06, 2018 (Released:2018-10-26)
参考文献数
7

三次元リガンド情報に基づきヴァーチャルスクリーニング(VS)を行う際、標的マクロ分子との結合状態におけるリガンド分子の立体配座が重要な役割を果たすと考えられる。また、類似性検索に基づくVSでは、活性化合物の類似構造のアンサンブルを検索クエリとして利用する手法が提案されている。本発表では、リガンドベースVSにおいて、活性化合物のコンフォメーションが重要なのか否かを判断するためのベンチマーク計算、並びに、三次元リガンド構造に基づくVSにおけるアンサンブル効果を検証した結果を報告する。コンフォメーションはそれほど重要ではなく、アンサンブル効果は三次元リガンド構造に基づくスクリーニングであっても有効であるとの結果となった。
著者
沼田 康平 田中 健一 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第43回ケモインフォマティクス討論会
巻号頁・発行日
pp.1A02, 2020 (Released:2020-11-29)
参考文献数
11

材料開発や医薬品開発の現場では、大量の候補から目的の物性・活性を満たす化合物を探索する。ここで、金銭的・時間的コストの改善を目的として、実験回数の低減が求められている。機械学習による予測モデルを活用して実験回数の低減を実現する方法として、Sequential Model-Based Optimization (SMBO) が存在する。モデルとして用いられる既存手法は外挿の予測に適していない一方で、化合物探索においては、既存のデータから離れた物性・性能を達成するために外挿性が求められる。そこで本研究では、外挿に対応可能な非線形回帰手法、Stochastic Threshold Model Trees (STMT) を提案し、SMBOに適用することで効率的な化合物探索を目指した。STMTに対して新たな獲得関数を適用することで、検証に用いたデータセットについて、その探索性能が既存手法よりも優れていることを示した。また、各手法の探索過程について可視化を行い、提案手法が効率的な探索を行えることを確認した。
著者
金子 弘昌 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.28-31, 2015 (Released:2015-10-01)
参考文献数
16

本発表では回帰分析におけるモデルの精度およびモデルの適用範囲を議論の対象とする。一般的にはモデルのオーバーフィッティングを避けるようにしてモデルは構築される。しかしモデルがオーバーフィットした場合、もちろんそのモデルの適用範囲は狭くなるが、適用範囲内であれば精度良く予測可能なモデルといえる。今回は水溶解度データを使用してモデルの適用範囲を考慮に入れたモデルの性能の比較を行った。非線形の回帰モデルを構築する手法であるsupport vector regressionのハイパーパラメータを変化させてモデルを構築し、それぞれ予測性能を評価するとともにモデルの適用範囲を設定した。モデルの適用範囲はデータ密度に基づくものである。解析の結果、モデルのオーバーフィッティング自体が問題ではなく、オーバーフィットしたモデルでも適切にモデルの適用範囲を設定することでその範囲内であれば精度良く予測可能であることを示した。
著者
宮尾 知幸 荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第30回情報化学討論会 京都
巻号頁・発行日
pp.JP20, 2007 (Released:2007-11-08)
参考文献数
4

化学データは一般に多次元であるため、データを把握するためには次元削減による可視化が必要となる。代表的な手法としてPCAや自己組織化マップが知られているが、近年Bishopにより確率モデルを用いたgenerative topographic mapping (GTM)が提案された。そこで本研究では、写像の滑らかさの指標を導入し、SOMとGTMにおける写像の特徴を比較した。
著者
成瀬 一郎 後藤 知行 山内 健二 船津 公人
出版者
SOCIETY OF ENVIRONMENTAL SCIENCE, JAPAN
雑誌
環境科学会誌 = Environmental science (ISSN:09150048)
巻号頁・発行日
vol.14, no.2, pp.231-237, 2001-03-30
被引用文献数
1

現状の社会構造を持続発展可能なものへと転換させるためには,物質循環を機軸とする社会システムの構築が必要不可欠である。本研究ではその具現化方策の一つとして,各種産業から発生する廃棄物を未利用物質と位置付け,必要であれば最適な再資源化技術を適用することにより,それを他の産業における原料として利用するという異業種間ネットワークの構築によって,地域におけるゼロエミッション化を実現する方法論を提案する。具体的には,アンケート調査によって各事業所および廃棄物中間・最終処理業者における原料,製品,廃棄物の量と質に関するデータベース化や未利用物質を原料へ転換する再資源化技術に関するデータベース化を行い,これらを入力情報としてネットワークシミュレータにより解析を行う。本報では,豊橋市および東三河地域を対象地域として,農業・漁業・鉱業・建設業・製造業の各事業所1,139社,廃棄物中間・最終処理業者64社についてアンケート調査を行い,それぞれ236社(回収率:20.7%),32社(回収率:50%)の回答結果からデータベースを作成した。また,文献調査等により,総数383件の再資源化技術情報に関するデータベースも作成した。さらに一例として,作成したデータベースより廃ポリエチレンと燃え殻を入力情報としてネットワークシミュレータによる現状での地域内物質循環について解析を行った。次に得られた結果から,適当な再資源化技術をデータベースより抽出し,仮想的に組み入れた場合の物質循環についても検討した。結果として,各種データベース作成とそれを利用したネットワークシミュレー夕による解析は,最適な地域物質循環ネットワーク構築のための有効なツールになるものと考える。
著者
山城 直也 宮尾 知幸 荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.10, pp.96-103, 2009 (Released:2009-08-20)
参考文献数
16
被引用文献数
5 1

大気中の二酸化炭素濃度の上昇を抑制するための手法として、二酸化炭素地中貯留技術が注目されている。しかし、その実用化のためにはコストの高さが大きな課題となっており、特に二酸化炭素を分離回収する過程におけるコストが全体の大部分を占めると試算されている。そこで本研究ではアルカノールアミン溶液を用いた化学吸収法による二酸化炭素の分離回収に着目し、より優れたアルカノールアミンの設計を目指した。アルカノールアミン溶液は低温下で二酸化炭素を吸収し、加熱により吸収した二酸化炭素を放散する性質があり、二酸化炭素の分離回収に利用することが可能である。吸収液に求められる性質として、二酸化炭素を放散させるために必要な熱量が少なく、吸収速度が速いことが挙げられる。そこで、これらの要求を満たすような吸収液の開発を目的とした。まず、反応熱、吸収速度の実験データを基に、アミンの構造情報からこれらを予測する回帰モデルをPLS (partial least squares)法、GAPLS (genetic algorithm based-PLS)法を用いて構築した。その結果、GAPLS法では反応熱に対してR2=0.999、Q2=0.990、吸収速度に対してR2=0.957、Q2=0.914となり、予測精度の高いモデルが構築された。このモデルを用いて、コンピュータ内で仮想的に発生させた新規構造の物性値を予測することで、有望な物性を持つと予想される吸収液の探索を行った。その結果、実験データよりも良好な物性を示すと考えられる候補構造が複数得られた。
著者
前田 祐希 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.12, pp.1-10, 2011 (Released:2011-02-16)
参考文献数
18

光電極を用いた水分解による水素製造法は二酸化炭素をほとんど副生せずに太陽光エネルギーを水素に変換するための方法であり、その活用が期待されている。しかし、光電極に用いる光触媒に関する研究は盛んに行われている一方、反応器に関する研究はほとんどなされていない。そこで本研究では、光電極による水素製造装置を設計することを目的とした。反応器において高効率な反応を達成するためには、反応器の構造パラメータを反応に対して適切に決定する必要がある。このような反応器の最適設計問題に対して、流体シミュレーションが有効な手段の一つとなる。しかし、流体の流れが反応に有利な状態を形成するように反応器の構造を決定するためには、多くのシミュレーション回数が要求される。特に一回当たりの計算時間が長いシミュレーションを用いる場合、その高い計算コストが障害となる。そこで本研究では、シミュレーション結果を統計解析し、構築した統計モデル(メタモデル)を利用する事でシミュレーション回数を抑制しながら反応器の最適設計を行うことを試みた。本研究で解析の対象である光電極による水素製造装置は、効率的な反応を達成するために最適化を行うべき応答因子が複数存在し、それぞれの因子がトレードオフの関係にあるという特徴を持っている。そのため、反応に有利な構造パラメータを決定する事は困難と考えられていた。しかし、メタモデルの構築と遺伝的アルゴリズムによる多目的最適化により、100回の流体シミュレーションから構造パラメータのパレート最適解を導出した。またこの解析により、統計手法による流体シミュレーションの反応器設計への効率的な適用の可能性を示した。
著者
井上 貴央 田中 健一 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第43回ケモインフォマティクス討論会
巻号頁・発行日
pp.1A12, 2020 (Released:2020-11-29)
参考文献数
5

創薬や材料開発では, 所望の性質を持つ新規有機分子の効率的な探索手法が求められている. 定量的構造物性相関モデルとしてグラフニューラルネットワーク (GNN) と呼ばれる深層モデルを用いることで, 既存の特徴抽出手法を用いるよりも良い予測性能で, 候補構造のバーチャルスクリーニングができる. しかし, 先行研究では学習に多量の化学構造データを利用しており, 興味のある構造・物性データが多量に集まりにくい分子設計の現場では, 十分な予測性能が得られない可能性がある. 本研究では, Message Passing Neural Network (MPNN) と呼ばれるGNNモデルの中で特徴ベクトルに摂動を加えることでグラフデータの拡張を行うPerturbating MPNN (PMPNN) を設計した. QM9データセットでMPNNとの比較を行い, 提案手法の有効性を検証し, 予測に対する摂動の効果を考察した. また, データ拡張により約半数のデータセットでも元と同等の予測性能が得られ, 少量のグラフデータでもうまく特徴抽出できると示唆された.
著者
金 泰亨 金子 弘昌 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集
巻号頁・発行日
vol.2012, pp.2C1a, 2012

蒸留プロセスで重要な問題である共沸現象について設計段階から考慮する必要がある。分子間力による混合物の非理想性は共沸の主要な原因とされており、電荷情報から得られる分子間力に関する変数は共沸予測の重要な情報になると考えられる。今回は量子化学計算による分子の電荷情報を統計モデル構築の際の説明変数として用いることで共沸予測モデルの開発を行った。提案手法により未知の混合物の共沸を精度良く予測できると期待される。
著者
佐藤 彰准 宮尾 知幸 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第43回ケモインフォマティクス討論会
巻号頁・発行日
pp.1A04, 2020 (Released:2020-11-29)
参考文献数
7

定量的構造活性相関(QSAR)と定量的構造物性相関(QSPR)モデルは、化学構造から生物活性や分子物性を定量的に予測する。通常、分子構造のトポロジカル情報が利用されている(2次元分子表現、2D記述子)。しかし、分子は三次元空間に存在するため、構造情報が重要であると考えられる。多様な化合物に適用可能な3次元分子表現(3D記述子)として、被験分子と参照分子との類似性を示す方法が提案されている。本研究では、この3D記述子をQSAR/QSPRモデリング(回帰タスク)に導入した。さらに、3D記述子の2D記述子と比較し、訓練データの多様性の観点から、3D記述子のメリットを検討した。その結果、量子力学に基づく物性予測では、3D記述子の方が2D記述子よりも優れていることがわかった。また、特定の生物学的標的に対する低分子の活性を予測する課題では、訓練データやテストデータの多様性に関わらず、2種類の表現法による性能の差に一貫した傾向は見られなかった。
著者
柴山 翔二郎 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.2A01, 2019 (Released:2019-10-22)
参考文献数
13

機能性ポリマーの新しい構造を実験で探索するのには限界がある。そこでケモインフォマティクスを利用して材料設計を行うが、新規材料の原料は市販されていないことが多く一般にデータが少ない。本研究ではポリマーを原料分子の記述子と組成比の線形和で表現し回帰モデルに線形モデルを選定することで、39サンプルのポリマーデータからモデル構築した。原料分子の記述子として文献値でなく分子構造に対して計算される分子記述子を使用することで、構造生成にも適用しうるモデルの構築を目指した。構築したモデルを利用して目的物性値に近づけるように原料組成比を最適化し、また、原料の構造生成を行った。フラグメント記述子で原料を表現したため、構造生成にあたりmol2vecを用いてフラグメント記述子の分散表現を活用した。原料組成比を最適化した結果を実際に合成したところデータになかった組み合わせにおいて目的物性値が最も目標値に近づいた。本発表では方法論に焦点を当てて紹介する。
著者
山本 寛人 田中 健一 山下 俊介 浮田 昌一 中野 博史 白沢 楽 冨谷 茂隆 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P19, 2019 (Released:2019-10-22)
参考文献数
4

電子エネルギー損失分光法(EELS)から得られたスペクトルデータの解析手法について報告する。EELSは電子線を試料に照射し、透過した電子線に磁場をかけて分光し、エネルギー損失から試料の状態を推定する分析手法である。提案手法では、EELSスペクトルデータに2種類の前処理を適用し、主成分分析による解析を行った。ドライエッチング時のダメージの状態把握および、GaInN量子井戸におけるインジウム含有量の推定結果について報告する。
著者
岡野 圭央 荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第30回情報化学討論会 京都
巻号頁・発行日
pp.JP22, 2007 (Released:2007-11-08)
参考文献数
11

一般に不斉合成反応では反応中間体のエネルギー差は非常に小さく、理論計算による遷移状態探索から立体選択性を定量的に予測することは難しい。また、大きな分子構造では膨大な計算時間がかかるという問題点もある。そこで本研究では、オレフィンの不斉合成触媒であるサレンマンガン錯体について、量子計算による触媒の最安定構造を用いた構造活性相関モデルからの立体選択性の定量的な予測を行った。
著者
加藤 涼太 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.1P02, 2018 (Released:2018-10-26)
参考文献数
10

化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、その中に予測に必要な情報が含まれない可能性や、3次元構造の考慮が難しいという問題が挙げられる。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号を入力とする統計手法を開発した。前処理で座標系の統一等を行った各原子の座標値と原子番号を再帰型ニューラルネットワーク(RNN)の入力として用いモデルを構築した。 オクタノール水分配係数に関して、記述子を用いる既存の手法と比較し、提案手法の予測精度が優れていることを確認した。今後、データセットの形式による影響の除去、複数の立体配座の考慮により、より汎用な手法になると期待される。
著者
菅原 悠樹 小寺 正明 田中 健一 中野 博史 浮田 昌一 白沢 楽 冨谷 茂隆 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.2C08, 2018 (Released:2018-10-26)
参考文献数
8

蛍光物質は液晶ディスプレイや照明、創薬の動物実験などの広い用途で用いられており、重要性が高まってきている。蛍光を示す化合物のなかでもBODIPYと呼ばれる二置換ホウ素原子とジピロメテンの複合体を分子骨格に有する化合物は、シャープなスペクトルを持ち、溶媒環境による波長変化の影響が小さく、量子収率が安定して高いので実用性が期待される。本研究では望ましい物理的性質を持つ新しい候補BODIPY化合物を迅速かつ正確に予測するモデルを提案する。提案モデル(MAE = 17.34、R2 = 0.90)は、量子計算モデル(MAE = 24.71、R2 = 0.84)と比較して、非常に正確な性能を示した。提案モデルが、吸収波長の予測に重要と判断した記述子には化学の知見と一致するものもあり、提案モデルの信頼性を示している。しかし提案されたモデルは溶媒情報を適切に活用できておらず、今後のさらなる改良が期待される。
著者
陳 嘉修 田中 健一 小寺 正明 船津 公人
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
ケモインフォマティクス討論会予稿集
巻号頁・発行日
pp.2B10, 2018 (Released:2018-10-26)
参考文献数
9

In the chemical industry, designing novel compounds with desired characteristics is a bottleneck in the chemical manufacturing development. Quantitative structure–property relationship (QSPR) modeling with machine learning techniques can move the chemical design forward to work more efficiently. A challenge of current QSPR models is the lack of interpretability operating black-box models. Hence, interpretable machine learning methods will be essential for researchers to understand, trust, and effectively manage a QSPR model. Global interpretability and local interpretability are two typical ways to define the scope of model interpretation. Global interpretation is information on structure−property relationships for a series of compounds, helping shed some light on mechanisms of property of compounds. Local interpretability gives information about how different structural motifs of a single compound influence the property. In this presentation, we focus on the designs of interpretable frameworks for typical machine learning models. Two different approaches based on ensemble learning and deep learning to interpretable models will be presented to achieve global interpretation and local interpretation respectively which are equal to or even better than typical trustworthy models. We believe that trust in QSPR models can be enhanced by interpretable machine learning methods that conform to human knowledge and expectations.
著者
井上 貴央 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.2B11, 2018 (Released:2018-10-26)
参考文献数
7

近年、機能性有機分子の開発が盛んに行われている。開発の効率化のための手段として構造生成器が挙げられる。目的物性を有する構造を生成するために設計された構造生成器DAECSに対し、本研究では生成構造の多様化に取り組んだ。構造生成の起点となる構造を生成構造群から選ぶ際に、範囲の制限とクラスタリングを組み合わせることで、生成構造群の多様性の向上を目指した。提案手法を評価するため、ヒスタミンH1受容体に対するリガンド構造の生成を行い、生成構造の分布と生成構造群の任意の2構造間のTanimoto距離の平均を確認した。既往手法と比べて提案手法の方が、生成構造群の分布は散らばっており、平均Tanimoto距離が大きいため、提案手法の生成構造群の多様性が示唆された。また、提案手法の計算効率が良いことを理論的に示した。しかし、ターゲットに近い構造が生成されにくく、生成構造が初期構造に依存するという課題が見出された。