著者
加藤 涼太 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P12, 2019 (Released:2019-10-22)
参考文献数
7

化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、多くの記述子の中から最適な組合せを見つけなければならず、その中に予測に必要な情報が十分に含まれているか分からないという問題もある。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号および分子のグラフ構造を入力とし、Graph Convolutional Neural Network(GCNN)を用いた予測手法を開発した。記述子を用いる手法と比較した結果、予測タスクによって提案手法が勝る場合も劣る場合もあった。その原因としてモデルの表現力の不足が考えられるため、入力方法やモデル構成を改良することで性能が向上すると考えられる。
著者
金子 弘昌 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.28-31, 2015 (Released:2015-10-01)
参考文献数
16

本発表では回帰分析におけるモデルの精度およびモデルの適用範囲を議論の対象とする。一般的にはモデルのオーバーフィッティングを避けるようにしてモデルは構築される。しかしモデルがオーバーフィットした場合、もちろんそのモデルの適用範囲は狭くなるが、適用範囲内であれば精度良く予測可能なモデルといえる。今回は水溶解度データを使用してモデルの適用範囲を考慮に入れたモデルの性能の比較を行った。非線形の回帰モデルを構築する手法であるsupport vector regressionのハイパーパラメータを変化させてモデルを構築し、それぞれ予測性能を評価するとともにモデルの適用範囲を設定した。モデルの適用範囲はデータ密度に基づくものである。解析の結果、モデルのオーバーフィッティング自体が問題ではなく、オーバーフィットしたモデルでも適切にモデルの適用範囲を設定することでその範囲内であれば精度良く予測可能であることを示した。
著者
宮尾 知幸 荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第30回情報化学討論会 京都
巻号頁・発行日
pp.JP20, 2007 (Released:2007-11-08)
参考文献数
4

化学データは一般に多次元であるため、データを把握するためには次元削減による可視化が必要となる。代表的な手法としてPCAや自己組織化マップが知られているが、近年Bishopにより確率モデルを用いたgenerative topographic mapping (GTM)が提案された。そこで本研究では、写像の滑らかさの指標を導入し、SOMとGTMにおける写像の特徴を比較した。
著者
成瀬 一郎 後藤 知行 山内 健二 船津 公人
出版者
SOCIETY OF ENVIRONMENTAL SCIENCE, JAPAN
雑誌
環境科学会誌 = Environmental science (ISSN:09150048)
巻号頁・発行日
vol.14, no.2, pp.231-237, 2001-03-30
被引用文献数
1

現状の社会構造を持続発展可能なものへと転換させるためには,物質循環を機軸とする社会システムの構築が必要不可欠である。本研究ではその具現化方策の一つとして,各種産業から発生する廃棄物を未利用物質と位置付け,必要であれば最適な再資源化技術を適用することにより,それを他の産業における原料として利用するという異業種間ネットワークの構築によって,地域におけるゼロエミッション化を実現する方法論を提案する。具体的には,アンケート調査によって各事業所および廃棄物中間・最終処理業者における原料,製品,廃棄物の量と質に関するデータベース化や未利用物質を原料へ転換する再資源化技術に関するデータベース化を行い,これらを入力情報としてネットワークシミュレータにより解析を行う。本報では,豊橋市および東三河地域を対象地域として,農業・漁業・鉱業・建設業・製造業の各事業所1,139社,廃棄物中間・最終処理業者64社についてアンケート調査を行い,それぞれ236社(回収率:20.7%),32社(回収率:50%)の回答結果からデータベースを作成した。また,文献調査等により,総数383件の再資源化技術情報に関するデータベースも作成した。さらに一例として,作成したデータベースより廃ポリエチレンと燃え殻を入力情報としてネットワークシミュレータによる現状での地域内物質循環について解析を行った。次に得られた結果から,適当な再資源化技術をデータベースより抽出し,仮想的に組み入れた場合の物質循環についても検討した。結果として,各種データベース作成とそれを利用したネットワークシミュレー夕による解析は,最適な地域物質循環ネットワーク構築のための有効なツールになるものと考える。
著者
山城 直也 宮尾 知幸 荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.10, pp.96-103, 2009 (Released:2009-08-20)
参考文献数
16
被引用文献数
5 1

大気中の二酸化炭素濃度の上昇を抑制するための手法として、二酸化炭素地中貯留技術が注目されている。しかし、その実用化のためにはコストの高さが大きな課題となっており、特に二酸化炭素を分離回収する過程におけるコストが全体の大部分を占めると試算されている。そこで本研究ではアルカノールアミン溶液を用いた化学吸収法による二酸化炭素の分離回収に着目し、より優れたアルカノールアミンの設計を目指した。アルカノールアミン溶液は低温下で二酸化炭素を吸収し、加熱により吸収した二酸化炭素を放散する性質があり、二酸化炭素の分離回収に利用することが可能である。吸収液に求められる性質として、二酸化炭素を放散させるために必要な熱量が少なく、吸収速度が速いことが挙げられる。そこで、これらの要求を満たすような吸収液の開発を目的とした。まず、反応熱、吸収速度の実験データを基に、アミンの構造情報からこれらを予測する回帰モデルをPLS (partial least squares)法、GAPLS (genetic algorithm based-PLS)法を用いて構築した。その結果、GAPLS法では反応熱に対してR2=0.999、Q2=0.990、吸収速度に対してR2=0.957、Q2=0.914となり、予測精度の高いモデルが構築された。このモデルを用いて、コンピュータ内で仮想的に発生させた新規構造の物性値を予測することで、有望な物性を持つと予想される吸収液の探索を行った。その結果、実験データよりも良好な物性を示すと考えられる候補構造が複数得られた。
著者
柴山 翔二郎 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.2A01, 2019 (Released:2019-10-22)
参考文献数
13

機能性ポリマーの新しい構造を実験で探索するのには限界がある。そこでケモインフォマティクスを利用して材料設計を行うが、新規材料の原料は市販されていないことが多く一般にデータが少ない。本研究ではポリマーを原料分子の記述子と組成比の線形和で表現し回帰モデルに線形モデルを選定することで、39サンプルのポリマーデータからモデル構築した。原料分子の記述子として文献値でなく分子構造に対して計算される分子記述子を使用することで、構造生成にも適用しうるモデルの構築を目指した。構築したモデルを利用して目的物性値に近づけるように原料組成比を最適化し、また、原料の構造生成を行った。フラグメント記述子で原料を表現したため、構造生成にあたりmol2vecを用いてフラグメント記述子の分散表現を活用した。原料組成比を最適化した結果を実際に合成したところデータになかった組み合わせにおいて目的物性値が最も目標値に近づいた。本発表では方法論に焦点を当てて紹介する。
著者
山本 寛人 田中 健一 山下 俊介 浮田 昌一 中野 博史 白沢 楽 冨谷 茂隆 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第42回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.1P19, 2019 (Released:2019-10-22)
参考文献数
4

電子エネルギー損失分光法(EELS)から得られたスペクトルデータの解析手法について報告する。EELSは電子線を試料に照射し、透過した電子線に磁場をかけて分光し、エネルギー損失から試料の状態を推定する分析手法である。提案手法では、EELSスペクトルデータに2種類の前処理を適用し、主成分分析による解析を行った。ドライエッチング時のダメージの状態把握および、GaInN量子井戸におけるインジウム含有量の推定結果について報告する。
著者
岡野 圭央 荒川 正幹 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第30回情報化学討論会 京都
巻号頁・発行日
pp.JP22, 2007 (Released:2007-11-08)
参考文献数
11

一般に不斉合成反応では反応中間体のエネルギー差は非常に小さく、理論計算による遷移状態探索から立体選択性を定量的に予測することは難しい。また、大きな分子構造では膨大な計算時間がかかるという問題点もある。そこで本研究では、オレフィンの不斉合成触媒であるサレンマンガン錯体について、量子計算による触媒の最安定構造を用いた構造活性相関モデルからの立体選択性の定量的な予測を行った。
著者
加藤 涼太 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.1P02, 2018 (Released:2018-10-26)
参考文献数
10

化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、その中に予測に必要な情報が含まれない可能性や、3次元構造の考慮が難しいという問題が挙げられる。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号を入力とする統計手法を開発した。前処理で座標系の統一等を行った各原子の座標値と原子番号を再帰型ニューラルネットワーク(RNN)の入力として用いモデルを構築した。 オクタノール水分配係数に関して、記述子を用いる既存の手法と比較し、提案手法の予測精度が優れていることを確認した。今後、データセットの形式による影響の除去、複数の立体配座の考慮により、より汎用な手法になると期待される。
著者
菅原 悠樹 小寺 正明 田中 健一 中野 博史 浮田 昌一 白沢 楽 冨谷 茂隆 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.2C08, 2018 (Released:2018-10-26)
参考文献数
8

蛍光物質は液晶ディスプレイや照明、創薬の動物実験などの広い用途で用いられており、重要性が高まってきている。蛍光を示す化合物のなかでもBODIPYと呼ばれる二置換ホウ素原子とジピロメテンの複合体を分子骨格に有する化合物は、シャープなスペクトルを持ち、溶媒環境による波長変化の影響が小さく、量子収率が安定して高いので実用性が期待される。本研究では望ましい物理的性質を持つ新しい候補BODIPY化合物を迅速かつ正確に予測するモデルを提案する。提案モデル(MAE = 17.34、R2 = 0.90)は、量子計算モデル(MAE = 24.71、R2 = 0.84)と比較して、非常に正確な性能を示した。提案モデルが、吸収波長の予測に重要と判断した記述子には化学の知見と一致するものもあり、提案モデルの信頼性を示している。しかし提案されたモデルは溶媒情報を適切に活用できておらず、今後のさらなる改良が期待される。
著者
陳 嘉修 田中 健一 小寺 正明 船津 公人
出版者
Division of Chemical Information and Computer Sciences The Chemical Society of Japan
雑誌
ケモインフォマティクス討論会予稿集
巻号頁・発行日
pp.2B10, 2018 (Released:2018-10-26)
参考文献数
9

In the chemical industry, designing novel compounds with desired characteristics is a bottleneck in the chemical manufacturing development. Quantitative structure–property relationship (QSPR) modeling with machine learning techniques can move the chemical design forward to work more efficiently. A challenge of current QSPR models is the lack of interpretability operating black-box models. Hence, interpretable machine learning methods will be essential for researchers to understand, trust, and effectively manage a QSPR model. Global interpretability and local interpretability are two typical ways to define the scope of model interpretation. Global interpretation is information on structure−property relationships for a series of compounds, helping shed some light on mechanisms of property of compounds. Local interpretability gives information about how different structural motifs of a single compound influence the property. In this presentation, we focus on the designs of interpretable frameworks for typical machine learning models. Two different approaches based on ensemble learning and deep learning to interpretable models will be presented to achieve global interpretation and local interpretation respectively which are equal to or even better than typical trustworthy models. We believe that trust in QSPR models can be enhanced by interpretable machine learning methods that conform to human knowledge and expectations.
著者
井上 貴央 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.2B11, 2018 (Released:2018-10-26)
参考文献数
7

近年、機能性有機分子の開発が盛んに行われている。開発の効率化のための手段として構造生成器が挙げられる。目的物性を有する構造を生成するために設計された構造生成器DAECSに対し、本研究では生成構造の多様化に取り組んだ。構造生成の起点となる構造を生成構造群から選ぶ際に、範囲の制限とクラスタリングを組み合わせることで、生成構造群の多様性の向上を目指した。提案手法を評価するため、ヒスタミンH1受容体に対するリガンド構造の生成を行い、生成構造の分布と生成構造群の任意の2構造間のTanimoto距離の平均を確認した。既往手法と比べて提案手法の方が、生成構造群の分布は散らばっており、平均Tanimoto距離が大きいため、提案手法の生成構造群の多様性が示唆された。また、提案手法の計算効率が良いことを理論的に示した。しかし、ターゲットに近い構造が生成されにくく、生成構造が初期構造に依存するという課題が見出された。
著者
宮尾 知幸 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.1A06, 2018 (Released:2018-10-26)
参考文献数
7

三次元リガンド情報に基づきヴァーチャルスクリーニング(VS)を行う際、標的マクロ分子との結合状態におけるリガンド分子の立体配座が重要な役割を果たすと考えられる。また、類似性検索に基づくVSでは、活性化合物の類似構造のアンサンブルを検索クエリとして利用する手法が提案されている。本発表では、リガンドベースVSにおいて、活性化合物のコンフォメーションが重要なのか否かを判断するためのベンチマーク計算、並びに、三次元リガンド構造に基づくVSにおけるアンサンブル効果を検証した結果を報告する。コンフォメーションはそれほど重要ではなく、アンサンブル効果は三次元リガンド構造に基づくスクリーニングであっても有効であるとの結果となった。
著者
鈴木 天音 田中 健一 小寺 正明 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第41回ケモインフォマティクス討論会 熊本
巻号頁・発行日
pp.1P04, 2018 (Released:2018-10-26)
参考文献数
8

所望の活性を持った化学構造を得るinverse-QSARはケモインフォマティクス分野における主要なタスクのひとつである。近年では深層生成モデルを利用した構造生成手法が提案され始めているが、それらはいずれも多量のデータを必要とするものであった。創薬の現場においては、必要としているタンパクに対する活性データが大量に得られている状況は稀である。そこで本研究では多量の教師なしデータと少量の教師付きデータを組み合わせて学習を行う半教師付き学習を構造生成手法に応用した。構造生成手法の中で用いている活性予測の性能評価をalpha2Aアドレナリン受容体に対するリガンドデータについて行い、既往の手法に対して優れた予測精度を持つことを確認した。実際の構造生成、およびその生成結果の検証が今後の課題である。
著者
佐方 冬彩子 小寺 正明 田中 健一 中野 博史 浮田 昌一 白沢 楽 冨谷 茂隆 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.19, pp.7-18, 2018 (Released:2018-09-27)
参考文献数
23

材料開発において未知の材料を効率的に探索するには、組成の情報のみから物性を予測する手法の開発が必要である。本研究では、無機材料の組成式を記述子に変換して説明変数とし、物性との関係を表す回帰モデルを構築した。さまざまな物性の予測に対応できるよう情報を損失なく変換するために、組成式中の各元素の個数や割合を表す記述子、原子量、原子半径、電気陰性度といった元素の物理学的パラメータを使用した記述子など、合計387個の記述子を提案した。ケーススタディとして、これらの記述子を用いてRandom Forestによるモデルを構築し、結晶の生成エネルギー、密度、屈折率という3種類の物性の予測を行って R2 値がそれぞれ 0.970、0.977、0.766という結果を得た。また、統計的に選択されそれぞれの物性予測モデルの構築に寄与した記述子が、化学的知見から考えても妥当なものであったことからこの手法の有用性を確認した。
著者
武田 俊一 金子 弘昌 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
ケモインフォマティクス討論会予稿集 第38回ケモインフォマティクス討論会 東京
巻号頁・発行日
pp.100-103, 2015 (Released:2015-10-01)
参考文献数
12

新薬を開発するために新薬となる可能性の高い多様な構造からなるライブラリを構築する手法の開発が求められている。我々はそのような手法として化学空間上の任意の領域に構造を多数生成する手法であるde novo design algorithm for exploring chemical space (DAECS)に注目し、その改良を行った。DAECSはリガンドデータで規定された部分空間上の特定の領域に存在する構造のみを生成することができる。しかしDAECSでは多様性の高い構造を生成することと活性値以外の性質を考慮することができない。本研究ではこの問題を解決するために部分構造を用いた構造変化及び化学空間上のドラッグライクネス分布の可視化を用いた領域選択を導入した。GVKのデータベースより取得したヒトalpha2Aアドレナリン受容体に対するリガンド活性データを用いて手法の優位性を確認したところ、ドラッグライクネスを考慮したうえで高い活性が期待できる構造を多様に生成できることを確認できた。
著者
荒川 正幹 長谷川 清 船津 公人
出版者
公益社団法人 日本化学会・情報化学部会
雑誌
Journal of Computer Aided Chemistry (ISSN:13458647)
巻号頁・発行日
vol.1, pp.1-7, 2000 (Released:2000-08-03)
参考文献数
6
被引用文献数
5 4 6

3次元構造活性相関において活性コンフォメーションと重ね合わせルールを決定することは、モデルの適用能力を左右する重要な因子である。これら因子は互いに密接な関連があり、X線結晶解析などの構造情報がない場合には、容易には推定できない。本論文では、4way PLS法による合理的な活性コンフォメーションと重ね合わせルール推定法を提案する。4way PLS法はPLS法の変数を2次元の行列から4次元配列へと拡張した手法であり、PLS法と比較しノイズに強い安定なモデルを得ることが可能である。本論文では、Glycogen phosphorylase b(GPb)の阻害剤であるGlucose誘導体47サンプルを用いたCoMFA解析に本手法を適用した例を示す。サンプル、フィールド変数、コンフォメーション、重ね合わせルールからなる4次元配列を説明変数とし4way PLS法で阻害活性との関係を検討した。そしてモデル係数値を用い阻害活性に大きく寄与する活性コンフォメーションと重ね合わせルールの推定を行い良好な結果が得られた。またX線結晶解析によるGPbの3次元構造との関係について考察を行った。