著者
新川 栄二 永塚 光一 村田 祐樹 小野 多美子 細田 正恵 木下 聖子 渥美 雅保
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.4C3GS1002, 2022 (Released:2022-07-11)

近年,医薬データの増加に伴い,創薬分野において機械学習を用いた研究が盛んに行われている.特に薬剤と標的タンパク質のインタラクションを予測することは新薬開発において有用である.筆者らは先行研究において,タンパク質を修飾する糖鎖の頻度ベクトルを用いることでタンパク質と薬剤のインタラクション予測精度の向上を確認した.本研究では,糖タンパク質と薬剤のインタラクション予測において,事前学習言語モデルを用いた糖鎖エンコーディング手法を新たに提案する.事前学習では,全糖タンパク質の糖鎖データを用いて,それらをWURCS表記の系列データに変換し,MLMと生物分類タスクにより糖鎖言語モデルを訓練する.インタラクション予測モデルでは,まず,事前学習糖鎖言語モデルを用いてタンパク質を修飾する複数の糖鎖情報をエンコーディングし,糖鎖特徴ベクトルを生成する.次に,糖鎖,薬剤,タンパク質間で相互アテンションをとることにより薬剤特徴ベクトルとタンパク質特徴ベクトルを求めて,それらを結合し,インタラクション予測を行う.実験により,先行研究と比較して予測精度の向上が確認できた.
著者
新川 栄二 永塚 光一 村田 祐樹 小野 多美子 細田 正恵 木下 聖子 渥美 雅保
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第35回全国大会(2021)
巻号頁・発行日
pp.2Xin507, 2021 (Released:2021-06-14)

医薬データ等の増加に伴って創薬分野における機械学習を用いた研究が盛んに行われている.特にタンパク質と薬剤のインタラクションを予測することやインタラクション部位を解析することは新薬開発において有用である.本研究では,タンパク質に付いている糖鎖に着目し,薬剤と糖タンパク質のインタラクション予測において,薬剤情報,アミノ酸配列情報,糖鎖情報の3つの組み合わせを入力とする相互アテンションニューラルネットワークを構築した.提案モデルは,入力として受け取った情報からそれぞれのエンコーダーを介して特徴ベクトルを抽出し,それらを連結したのちにインタラクションの有無の判別を行う.モデルの構造は糖鎖が糖タンパク質と薬剤の反応を仲介するプロセスを表現しており,糖鎖と薬剤のアテンションをとったのちに薬剤とアミノ酸配列のアテンションをとる.予測の過程で得られた2つのアテンションを解析することにより,インタラクションにおける糖タンパク質と薬剤の関係を糖鎖と薬剤,薬剤とアミノ酸配列という2つの側面から分析する.