- 著者
-
新川 栄二
永塚 光一
村田 祐樹
小野 多美子
細田 正恵
木下 聖子
渥美 雅保
- 出版者
- 一般社団法人 人工知能学会
- 雑誌
- 人工知能学会全国大会論文集 第36回 (2022)
- 巻号頁・発行日
- pp.4C3GS1002, 2022 (Released:2022-07-11)
近年,医薬データの増加に伴い,創薬分野において機械学習を用いた研究が盛んに行われている.特に薬剤と標的タンパク質のインタラクションを予測することは新薬開発において有用である.筆者らは先行研究において,タンパク質を修飾する糖鎖の頻度ベクトルを用いることでタンパク質と薬剤のインタラクション予測精度の向上を確認した.本研究では,糖タンパク質と薬剤のインタラクション予測において,事前学習言語モデルを用いた糖鎖エンコーディング手法を新たに提案する.事前学習では,全糖タンパク質の糖鎖データを用いて,それらをWURCS表記の系列データに変換し,MLMと生物分類タスクにより糖鎖言語モデルを訓練する.インタラクション予測モデルでは,まず,事前学習糖鎖言語モデルを用いてタンパク質を修飾する複数の糖鎖情報をエンコーディングし,糖鎖特徴ベクトルを生成する.次に,糖鎖,薬剤,タンパク質間で相互アテンションをとることにより薬剤特徴ベクトルとタンパク質特徴ベクトルを求めて,それらを結合し,インタラクション予測を行う.実験により,先行研究と比較して予測精度の向上が確認できた.