著者
山口 秀輝 齋藤 裕
出版者
特定非営利活動法人 日本バイオインフォマティクス学会
雑誌
JSBi Bioinformatics Review (ISSN:24357022)
巻号頁・発行日
vol.4, no.1, pp.52-67, 2023 (Released:2023-06-03)
参考文献数
156

ここ数年、深層学習に基づく生物配列の解析技術が台頭してきている。本稿は、その中でも特に急速に発達しているタンパク質の言語モデル(protein language models: pLMs)に関する総説である。アカデミアはもとより巨大IT企業も研究参画するこの技術は、基盤となるモデル開発がすでに一段落し、多様な生物学的・工学的タスクに対する応用結果が続々と報告されるフェーズに入っている。本稿では、最近のpLMsで中心的に用いられるTransformerの内部機構や学習方法、pLMsが獲得した生物学的情報の解析といった基本的な事項の解説から始め、配列解析、タンパク質機能予測・機能改変、立体構造予測、そして大規模言語モデルによる機能性タンパク質配列生成まで、実験的検証事例を交え幅広いテーマを紹介する。最後に、今後のpLMs研究が迎えうる展開について、萌芽的結果を踏まえつつ考察したい。

言及状況

外部データベース (DOI)

はてなブックマーク (2 users, 3 posts)

Twitter (45 users, 46 posts, 107 favorites)

タンパク質にも言語がある!?大規模言語モデルの仕組みをタンパク質の構造解析や創薬に活用する研究が盛んらしい。 これって、将来的には生体コンピュータに発展していく技術になるのでは??というSFな妄想が広がる。 https://t.co/dM1Ctj566v
日経サイエンス今月号の「タンパク質を語る言語(出村政彬さん)」の「もっと知るには‥」でJSBi Bioinformatics Reviewの記事 https://t.co/lgvaldHUXp を参照してる!
タンパク質の言語モデル。せっかくだから作ってみたい感はある。 https://t.co/uYPeET3bdn
アミノ酸配列のLLM作る系(厳密にはencoder-onlyなのでBERT系)でもMetaAIの資源使って15Bパラメータモデルくらいまではあるらしい。意味のわからない文字列を学習するという意味でここらの話が行動系列のベクトル化とかに応用できる可能性がどこかにある気がしているがどうかhttps://t.co/ooyuCvq5x4
まぶしすぎて目がクラクラする。 https://t.co/e6RT7acvGO
J-STAGE Articles - タンパク質の言語モデル https://t.co/G2BtB6ASj5
タンパク質の言語モデル https://t.co/UQqheW5Lpe バイオ系は綺麗なビッグデータがあってうらやましいです
タンパク質の言語モデル Protein language models https://t.co/ki90lA9hGl
勉強になった J-STAGE Articles - タンパク質の言語モデル https://t.co/hE0edtyAQO

収集済み URL リスト