汎用言語モデル学習のためのプロンプト最適化

doi:10.11517/pjsai.JSAI2023.0_1T3GS605

1 0 0 0 OA 汎用言語モデル学習のためのプロンプト最適化

著者: 磯沼大森純一郎坂田一郎
出版者: 一般社団法人人工知能学会
雑誌: 人工知能学会全国大会論文集第37回 (2023) (ISSN:27587347)
巻号頁・発行日: pp.1T3GS605, 2023 (Released:2023-07-10)

近年、ChatGPTをはじめとした幅広いタスクに汎化できる汎用言語モデルを学習する方法として、タスクごとにプロンプトを付与しマルチタスク学習を行うinstruction tuningが注目されている。これまで様々なプロンプトがinstruction tuningのために作成されているが、どのようなプロンプトがモデルの汎化性能向上に最適なのか明らかになっていない。本研究では学習用プロンプトを二段階最適化により最適化するinstruction optimizationを提案し、instruction tuningに最適なプロンプトを明らかにする。評価実験において、タスクの指示をプロンプトに用いる実験設定(zero-shot)では、二段階最適化によりプロンプトを多様化することが汎化性能向上に有効である一方、タスクの例示をプロンプトに用いる実験設定(few-shot)では、多様な種類の例示ではなく同一の例示を用いる方が有効であることが明らかになった。

2023-11-02 06:47:20
1 + 12 Twitter

言及状況

外部データベース (DOI)

Twitter (1 users, 1 posts, 12 favorites)

人工知能学会全国大会 #JSAI2023 で以下の発表が優秀賞を受賞しました！ instruction tuningに使うプロンプトを最適化するお話です。 https://t.co/NYE1CxCAQQ

12 @smiling0101 @Bollegala @tazami458 @shino__c @verypluming @yusuke_iwasawa_ @hpp_ricecake @cfu_miura @futsaludy @kosyamada @moguranosenshi @yo_ehara

収集済み URL リスト

https://www.jstage.jst.go.jp/article/pjsai/JSAI2023/0/JSAI2023_1T3GS605/_article/-char/ja/ (1)