- 著者
-
是枝 祐太
森下 皓文
今一 修
十河 泰弘
- 出版者
- 一般社団法人 人工知能学会
- 雑誌
- 人工知能学会全国大会論文集 第37回 (2023) (ISSN:27587347)
- 巻号頁・発行日
- pp.4Xin108, 2023 (Released:2023-07-10)
プログラムコードの再利用はソフトウェア開発における基本的な生産性向上方法であるが,コードレポジトリの説明文 (readme) は整備コストが高く,しばしばreadmeが整備されないことがコードの再利用を妨げている.近年報告された研究は関数・クラスなど数十行のコードに具体性の高いコメントを付与するが, readmeの生成においては数万から数百万行のコードを抽象的に要約して生成を行う必要があるため,コメント生成技術をreadme生成の問題にそのまま適用することはできない.本研究では,レポジトリが実施することの概要を示す代表的なコード断片 (代表コード) をヒューリスティクスと弱教師付き学習により抽出することで,大規模言語モデルでreadmeを生成できることを示した.主観評価と自動評価により,提案手法の有効性を確認した.