- 著者
-
児玉 実優
酒井 浩之
永並 健吾
高野 海斗
中川 慧
- 出版者
- 一般社団法人 人工知能学会
- 雑誌
- 人工知能学会全国大会論文集 第36回 (2022)
- 巻号頁・発行日
- pp.3K4GS1001, 2022 (Released:2022-07-11)
近年, 投資家は, ESG(E:環境,S:社会,G:統治)情報を投資判断において重視しており,ESG関連情報をテキストデータから抽出する技術が必要とされている. ESG関連情報は統合報告書に多く記載がある. しかし, 企業によってレイアウトや内容が異なり, 学習データの作成が困難である. そこで本研究では, まず有価証券報告書(有報)から ESG関連情報を抽出する. 有報にも統合報告書ほどではないが, ESG 関連情報の記述がある. また, レイアウトはどの企業も同じであり, さらに XBRL 形式と呼ばれるテキスト形式で配布されているので, テキスト処理を行いやすい. 次に有報から抽出したESG関連情報を学習データとして,BERTモデルをファインチューニングする. 最後に当該BERTモデルを用いて統合報告書からESG関連情報を抽出することで,統合報告書から直接学習データを作成する困難を解決できた. 実際に, 本手法で各企業の統合報告書から ESG 関連情報を抽出した.結果, E,S,Gに関する情報をそれぞれ93.3%,91.7%,77.4%の適合率で取得でき,良好な結果が得られた.