著者
石垣 達也 トピチ ゴラン 濵園 侑美 能地 宏 小林 一郎 宮尾 祐介 高村 大也
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2021-NL-250, no.8, pp.1-11, 2021-09-21

本稿では,新たな言語生成タスクとして,レーシングゲーム実況テキスト生成を提案する.このタスクでは,視覚情報としてレーシングゲームの録画映像,言語データとして実況発話,構造化データとして速度,ハンドル角度といった数値データを入力として扱い,視聴者が映像を視聴しながら,レースをより理解し,楽しむための実況テキストを生成する.既存の言語生成研究においては,データセットの欠如が一因となり映像,言語,構造化データの複数モダリティを同時に考慮する言語生成研究を行うことは困難であった.また,言語生成の中でも,特に実況生成においては「どのタイミングで発話するか」「何を発話するか」を最低限決定する必要があるが,例えば野球を対象とした既存研究においてはイニング間に実況を行うなど,発話タイミングがあらかじめ与えられる設定が扱われ,後者にのみ着目されてきた.本研究ではまず,映像,構造化データとそれらに対応する実況テキストが対になった大規模データセットを作成し,レース実況の特徴について分析する.分析より,実況テキストはその言語的な特徴が,時間および実況者の視点の影響を受け,変化することが分かった.さらに,実況生成タスクをタイミング同定と発話生成の 2 つのサブタスクに分割し,これらについてベースライン手法を提案する.実験より,構造化データの活用は有益である一方,視覚情報については最先端の画像エンコーダを用いたとしても,本タスクにおいて効果が限定的であり,実況生成タスクが挑戦的な課題であることが分かった.マルチモーダルな言語生成タスクのためのデータセットとして,本研究で作成したデータセットは公開する.
著者
染谷 大河 石垣 達也 大関 洋平 永田 亮 高村 大也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第37回 (2023) (ISSN:27587347)
巻号頁・発行日
pp.2M5GS1005, 2023 (Released:2023-07-10)

サッカーは、制約が少なく複雑性が高いチームスポーツの一つであり、試合の成り行きを予測するのは非常に難しい。近年では、主に機械学習の手法を用いて、サッカーの試合においてどの選手がどこで何のアクションをしたかを示すイベントの系列の予測が試みられており、先行イベント系列を考慮したゴール期待値の計算や特定のアクションの有効性の評価への応用が見込まれている。一方で、次にどのようなイベントが発生するかは、単に先行するイベントの系列だけでなくどの選手がそのイベントを発生させるかに大きく依存すると考えられる。そこで、本研究では選手を分散表現すなわちベクトルで表現しニューラルイベント予測モデルの入力に加えることで、先行研究では考慮されていなかった選手の特性を考慮した予測を行うことを提案する。実験の結果、選手特性を考慮することでモデルの予測精度が向上することに加え、モデルを学習する過程で得られた「選手ベクトル」が選手のポジションに関する情報を含んでいることが示された。