著者
篠井 暖
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2018-NL-236, no.3, pp.1-7, 2018-07-02

音楽ファンにとって,自分の好みに合う新たな楽曲に出会えることは大きな喜びである.近年の定額制音楽配信サービスの普及で膨大な量の楽曲を聴取可能になった一方で,数百万 ~ 数千万曲という規模の楽曲の中から好みに合う楽曲をひとつひとつ試聴しながら探すのはもはや不可能になっており,リスナーの好みに合う楽曲を簡単に検索可能な仕組みが必要になっている.本稿では,楽曲を探す際の有力な手がかりとしてアーティスト情報に着目し,アーティストの特徴抽出手法について検討する.アーティストに関する情報を記述した文書の潜在表現を学習することによりアーティストのベクトル表現 (ArtistVector) を獲得し,クエリアーティストと類似するアーティストを検索可能にする手法を提案する.アーティストを特徴づける文書として,(1) アーティスト自身の説明を記述した文書と (2) リスナーからのアーティストの評価を記述した文書が重要になると考え,両者に対応する文書として Wikipedia 記事と Web レビュー記事を学習データに利用して ArtistVector を獲得した.得られた ArtistVector に対しジャンル分類タスクによる評価を行い,データセットおよび手法の有効性を検証した.また ArtistVector を UMAP により 2 次元平面上に可視化し,コンテキストに基づく関係性を反映した類似アーティストが得られていることを確認した.