著者
江口 大賀 菊池 浩明
雑誌
第82回全国大会講演論文集
巻号頁・発行日
vol.2020, no.1, pp.431-432, 2020-02-20

従来のSNSの文章を用いた属性推定では,特定の名詞などの出現割合に着目する事が多い.特定の名詞に着目する手法では,推定結果が趣味・興味などに依存しがちである.そのため,性別・年代といった属性推定において、高い精度の属性推定が難しかった.そこで,一般的には自然言語処理の過程で省かれる句読点などの出現回数に着目した.その結果,ユーザーの年代が上がるにつれて句読点などの出現回数が増える事が分かった.本論文では,プロフィールからあらかじめ性別・年代が分かっている400人分のツイートを用いて,句読点などの出現回数から属性推定を行い,その推定精度を報告する.