著者
柳燁 佳 金 明哲
出版者
日本分類学会
雑誌
データ分析の理論と応用 (ISSN:21864195)
巻号頁・発行日
vol.11, no.1, pp.1-14, 2022-08-01 (Released:2022-09-29)
参考文献数
37

近年,代筆疑惑を検証するための著者識別の方法論が発展しつつあり,その応用も飛躍的に普及している.これまでの著者識別の関連研究のほとんどはジャンルの影響を考慮して,用いる文章のジャンルを統一するのが一般的である.しかし,諸事情により同じジャンルの文章を収集することが困難な場合もある.日本語においては,異なるジャンルの文章が混在する場合の著者識別に関する基礎研究はまだない.本研究では,5人の現役日本人作家の2ジャンル(小説,随筆)の計200篇の文章からなるコーパスを作成して,著者識別に有効と報告されている14種類の特徴量と7種類の分類器を用いて,異ジャンル文章が混在する場合における著者識別の精度を比較した.その結果,ジャンルによって使い方が大きく変わる特徴量があるものの,適切な特徴量と分類器を選択すれば,異ジャンル文章が混在しても高い精度で著者識別ができることが分かった.

言及状況

外部データベース (DOI)

Twitter (4 users, 7 posts, 6 favorites)

@Kirishima_Arash @lilaoshizuikeai https://t.co/7UUMpap4tF
@Sh1niNgggggg @lilaoshizuikeai 核物理学霸为什么有必要出来说?以及我自己就是统计学博士,日本政府什么德性我比你了解多了OK,怀疑我身份的话看我去年发的论文 https://t.co/7UUMpap4tF
@Rrenzokutai こちらこそ、自分が関わっていない研究でしたが、それなりに嬉しいなのです。ちなみに前ラボ存続期間内出された最後の和文論文がこちらになります。恥ずかしながら第一著者が私ですhttps://t.co/7UUMpap4tF
虽然没人看,但还是说一下,去年年初开始搞的研究两天前被杂志录用了。贴上去年发的一篇,https://t.co/Bpupf00QnU
柳燁 佳, 金 明哲 異ジャンル文章が混在した場合における著者識別分析 https://t.co/ZOjFuaL4jz
柳燁 佳, 金 明哲 異ジャンル文章が混在した場合における著者識別分析 https://t.co/Q3De2xQNew

収集済み URL リスト