日本語単語ベクトルの構築とその評価

80 0 0 0 OA 日本語単語ベクトルの構築とその評価

著者: 吉井和輝 Eric Nichols 中野幹生青野雅樹
雑誌: 研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日: vol.2015-SLP-106, no.4, pp.1-8, 2015-05-18

単語ベクトルは,統計的自然言語処理で利用しやすい分散意味表現として近年盛んに用いられるようになってきた.しかしながら,今まで主に英語で評価されてきたため,英語以外の言語での有効性は不明である.本研究では,単語の類推 (word analogy) と文完成 (sentence completion) の二つの評価タスクを用い,著名なオープンソースツールである word2vec (gensim の再実装) と GloVe を用いて構築した日本語単語ベクトルの評価を行った.単語の類推タスクでは,英語データで公表されている結果に近い結果を得たが,文完成のタスクでは,精度が大幅に減少した.本稿では,両タスクのエラー解析で明らかになった英語の単語ベクトルと日本語の単語ベクトルの性能差や,日本語特有の問題について調査した結果について述べる.

http://id.nii.ac.jp/1001/00141806/

言及状況

はてなブックマーク (2 users, 4 posts)

ところでこの論文たのしそう！日本語の単語ベクトル表現そのものの問題点のおはなしみたい。英語に比べて単語ベクトルの性能そのものが劣ってるの、なんかしっくりくる感あるぞ！！

Twitter (78 users, 80 posts, 63 favorites)

ところでこの論文たのしそう！日本語の単語ベクトル表現そのものの問題点のおはなしみたい。英語に比べて単語ベクトルの性能そのものが劣ってるの、なんかしっくりくる感あるぞ！！ / “情報学広場：情報処理学会電子図書館” https://t.co/R9aspZj5w3

2 @nishinerima @smz_wk

“情報学広場：情報処理学会電子図書館” https://t.co/uZKRwhBG6D

ですよねー: 日本語単語ベクトルの構築とその評価　https://t.co/CqikYopFex https://t.co/oh3A2VcpQK

6 @m_hayase256 @kuronekodaisuki @aohsato @morioka

16 @AmadeusSVX @aohsato @halpeq @hand2tail @hiroyuki_hon @ji10me @Mach88 @mkt_ @morioka @m_hayase256 @saitotetsuya @sawachyon @tMotoyuki_ @Tnohito1 @t_higa @witch_kazumin

日本語単語ベクトルの構築とその評価 https://t.co/FSuOcvNZ02 日本語はword2vecもGloVeもそれほど分散表現として性能が出ない可能性があることを指摘，ですか…．語の類推/文完成タスクではN-Gramに負けるという…

68 @komakusaryama @zeema_tree @taka76ers @takaken1977 @yarai1978 @altescy @y8o @mitsuharu_e @zakki @NASNETou @db_ext @yo_ehara @odan3240 @icoxfog417 @satos73 @Ishitonton @twilight_memory @__hiza__ @eve_yk @orimanabu @knok @kaorut @MasugataKensuke @Scaled_Wurm @kwn_karaage @jaialkdanel @marujiruo @taniokah @AkiraIsaka88 @tortuepin @mokemokechicken @solarianInOsaka @stmtk_g @p_Kater @tsubame959 @tmnghryk @TakaoOzaki @flowlight_ @toto_toilet @TequilaBancho @morioka @7m7mPL @Sunitha @dakuton @minami_siki @foroctbeta @120reset @dico_leque @todesking @dontsentouin @tdualdir

40 @antitomato @kensuke3238 @flaskwebdev @task5622 @hararan_2010 @sss72711 @rabbitfoot530 @61503891 @akakurononeko @db_ext @hrsma2i @Ishitonton @junkimarui @J_Steman @kacky24 @ltshieh @madogiwa @m_ishimu @NASNETou @Nolex_innu @odan3240 @ozawa940 @pacocat @phar @riverwell_ @RyoHWS @satos73 @tmiya_ @toby_net @UFO84 @verypluming @w_sakurai @yabuki @yagami_360 @yhide @ymym3412 @yojise_n @yo_ehara @yskn67 @yus_no_s

80 0 0 0 OA 日本語単語ベクトルの構築とその評価

言及状況

はてなブックマーク (2 users, 4 posts)

Twitter (78 users, 80 posts, 63 favorites)

収集済み URL リスト