著者
中川 裕志 湯本 紘彰 森 辰則
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.10, no.1, pp.27-45, 2003-01-10 (Released:2011-03-01)
参考文献数
22
被引用文献数
12 17

本論文では, 専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する. 本論文では名詞 (単名詞と複合名詞) を対象として専門用語抽出について検討する. 基本的アイデアは, 単名詞のバイグラムから得られる単名詞の統計量を利用するという点である. より具体的に言えば, ある単名詞が複合名詞を形成するために連接する名詞の頻度を用いる. この頻度を利用した数種類の複合名詞スコア付け法を提案する. NTCIR1 TMRECテストコレクションによって提案方法を実験的に評価した. この結果, スコアの上位の1, 400用語候補以内, ならびに, 12,000用語候補以上においては, 単名詞バイグラムの統計に基づく提案手法が優れていることがわかった.

言及状況

外部データベース (DOI)

はてなブックマーク (3 users, 5 posts)

Twitter (4 users, 5 posts, 5 favorites)

(門外漢なので何一つ分からず言っているのだが、今時やるテキストマイニングに20年前に発表された手法を使うことは妥当と言えるのだろうか・・・) 【第2部】公務組織の人材マネジメントにおけるデータやデジタルの活用の可能性 https://t.co/HYcWJsSTho https://t.co/AtulVo3RCO https://t.co/USSFOnarBi
出現頻度と連接頻度に基づく専門用語抽出 / 中川, 湯本, 森: http://t.co/3Z5mplhErc (PDF) 再度メモ。
出現頻度と連接頻度に基づく専門用語抽出 / 中川, 湯本, 森: https://t.co/EgjToYry

収集済み URL リスト