著者
奥村 敦史 齋藤豪 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.23, pp.63-70, 2003-03-06
被引用文献数
5

感性を表す言語であるオノマトペ(擬音語・擬態語)は新語・造語が多く,既存の辞書には語彙が不足している.また,既存の自然言語処理用コーパスにもオノマトペはあまり出現しない.そこで本研究では,自動生成したオノマトペ候補語をクエリとしてWeb上のテキストを検索し,候補語を含む用例を取得することでこれをコーパスとみなす.次に得られたコーパスを解析し,候補語がオノマトペかどうかの判定を行う.オノマトペと判断された語については,係り受け解析結果の頻度情報などを利用し,その語義や用法を得る.最後に,複数の候補語の語義を照らし合わせて,語義間の距離を定義したオノマトペ概念辞書を構築する.Onomatopoeias which express sensibility include many new words and coined words, and the existing dictionaries are insufficient of their vocabularies. Furthermore, onomatopoeias seldom appear in the existing corpus for natural language processing. In this work, we generate candidate words of onomatopoeias automatically and search the text on the Web with a search engine using the candidates as a query. Therefore we can acquire a corpus containing examples of the candidates. Then, we process the corpus and judge whether each candidate is onomatopoeia or not. If a candidate is judged to be an onomatopoeia, we give its sense and usage from results of syntactic analysis, and construct a concept dictionary of onomatopoeias.