著者
熊澤 侑美 後藤 智範
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2014, no.16, pp.1-7, 2014-06-26

研究開発の活性化に伴って,新しい概念・モデル・理論を表わす新しい用語が出現する.外国語由来の語は,すぐには漢字標記の訳語が現れないため,カタカナ,場合によってはアルファベット表記がそのまま日本語の文書で使用される.近年,この傾向は非常に顕著であり,結果として複数の字種で表記される用語が著しく増加する傾向にある。本研究は NL-214 での報告内容を引き継ぎ,特許抄録に出現した多字種複合語を対象に,字種の観点から,字種並びの特性を明らかにすることを意図するものである.本報告により,字種変化パターンと用語数、先頭字種毎のパターンと用語について顕著な特性があることを明らかにした.さらに,多字種語の構成単語と字種単位との関係についても考察した.Lots of Compound terms used in Japanese technical literatures are written with multi character types. A lot of these terms are consisted of 2 from 5 single words which are expressed with using kanji, katakana, and also alphabets respectively. These terms are increasing as new ideas appear in science, or new technologies are invented in R&D. Our research intends to analyze to the sequence of multi character types of compound terms appeared in Japanese patent documents. Specifically, about 12 thousands compound terms extracted from patent abstracts were analyzed from character type sequence of view. It was clear in this research that some specific character type sequence patterns appear many kinds of compound terms. Furthermore, the relation between each component word and character string with single character type in a compound term were considered.

言及状況

Twitter (1 users, 1 posts, 1 favorites)

Googleスカラーのアラート便利。 特許抄録中の複合語を対象とした字種変化特性の分析 http://t.co/KDmTs3lONk

収集済み URL リスト