- 著者
-
藤井 敦
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
- 巻号頁・発行日
- vol.2008, no.56, pp.9-15, 2008-06-12
- 被引用文献数
-
1
日本では年間約 40 万件の特許が出願され,多様な専門分野に関する知識が蓄積されている.特許情報に内在する人間の英知を体系化し,活用することができれば,学術や産業において価値がある.特許情報には高度な技術に関する新語や専門用語が多く含まれており,World Wide Web では見つけることができない専門用語も含まれている.本研究は,15 年分の日本公開特許公報テキストから約 190 万語の見出し語を含む用語辞典的なコンテンツを自動構築した.さらに,当コンテンツを検索するためのシステムを開発した.本システムは,見出し語の説明を検索することが可能である.また,関連語,同義語,自然言語文,関連語グラフによって,用語情報を多面的に調査することが可能である.In Japan, approximately 400,000 patent applications are submitted every year, which contain knowledge related to various technical fields. Organizing and utilizing human intelligence latent in patent information are valuable from scientific and industrial points of view. Patent information contains new words and technical terms associated with high-technology, and a number of these terms cannot be found on the World Wide Web. We produced an encyclopedic dictionary content from 15 years of Japanese unexamined patent applications, in which approximately 1.9 million headwords are indexed. We also implemented a search system to utilize this content. Users can search for descriptions of a technical term. Users can also research technical terms by submitting, related terms, synonyms, and natural language questions and viewing related-term maps.