著者
馬青 神崎 享子 村田 真樹 内元 清貴 井佐原 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.42, no.10, pp.2379-2391, 2001-10-15
被引用文献数
6

本稿は,日本語名詞の意味を連続的かつ可視的に表現する意味マップを神経回路網モデルSOMによる自己組織化によって自動構築する手法を提案する.共起する連体修飾要素の観点から,まず,意味マップの自己組織化に有効と思われる,連体修飾要素が名詞の具体的な内容を表すような名詞句を新聞から人手で収集し,その名詞句を用いた意味マップの構築を試みる.そして,大規模意味マップの構築にはデータ収集の自動化が不可欠という観点から,新聞から名詞およびそれと共起する形容詞と形容動詞を共起頻度の高いものから自動的に取り出して構成される名詞句を用いた意味マップの構築を試みる.計算機実験で得られた意味マップはまず実際に用いた学習データを用いて検討し,意味マップ上の名詞は全般的に学習データが示唆する意味で配置されていることを確かめる.そして,分類結果に可視性や連続性のない階層型クラスタリング手法との比較を行い,本手法の分類能力を評価する.さらに,可視化能力を有す多変量解析手法が本タスクにうまく適用できないことを主成分の寄与率分析および計算機実験を通じて明らかにし,提案手法の必要性を補強する.A method is described for automatically constructing a semantic map,a visible and continuous representation in which Japanese nouns with similar meanings are placed at the same or neighboring points so that the distance between them represents semantic similarity.This is done by using the self-organizing neural network, SOM.From the point of view of common adnominal constituents,we first manually gather noun phrases whose adnominal constituents concretely describe the contents of head nouns from newspapers and construct a semantic map of the nouns using these noun phrases.Such types of noun phrases are thought to be effective for self-organizing a semantic map.Because it is indispensable to gather data automatically for constructing a large semantic map,we then construct a semantic map of the nouns using the noun phrases that consist of nouns and their co-occuring adjectives and nominal adjectivals.They are gathered automatically from newspapers in the order of the frequency of their co-occurrent words.Examination of semantic maps obtained in computer experiments showed that the nouns were mapped to the points corresponding to the training data.And, to objectively evaluate the SOM's ability in semantic classification,the semantic maps are compared to the results of classification by hierarchical clustering,which cannot give results with visible and continuous representation.Further, it is clarified that the multivariate statistical analysis such as principle component analysis and factor analysis cannot be used to construct semantic maps which reinforces the necessity of the proposed method for this task.
著者
村田 真樹 神崎 享子 内元 清貴 馬 青 井佐原 均
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.7, no.1, pp.51-66, 2000-01-10 (Released:2011-03-01)
参考文献数
15

本稿では単語の羅列を意味でソートするといろいろなときに便利であるということについて記述する. また, この単語を意味でソートするという考え方を示すと同時に, この考え方と辞書, 階層シソーラスとの関係, さらには多観点シソーラスについても論じる. そこでは単語を複数の属性で表現するという考え方も示し, 今後の言語処理のためにその考え方に基づく辞書が必要であることについても述べている. また, 単語を意味でソートすると便利になるであろう主要な三つの例についても述べる.
著者
神崎 享子
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.3, pp.1-18, 2012-05

「動詞+動詞」型の複合動詞は,使用頻度の面でも表現力の面でも,日本語に特徴的な語彙であるが,統語的,意味的情報を付与してデータベース化している研究はまだ少ない。そこで,本稿では,語彙的複合動詞の形態的,統語的,意味的情報にとって何が必要かを検討する。まず,研究書や辞書などから収集した約2500語の複合動詞について量的観点から構成をとらえる。次に,情報付与の検討にあたって,既存のデータベースの現状を調査し,どのような情報が不足しているかを探る。そして,現在の言語学の複合動詞研究と,既存の基本動詞辞書の両方の観点から,必要な情報をまとめ整理し,それらの情報を実際に付与するにあたり,どのような基準あるいは知見を参考にするかを述べる。最後に,第一段階で構築中のデータベースの一部を掲載する。
著者
村田 真樹 神崎 享子 内元 清貴 馬青 井佐原 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1999, no.22, pp.89-96, 1999-03-04
被引用文献数
2

本論文では単語の羅列を意味でソートするといろいろなときに便利であるということについて記述する.また,この単語を意味でソートするという考え方を示すと同時に,この考え方と辞書,階層シソーラスとの関係,さらには多観点シソーラスについても論じる.そこでは単語を複数の属性で表現するという考え方も示し,今後の言語処理のためにその考え方に基づく辞書が必要であることについても述べている.また,単語を意味でソートすると便利になるであろう主要な三つの例についても述べる.It is often useful to sort words by their meanings like when using a thesaurus. In this paper, we introduce a method of arranging words semantically and show how to implement this method by using various types of dictionaries and thesauruses. We also examine an ideal dictionary that could be used for future natural language processing. Finally, we describe three main ways to use this method.