著者
横井俊夫
雑誌
情報処理学会研究報告プログラミング(PRO)
巻号頁・発行日
vol.1978, no.46(1978-PRO-007), pp.1-12, 1979-03-16
著者
横井 俊夫 仲尾 由雄 荻野 孝野 田中 裕一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.38, no.1, pp.32-43, 1997-01-15
被引用文献数
8

大規模な電子化辞書(その情報内容である言語知識)が概念レベルで持つべき情報構造を明らかにする.ここでいう電子化辞書とは 通常の辞書ばかりではなく シソーラス コーパス テキストベースなどを含む統合的な言語情報(言語知識)のことである.概念レベルは意味を扱う深層レベルの中で基準となる役割を果たす.表層レベルに最も近く それに沿う情報構造を持つ.なお この情報構造はEDR電子化辞書の成果を再整理することにより得られたものである.実現事例としてEDR電子化辞書の概念対応部分を仕様と統計データの両面から説明する.大規模知識ベースなどの議論に見られるように 大規模な情報や知識の構造を解明していく研究の重要性が指摘され始めている.本稿の内容は 本格的な実現事例を持つ初めての試みとなっている.This paper describes a model of the information structure of large-scale electronic dictionaries at the concept level that contain wide-ranging linguistic knowledge. The term electronic dictionary in this paper means an integrated body of linguistic information and knowledge that includes the information provided by thesauri, tagged corpora, and raw corpora as well as ordinary dictionaries. The concept level plays an important role for deep levels containing the information of semantic processing. It is the nearest to the surface level and its structure is similar. This information structure is obtained by rearranging the structure of the EDR Electronic Dictionary. An example of actual realization of the information structure is described in view of both the specifications and numeristic data of the EDR Dictionary at the concept level. Recently, the importance of the research on the structure of large-scale information and knowledge has become a focus of interest, as shown in the discussions for large-scale knowledge bases, etc. This paper introduces the results of the first trial including full-scale example of actual realization.
著者
横井 俊夫 しゃ 錦華 陳 淑梅 亀田 弘之 楊 立明 大野 澄雄
出版者
東京工科大学
雑誌
基盤研究(C)
巻号頁・発行日
2002

本研究は当初の計画に従い以下の研究成果を得た。1.中国語音節片仮名表記法(jピンイン)の最適化中国在住の中国語母国語話者を対象とする聴取実験により、中国語音節の日本語仮名表記法(jピンイン)を体系として最適化した。なお、以下の研究成果はこの成果に基づき実現されたものである。2.日中対応表記辞書のコンテンツの作成と評価一般旅行者用観光ガイドブックの索引情報や中国資料集を素材として、一般観光客に有用な地名(観光地名477個、都市名80個)および主要な人名(姓51個、名45個)を網羅的に収集し、データベースシステムACCESS2000に格納した。また、学術的観点・実用的観点からの妥当性を確認した。3.知的検索支援システムの実装と評価中国語未学習の日本人でも比較的容易に入力できるように、ピンイン入力、偏や旁さらには画数による文字候補限定による入力の他に、図形的類似に着目する「日中類似変換」方式を提案し、知的検索支援システムとして実装し、学術的観点・実用的観点から妥当性を確認した。4.日中表記対応辞書のシステムとしての評価上記の中日表記対応辞書と知的検索支援システムとをHTML、php、VB、MySQLにより作成し統合した。中国語(GB2313コード)入力に関しては既存の日本語用IME(4,402文字)と上記4の方法(2,361文字)を併用する方式を採用した。5.Webサーパーの構築とWeb化の実験上述の成果をWeb形式で公開するためにWebローカルなサーバーを構築し、マニュアルのオンライン化を含めWeb化実験を行ない、初の計画通りの動作を確認した。6.システムの総合的評価最終年度統合した辞書・検索システムをアンケート形式で総合的に評価し、表示画面の構成、操作性、機能性に関し概ね良好であることを確認した。