1 0 0 0 言語工学

著者
長尾真著
出版者
昭晃堂
巻号頁・発行日
1983
著者
長尾真編著
出版者
新潮社
巻号頁・発行日
1986
著者
長尾真 [ほか] 著
出版者
岩波書店
巻号頁・発行日
1998
著者
村田 真樹 長尾 真
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.3, no.1, pp.67-81, 1996-01-10 (Released:2011-03-01)
参考文献数
10

日本語文章における名詞の指す対象が何であるかを把握することは, 対話システムや高品質の機械翻訳システムを実現するために必要である. そこで, 本研究では名詞の指示性と修飾語と所有者の情報を用いて名詞の指示対象を推定する. 日本語には冠詞がないことから, 二つの名詞が照応関係にあるかどうかを判定することが困難である. これに対して, 我々は冠詞にほぼ相当する名詞の指示性を表層表現から推定する研究を行なっており (M. Murata and M. Nagao 1993), この名詞の指示性を用いて名詞が照応するか否かを判定する. 例えば, 名詞の指示性が定名詞ならば既出の名詞と照応する可能性があるが, 不定名詞ならば既出の名詞と照応しないと判定できる. さらに, 名詞の修飾語や所有者の情報を用い, より確実に指示対象の推定を行なう. この結果, 学習サンプルにおいて適合率82%, 再現率85%の精度で, テストサンプルにおいて適合率79%, 再現率77%の精度で, 照応する名詞の指示対象の推定をすることができた. また, 対照実験を行なって名詞の指示性や修飾語や所有者を用いることが有効であることを示した.
著者
松川 智義 中村 順一 長尾 真
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1989, no.40(1989-NL-072), pp.1-8, 1989-05-19

自然言語処理のシステムを構築する際に用いられる単語の分類を客観的なデータ解析から得る方法がいろいろと提案されている.その中には,単語の共起に関する実例データ(共起データ)を用いて単語を分類するというアプローチがある.ところが,それらの多くが前提としている単語間の「距離」(意味的な遠さ)だけで,多様な単語の意味を表現することには限界がある.また,実際の共起データには様々な「雑音」が混ざっている.本研究では,共起データに基づいた,「距離」という考え方を用いない,「雑音」に強い,単語のクラスタリング・アルゴリズムを作成した.
著者
長尾 真
出版者
日本認知科学会
雑誌
認知科学 (ISSN:13417924)
巻号頁・発行日
vol.8, no.3, pp.194-197, 2001-09-01 (Released:2008-10-03)
著者
黒橋 禎夫 長尾 真
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.33, no.8, pp.1022-1031, 1992-08-15
被引用文献数
34

日本語情報処理において未解決のまま放置されている問題の1つに 長い文を正しく構文解析することがほとんどできないという問題がある文が長くなる主な原因は 1文中に多くの内容が並列的に述べられているところにあるしたがって このような並列する構造を正しく認識できれば 長い文も短くすることができ 文の解析が正しくできる可能性が高くなる多くの文において 並列する部分は何らかの意味において類似しているそこで 文中の並列構造を類似した2つの文節列としてとらえ これをダイナミックプログラミングの手法によって発見することを実現した並列構造としては 名詞句の並列のほかに いわゆる連用中止法といわれている述語句の並列等を対象としたまず 日本語文を文節ごとに区切り すべての文節対について類似度を計算するそして 並列の存在を示す助詞や連用中止などの前後において バランスのとれた並列構造を優先すること 文を意味的に区切っているある種の表現をこえて並列の範囲が広がる可能性は少ないこと 並列構造の直後に「など」のような語が現れやすいこと 等を考慮に入れた上で 類似度の総和が最も大きい2つの文節列を求め これを並列構造の範囲とする方法を考案した180文に対して実験を行ったところ この方法によって82%の精度で並列構造を推定することができた
著者
長尾 真 中村 和雄
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.17, no.8, pp.720-728, 1976-08-15

The implementation of LISP 1.6(LIST processing language 1.6) for a minicomputer (TOSBAC_40C) is described. The implementation of a full-power LISP processor require large program area and large free cell space, because the LISP processor must be able to run a large program efficiently. As our minicomputer has a small main memory, it is required to attach a high speed bulk core memory(512kB) as a virtual memory by the software paging mechanism based on the LRU algorithm. Upon these address spaces, we can use maximum 64k LISP cells. As a processor has the ability to swap out any list expression into the secondary memory in the form of S-expression(Symbolic expression), the user can run a fairly large program that requires more cells than 64k cells for the running. Many other ideas are employed in this processor, such as the data type of the pointer is determined by the address computation (hence the conventional data type flags in the cell are eliminated completely), the shallow binding mechanism is employed as the variable binding, the compaction and linearization of the cells are taken place at the garbage collection, and the processor works under the disk operating system. As this processor has so many features, it is easy to use, and a large LISP program is run-nable efficiently.
著者
松山 隆司 長尾 真
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.21, no.5, pp.p468-480, 1980-05-15
被引用文献数
10

近年,国土の高度利用を計るためのデータを得る手段として,計算機による航空写真の解析が重要視されるようになって来た.本論文では,領域の持つ各種のスペクトル的,空間的特徴に基づいて画像を構造的に解析し,航空写真中の対象物を自動的に認識するシステムについて述べる.航空写真のような大きな画像のあらゆる部分について複雑な処理を行うと膨大な時間がかかるため,本システムでは,「大局的分類から詳細な解析へ」という考え方を導入し,処理の効率化を計っている.これは人間における注意の集中(focs of attention)にあたるもので,複雑で時間のかかる処理は特定の局所領域内のみに対して行われるので,処理時間が大幅に短縮される.システムの制御構造は,"プロダクションシステム"の考え方に基づいて作られており,多種多様な対象物に関する知識は,互いに独立江多数の対象物認識ルーチンに分散して蓄えられている.各対象物認識ルーチンは,対象物が存在するであろうと考えられる局所領域に注目し,独自の知識を用いて特定の対象物を認識するこれらのルーチンによる解析結果はすべて共通の"ブラックボード"に書き込まれ,システムはプラックボード中の情報の矛盾を検出し,誤りの訂正を行い,統一のとれた解析結果を出力する.
著者
長尾 真
出版者
社団法人人工知能学会
雑誌
人工知能学会誌 (ISSN:09128085)
巻号頁・発行日
vol.7, no.2, pp.320-328, 1992-03-01
被引用文献数
12

This paper describes a way of organizing large knowledge base which aims at human use in book form and in hyper-text system. This is based on the experience of the author when he was the chief editor of the Encyclopedia of Computer Science published by Iwanami Book Co. The book includes about 4500 entry terms and about 13000 index terms. The total pages are about 1200, in which about 800 pages are for the description of entry terms, 100 pages for a hierarchical tree representation of entry terms, and 300 pages for KWIC index table. The paper describes how the terminological words were systematically collected, and how these terms were organized into a hierarchical tree structure. Then the way of giving definition for each term is described in detail. Intensional definition, extensional definition, functional and other definitions are to be given by considering always the similarity and distinctness to other related terms. Finally the access methods to the information are described. Users have not necessarily an exact term to consult the encyclopedia. KWIC-form organization of index terms based on radix of compound terms is quite useful for such user situations. The hierarchical tree organization of terms is useful for the understanding of the whole structure of the area of computer science, and for the access to what users want to know. There are several other access methods provided for in the description part of each term.
著者
長尾 真 水谷 幹男 池田 浩之
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.17, no.2, pp.110-117, 1976-02-15
被引用文献数
26

An automatic method is developed which extracts important words(typical words or possibly key words) from Japanese scientific documents. The idea is to extract the words which appear frequently in some payicular documents, but which appear seldom in other documents. To measure this particularity of word usage we utilized the idea of X^2 test. The experiment is done on a text book of chemistry of the middle school, and "Current Bibliography on Science and Technology (Electrical Engineering)" edited by JICST. More than 120,000 Japanese words are handled and the results are fairly satisfactory.
著者
長尾 真 辻井 潤一
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.15, no.9, pp.654-661, 1974-09-15

We constructed a Programming Language for Tree-Operation, named PLATON. This accepts strings, trees and lists and transforms them in arbitrary way. Based on the augmented transition network of W.Woods, this has several additional capabilities such as pattern-matching, flexible back-tracking mechanism and so on. Because the system maintains the clarity of natural language grammars, we can easily develop various kinds of grammars, test and improve them. The system also has various flexible constructions in order to make use of semantics and pragmatics during its syntactic analysis. The detailed specification and organization of PLATON are given in this paper, and an example of using this is also given, which analyzes simple Japanese sentences.