著者
杉原 健司 志田 匡士 吉永 努 曽和 将容
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLDM, [システムLSI設計技術] (ISSN:09196072)
巻号頁・発行日
vol.2005, no.27, pp.55-60, 2005-03-17

本稿では, キャンパスレベルを想定したP2Pネットワークにおいて, そのネットワークに参加する各ユーザが分散して提供するサービスや共有ドキュメントを有効活用するための新たな情報検索方式を提案する.具体的には, ピアの評価, 関連キーワードの学習, ドキュメントのスコア化とそれに伴うスコア制御機能を備えることで, 各ユーザの趣向にそった情報検索を可能にする.そして, 実装したシステムを利用使用した予備実験結果を示し, 提案システムの有効性について議論する.
著者
中島 嘉男 渡辺健一 林原 尚浩 滝沢 誠 S.MisbahDeen
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.111, pp.55-60, 2005-11-15

P2Pネットワーク内でオブジェクトがどのピアに存在しているかを発見する方法は議論されてきているが、オブジェクトにアクセス権がないと利用できない。アクセス権を持ったピアだけが、オブジェクトを操作することが出来る。本論文では、各ピアの知人ピアを用いた方法を提案する。アクセス権を考慮したピアの知人関係について議論する。次に、ピアがどの程度、各知人を信頼するかについて議論する。各知人ピアの信頼値を定義する。信頼値と知人の概念に基づいた電荷拡散(CBF)アルゴリズムを示す。An object is a unit of resource distributed in peer-to-peer (P2P) overlay networks. Service supported by an object is modeled to be a set of methods and quality of service (QoS). It is critical to discuss what peer can manipulate an object in what method, i.e. only a peer granted an access right can manipulate an object. In this paper, we take an acquaintance approach. An acquaintance of a peer p is a peer, whose service the peer p knows and with which the peer p can direct)y communicate. We discuss types of acquaintance relations of peers with respect to what objects each peer holds and what access rights each peer is granted and can grant to another peer. Acquaintance peers of a peer may notify the peer of different information on target peers. Here, it is critical to discuss how much a peer trusts each, acquaintance. We define the trustworthiness of an acquaintance In terms of the acquaintance relations among the peers. In addition, we present a charge-based flooding (CBF) algorithm to find target peers based on trustworthy acquaintances so that more trustworthy areas are more deeply searched.
著者
古賀 隆浩 伊藤正詩 大囿忠親 新谷 虎松
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.110, pp.63-69, 2006-10-25

本論文では,双方向HTMLリンクをP2Pネットワーク上で分散管理するシステムを提案する.双方向HTMLリンクとは,Webページに含まれているハイパーリンクを元に,自動的に逆方向へのハイパーリンクが作成されるフレームワークである.双方向リンクに必要なWebページ間のリンク情報は,WebページのHTMLソースから分離し,P2Pネットワーク上の計算機に分散して配置される.リンク情報を分散することにより,ユーザやリンク情報の増加に適応可能なシステムになると考えられる.本論文では,大規模なネットワークにおける効率的な双方向リンクアクセスを実現するため,P2Pネットワークで分散ハッシュテーブルを構成し,そのエージェントを用いた拡張を試みる.
著者
東森 ひろこ 宇田 隆哉
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータセキュリティ(CSEC) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.129, pp.51-56, 2006-12-08

本論文で述べるのは,小規模なグループのPCを,安全性を考慮したP2P技術を用いて連携させることによりファイル管理コストを低減し,ネットワークに参加している各PCの通信帯域と余剰ディスクスペースをシステム全体で共有するファイル保存システムである.また,複数人数によるファイル共有においては,そのグループのメンバーやファイル更新履歴,メンバーのファイルアクセス権限,メンバーの加入・脱退を常に管理することでグループ外の第三者によるファイルへの不正アクセスを排除し,情報漏洩の憂慮からユーザを解放する.本システムでのファイル保存先は一般のPCであるが,これらのファイルは共通鍵暗号方式を用いて暗号化し,また個人の認証には公開鍵暗号方式を利用するため,ファイルの秘匿性が保たれる.In this thesis, we make an observation on a file preservation system that decreases file management cost by making PC of small-scale group cooperate by using P2P technology that considers safety, and shares communication band of each PC that participates in network and in surplus disk space in the entire system. Moreover, in the file sharing by two or more people, the malicious computer access to the file by the third party outside the group is excluded by always managing the member of the group, file update history, member's file access authority, and the joining and the accession. Hence the user is free from the anxiety about leaking of information. In wder to hide files stealthily in general PC, each file on the system is encrypted with common key cryptography and each user on the system is authenticated with a public key cryptography.
著者
松尾 慶太 バロリレオナルド
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.91, pp.49-54, 2007-09-20

現在のインターネットは C/S 型のトポロジーが中心でありながら、コンピュータの高性能化によって、私たちの手元には以前のスーパーコンピュータ並みの能力を持った端末がある。このような端末資源を有効に活用するために、筆者らは P2P JXTA-Overlay システムを開発している。今回、提案する P2P システムは、ネットワークの Firewalls、Routers、Bridges 及び NATs などの障壁を越えることができるシステムである。そのため、ネットワークデバイスを動作させるための制御信号を転送することが可能となる。本稿では、提案するシステムの設計と実装について述べるとともに e-learning への応用について検討する。Present Internet is based on C/S architecture. However, now with the development of high-speed computing and devices, the computers of today have the same characteristics with conventional super-computers. In order to use efficiently these computer resources, we are developing in our laboratory a JXTA-Overlay P2P system. The proposed system is able to overcome Firewalls, Routers, Bridges, and NATs. Furthermore, by using proposed P2P system is possible to control different devices in remote areas. In this paper, we present the design and implementation of the proposed system and give some discussions how to use it for e-learning.
著者
中尾 高大 山之上 卓
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告インターネットと運用技術(IOT) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.87, pp.25-29, 2008-09-12

P2P 技術を利用した教育支援システム DSR に,実用的なブラウザの実装を行う.以前実装していたプラウザは,アプレットや Java Script に対応しておらず,授業や講義等で利用するには機能が不足していた.この問題を解決する為,オープンソースである Lobo プラウザを改良して DSR に組み込むことを試みている.これにより,DSR の特徴である共同作業や操作共有,操作の記録。再生などの実現も可能となる.同時に,旧プラウザと使いやすさの比較を行い,実際の教育現場での評価も行う予定である.We are trying to embedded a practical web browser in a computer instruction system DSR which uses a P2P technology. A browser, which has been already embedded in DSR, could not use an applet or a Java Script. Instead of the old browser, we use the open source "Lobo browser", in order to Bolve these problems. At the same time, we schedule the comparing usability with the old browser, and evaluating the browser at an actual field of education.
著者
西村 涼平 菅原 豊 入江 英嗣 平木 敬
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.75, pp.79-84, 2008-07-29

近年,半導体の製造技術の向上によって,1 チップに多数のプロセッサコアを集積することが可能になった.これを実現するために,多くの場合,チップを計算能力当たりで簡素にできる SIMD アーキテクチャが採用されている.この流行に沿ったアーキテクチャとして,Cell プロセッサや GPU が挙げられる.この 2 つのアーキテクチャは,マルチコアで SIMD という点では共通しているものの,細部においては様々な差がある.我々は,これらの差がメモリレイテンシの隠蔽やプログラミングの複雑さなどにおいてどのように表れてくるかを,行列積,FFT,ソーティング,そして ZIP ファイルのパスワードクラッキングの 4 つのアプリケーションを使って調べた.Recently, improvement of manufacturing technology of semiconductors has enabled to accumulate a lot of processor cores to one chip. In order to realize this, in a lot of cases, the SIMD architecture that can enable a chip to be simple per computing ability is adopted. We mention the Cell processor and GPUs as the architectures in accordance with this trend. These architectures are common in points of multicore and SIMD, but they are different in various particulars. We investigated how these differences appear in concealment of memory latency and complexity of programming using the four applications of matrix multiplication, FFT, sorting and password cracking of ZIP files.
著者
玉英昭男 杉浦 正大 益田 正
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムLSI設計技術(SLDM) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.121, pp.15-20, 2005-11-30
参考文献数
3

ロータリエンコーダは機械の自動化に欠かせない角度センサとして広く使われ,高精度化が求められている.しかし,これまでエンコーダを高精度に測定する方法がなく,精度に関する情報は十分ではなかった.著者らの校正システムは,数十万点にも及ぶ全角度目盛の誤差を高精度に,かつ,短時間で自動測定出来る点に特長がある.今回,本システムの一層の高精度化のため,エンコーダ信号最大40本,角度目盛最大6700万点の測定が可能な誤差測定回路を設計し,20万ゲートFPGAを用いて1チップ化した.A new error measuring circuit for highly-accurate rotary encoders has been designed and developed.
著者
宮崎 修次
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.3, pp.795-801, 2006-03-15
被引用文献数
2

有向グラフの確率行列表現と区分線形一次元写像のフロベニウス・ペロン演算子の行列表現を対応させることで,有向グラフの構造を力学系と関連付けることができることを示す.力学量の粗視量の大偏差統計を解明するというカオス力学系の研究手法をグラフ理論に適用する試みを紹介する.簡単な有向ネットワークを例にとり,統計熱力学形式により内在するループを個別に取り出したり,ノードから発する矢印の数の揺らぎをとらえたりすることができることを示す.Directed network such asWWWcan be represented by a stochastic matrix. Comparing this matrix to a Frobenius-Perron matrix of a chaotic piece-wise linear one-dimensional map whose domain can be divided into Markov sub-intervals, we are able to relate network structure to chaotic dynamics. Just like various large-deviation properties of local expansion rates (finitetime Lyapunov exponents) related to chaotic dynamics, we can also discuss those properties of network structure.
著者
岩下 友美 倉爪亮 辻 徳生 原 健二 長谷川 勉
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.109, pp.119-126, 2003-11-06

カメラ画像など2次元,3次元空間内で移動体を追跡する際に,SnakesやDeformable surfaceなどの動的輪郭モデルが広く利用されている.これらはノイズに対して頑強な境界軌跡法であるが,分離や結合など位相変化への対応は困難であった.一方,近年本質的に位相変化が可能なLevel Set Methodが注目を集めているが,この手法は初期化や更新時の計算コストが高いことが問題とされていた.そこで本報告では,高速で安定なLevel Set Methodの解法として提案したFast Level Set Methodの概要を示し,その応用例としてビデオ画像上の移動物体のリアルタイム追跡,およびステレオカメラを用いた人体概形の3次元リアルタイム追跡を紹介する.This paper presents an efficient implementation technique for the level set method(LSM) named the Fast Level Set Method (FLSM). Various applications based on the LSM have been presented including motion tracking and 3D geometrical modeling. However, the calculation cost of reinitialization and updating of the implicit function is considerably expensive as compared with the cost of conventional active contour models such as "Snakes". To tackle this problem, we have proposed an efficient algorithm of the LSM named the FLSM. This paper introduce some experiments of realtime tracking of moving objects in video images and 3D stereo range images using the FLSM.
著者
丸山 伸 中村 素典 岡部 寿男 山井 成良 岡山 聖彦 宮下 卓也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.4, pp.1021-1030, 2006-04-15
被引用文献数
5

電子メールが広く利用されるようになるにつれて,メールを遅延なく即時に配送することが求められている.しかし,メール配送エージェント(MTA)に大量のメールが送りつけられて負荷がかかったときには,メールの配送に遅延が生じるだけでなく,MTA の運用の継続すら困難な事態となってしまう.このような高負荷時においても特定のメールを優先的に配送する技術が求められている.本論文では,メールが配送される直前に行われるネームサーバ(DNS)に対する問合せに着目し,DNS問合せのソースアドレスに基づいて信頼できる発信者からのメールを他のメールから分離し,遅延なく優先して配送する手法を提案する.まずDNS の問合せに対してその応答として毎回異なる回答を送り,回答したサーバにメールが送られてくるのを待つ手順を繰り返すことで,DNS 問合せ元のIPアドレスとメールの発信者との対応表を作成する.次に優先して配送するべきメールの基準に基づき,優先して配送するべきDNS 問合せ元の一覧「White DNS Server List」を抽出する.この表に基づいてメールの配送先を振り分けることで,大量のメールが配送されてくる際にも信頼できる発信者からのメールを他のメールとは独立したサーバで取り扱うことができ,遅延を引き起こすことなく配送できる.そのためのシステム構築方法を示すとともに,実験により有効性を確認した.Delivering e-mails without unnecessary delay is one of the very important issues as the spread of e-mail service and its use become very common. But in case that a "Mail Transfer Agent (MTA)" is heavily loaded by huge amount of mails sent to the MTA, not only the delay on mail delivery is inevitable but also managing the MTA service becomes difficult. Thus, a delivery method that treats legitimate mails with priority is requested. In this paper, we focus on the query to the "Domain Name Service (DNS)" which is usually processed just before the mail transfer, and propose a new delivery method which separates legitimate mails from others according to the source IP address of the DNS query. That is, employing a crafted DNS server which responds to each DNS query with separate IP address, and wait for incoming mails at each address, we get a correspondence table between a DNS query and the incoming mail. And we also show that we can lead legitimate mails to the separated mail servers by dynamically changing the DNS response based on this table, and deliver them with short delay even in the case that others servers are loaded by many other mails.
著者
浅原 正幸 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.3, pp.685-695, 2002-03-15
参考文献数
19
被引用文献数
10

自然言語処理の分野で最も基本的な処理として形態素解析がある.近年大量のタグ付きコーパスが整備され,コーパスに基づいた統計的形態素解析器が開発されてきた.しかし単純な統計的手法ではコーパスに出現しない例外的な言語現象に対処することができない.この問題に対処するため,本論文ではより柔軟な拡張統計モデルを提案する.例外的な現象に対応するために単語レベルの統計値を利用する.この拡張により,細かく分類された大量のタグを扱う際,必要なコーパスの量は増加する.一般に適切なコーパスの量で学習するために複数のタグを同値類へとグループ化することによりタグの数を減らすことが行われる.我々はこれを拡張し,マルコフモデルの条件付き確率計算について,先行する品詞タグ集合と,後続する品詞タグ集合とで,別々の品詞タグの同値類を導入するようにした.コーパスの量が不足する場合にtri-gramモデルを構築すると,学習データへの過学習が起きる.これを回避するために選択的tri-gramモデルを導入した.一方,これらの拡張のため,語彙化するタグやtri-gram文脈の選択を人手で設定することは困難である.そこで,この素性選択に誤り駆動の手法を導入し半自動化した.日本語・中国語形態素解析,英語品詞タグ付けについて評価実験を行い,これらの拡張の有効性を検証した.Recently, large-scale part-of-speech tagged corpora have becomeavailable, making it possible to develop statistical morphologicalanalyzers trained on these corpora.Nevertheless, statistical approaches in isolation cannot coverexceptional language phenomena which do not appear in the corpora.In this paper, we propose three extensions to statistical modelsin order to cope with such exceptional language phenomena.First of all, we incorporate lexicalized part-of-speech tags into the modelby using the word itself as a part-of-speech tag.Second, because the tag set becomes fragmented by the use of lexicalized tags, we reduce the size of the tag set by introducing a new type of grouping technique where the tag set ispartitioned creating two different equivalent classes for the events in theconditional probabilities of a Markov Model.Third, to avoid over-fitting, we selectively introduce tri-gram contexts into a bi-gram model.In order to implement these extensions, we introduce error-driven methods to semi-automatically determine the words to be used as lexicalized tags and the tri-gram contextsto be introduced.We investigate how our extension is effective through experiments onJapanese, Chinese and English.
著者
立木 秀樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.5, pp.954-962, 1993-05-15

最近、Common Lispにオブジェクト指向の機能を付け加えた言語CLOSが広まりつつある。CLOSでは、総称関数を用いて、オブジェクト指向のメッセージ送信を一種の関数呼び出しとして実現している。しかし、CLOSの総称関数は、Lispの関数とは別物であり、Lispの基礎に存在する関数型言語の計算機構を総称関数に拡張しているわけではない。そのためには、λ計算がLispの理論的墓礎であるのと同様、総称関数を関数とする形式計算を考える必要がある、本論文では、そのような形式計算として、レコードとマージ・オペレータを型つきλ計算に付け加えた計算λmを提案する。λmは、総称関数の動作を関数型言語の枠組でモデル化している。λmのレコードはCLOSのオブジェクトに、関数は総称関数に対応する。レコードのマージはレコードの結合に、関数のマージはCLOSのメソッド融合に対応している。λmは、簡約による型の保存等形式計算としてよい性質を持ち、表示的意昧がドメイン上で構成可能である。その際、マージは上限操作として意味が付けられる。
著者
大里延康 竹内 郁雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.30, no.5, pp.596-604, 1989-05-15
被引用文献数
1

複合プログラミング・パラダイム言語TAOにおけるオブジェクト指向プログラミングの言語仕様とその評価について述べる.TAOは専用の記号処理計算機ELISのマイクロプログラミングを用い そのハードウェアによる支授を背景として 人工知能研究におけるプログラミングを強力に支援する高性能のプログラミング環境を提供することを目指している。特に 扱う問題に適したプログラミング・パラダイムをユーザが自由に選択できるようにすることを設計思想のひとつの柱として Lispをベースに 論理型プログラミング オブジェクト指向など さまざまなプログラミング・パラダイムを 言語の核の部分で融合させている.本論文では TAOの複合プログラミング・パラダイムの中で オブジェクト指向に関する部分の言語仕様を紹介し その実現技法を詳しく論ずる.また その速度性能の評価を行う.TAOのオブジェクト指向は インタプリタにおいてLispのみで書いたプログラムの性能に比べて遜色がなく 十分な実用性を持つことを示す.また 実際の応用プログラムの分析にもとづいて TAOオブジェクト指向の実現技法の妥当性についても考察を加える.
著者
山崎 憲一 奥乃 博 竹内 郁雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.32, no.9, pp.1090-1101, 1991-09-15
被引用文献数
2

TAO は記号処理を伴う大規模なアプリケーションの記述のために開発されたマルチパラダイム言語であり 関数型 論理型 オブジェクト指向の3つのバラダイムから構成される本論文ではこのうち論理型パラダイムの機能と実現方法および他パラダイムとの融合方法について述べる本方式では 述語を関数の一種としたこと すべてのパラダイムのデータ構造を共通化したことなどによりこれまでの融合型言語に比べ より簡単にパラダイム間の相互呼び出しが可能となったまた実用性を重視して設計 実装しインタプリタで 10KLIPS コンパイラで 40KLIPS を達成した
著者
中村 昌志 天海 良治 山崎 憲一 吉田 雅治 竹内 郁雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 記号処理研究会報告
巻号頁・発行日
vol.94, no.3, pp.9-16, 1994-01-14

実時間記号処理カーネルTAO/SILENTのパッケージシステムについて述べる.言語TAOは記号処理専用マシンSILENT上でOSとしての役割を果たすため,一般的なプログラミング言語の機能の他に,OSの機能を併せ持つ.TAOのパッケージシステムでは,パッケージとシンボルの保護機能およびインクリメンタルリハッシュがOSの機能である.一般的にプログラミング言語の機能としては,パッケージパスによるパッケージの継承がCommon Lispと異なった特徴的なものとなっている.これらの機能を組合わせることにより多様な構造の名前空間を実現することができ,マルチユーザ環境や複数言語の共存などに対応できる.
著者
山崎 憲一 吉田 雅治 天海良治 竹内 郁雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.6, pp.2743-2754, 1999-06-15
被引用文献数
2

本論文では Lispをべースとして論理型プログラミングを融合したマルチパラダイム言語TAOについて述べる. これまで研究されたきた融合型言語においては 純粋な関数型言語と論理型言語を融合するものが多かったが TAOではすべてのLispプリミティブと論理型プログラミングを利用できる. TAOでは Lispと論理型言語の実行機構の類似性に着目した融合を行う. ここで 実行機構の類似性とは 状態変数と論埋変数 関数呼び出しと述語呼び出し 大域的脱出とバックトラックなどを指す. たとえば catch/throwのような脱出とバックトラックには類似性があり バックトラックを大域脱出の一種と考えることができる. これにより バックトラックが Lispの大域脱出に関するさまざまなプリミティブを自然に利用できるようになる.This paper describes a Lisp-based multi-paradigm programming language TAO that incorporates a logic programming (LP) paradigm. Whereas previous multi-paradigm languages only supported purely functional and LP facilities, TAO supports all Lisp primitives as well as LP facilities. This amalgamation of Lisp and LP is done by making use of the similarities in their execution mechanisms, giving a natural semantics to the amalgamation. The similarities include state vs. logic variables, function vs. predicate calling, and non-local exit vs. backtracking. For example, the similarity between non-local exit (catch/throw) and backtracking enables backtracking to be regarded as a kind of non-local exit, so that backtracking can use all Lisp facilities which support non-local exit.
著者
山崎 憲一 吉田 雅治 天海良治 竹内 郁雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌プログラミング(PRO) (ISSN:18827802)
巻号頁・発行日
vol.42, no.7, pp.70-83, 2001-07-15

Lispに論理型言語の機能を融合する場合には,論理型言語特有の内部データ構造である未定義値(UNDEF)と,参照(REF)をどのように表現するかということが問題となる.本論文では,我々がTAO86およびTAOという2つの言語で採ったアプローチについて述べる.UNDEFには,必然的に構造データ中の「番地」という概念がともなうが,これをLispからどのように隠蔽するかがポイントとなる.TAO86では,UNDEFを即値とし,REFを処理系が自動的にたどる方法によって実装を行った.これにより言語が単純なものとなるが,いくつかのケースにおいては特有の問題を生じる.たとえば,REFやUNDEFを含む構造データの同一性を判定するために,アドホックな関数を必要とする.TAOでは同様の方法を採りつつも,論理変数を述語の値として返す関数型の機能,パターンマッチによる同一性の判定の機能などを用いて,これらの問題を解決する.また,本論文ではTAOのタグ割当てなど,実装の詳細についても述べる.Lisp can have much expressive power by incorporating logic-programming facilities. In this paper, we discuss implementation issues of this incorporation, especially for internal data representation such as undefined value (`UNDEF') and reference (`REF'). We designed two Lisp-based multi-paradigm programming languages, TAO86 and TAO, to solve these issues. In TAO86, UNDEF is a first-class immediate value, and REF is dereferenced by the system automatically. This solution is quite simple but did not have enough power to handle the whole set of data so that TAO86 provides some adhoc builtin functions. TAO, a thoroughly redesigned successor of TAO86, has new features such as functional predicates and pattern-matching mechanism that give an elegant solution of TAO86 issues. This paper also describes the implementation of internal data representation and data handling mechanisms in detail.
著者
彭渠江 高倉 佐和 古郡廷治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.20, pp.59-66, 2001-03-05

本稿では、単語の意味的曖昧性を解く手法の開発と、それをもとにして行った曖昧性解消の実験結果を報告する。テキスト中の単語の語義(sense)は、一定の文脈の中で、その単語とよく共起する他の単語と高い相互情報量をもつ。この特徴を使い、単語(w)が使われている文脈中で出現し、wと類似度の高い単語のベクトルと、wがもつr個の語義のそれぞれが使われている文脈中で出現し、wと類似度の高いk個の単語のベクトルとの間の相互情報量を計算し、その値が最も高くなった密度値と結合している語義をwの語義として採用する。この手法によって行った実験では、91.5%の高率で多義語の正しい語義を特定することができた。We describe a method and its experimental results for word sense disambiguation that is based on a statistical measure of word similaritites. First, we obtain contextual-similarity vectors for the senses of a polysemous word using a corpus. Second, we define also the contextual representation for the same word appearing in text. Third, we do a calculation of distributional matrix between each contextual-similarity vector and the contextual representation for the word to be disambiguated. Fourth and finally, comparing the values of distributional matrices, we select the sense with the highest value as the meaning of the polysemous word. An experiment shows that the rate of finding correct word senses exceeds over 91%.