著者
小川 知也 渡部 勇
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.20, pp.137-144, 2001-03-05
被引用文献数
4

本稿では,株価データと新聞記事の関連性に関するマイニング手法について論ずる.本手法では,分類により新聞記事に付与されたテーマ情報を用い,新聞記事の株価変動への影響分析と株価変動の外部要因分析という相補的な視点から,株価データと新聞記事の関連性の概要抽出を行う.新聞記事の株価変動への影響分析では,あるテーマの新聞記事が一般に株価変動に及ぼす影響を分析する.株価変動の外部要因分析では,大きな株価変動の要因を新聞記事のテーマを用いて分析する.実際にいくつかの銘柄に関する株価データと新聞記事を用いた実験を行い,実データにおける本手法の有効性を確認した.In this paper, we propose a mining method for finding a correlation between stock prices and news articles. We use a theme information of news articles which assigned by classification system, and extract a correlation between stock prices and news articles by analysing how news articles influence on stock prices and what kind of news articles causes a stock price changes. Through some experiments on stock prices and news articles, we proved a effectiveness of our method.
著者
矢代 寿寛 大山敬三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2008, no.34, pp.53-60, 2008-03-28

デジタルアーカイブの増加や書籍のデジタル化に伴い、文化情報資源のメタデータと資源形態が多様化したため、エンドユーザだけでなく管理者側も網羅的にアクセスパスを把握することが困難となっている。本稿では、貴重書をはじめとする文化情報資源にもたらされたアクセスの問題を解決するため、文化情報資源のアクセス可能性を通覧的に提示する手法を提案する。既存メタデータに基づくアクセス可能性を通覧的に提示することで、エンドユーザのアクセス支援と管理者側のコレクションマネジメントとリソースマネジメント支援を可能にする。手法の持続可能な実装のあり方として、今後検討していく二通りのシステム設計モデルについて述べる。With the increase of digital archives and digitize books projects, digital objects providers also need to comprehend access paths as well as end-users. This paper describes a presentation of accessible culture resources take rare book an example. We discuss a method of overview presentation of accessible cultural resources by multiple existing metadata. In addition, we argue that the method is useful for end-users and digital objects providers. The last part of this paper will focus on an implementation of system models.
著者
山本 英子 武田 善行 梅村 恭司 山本 幹雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.71, pp.9-15, 2000-07-28
被引用文献数
2

本論文では,情報検索に利用でき、かつ表記の揺れに寛容な類似度を提案する.表記の揺れに対応することができる編集距離という手法があるが,この手法では情報検索精度が弱いことが知られている.そこで,本論文では,情報検索の性能を持ち,かつ表記の揺れにも対応することができるダイナミックプログラミングを用いた類似度の計算法を提案し,その情報検索性能が単語に基づく手法とngramに基づく手法と比較した結果,効果的であり,かつ提案した手法が表記の揺れに寛容であることを報告する.In this paper, we propose a similarity measure suitable for information retrieval and tolerant for morphological variation. Edit distance is well-known similarity measure that can cope with variations. Unfortunately, edit distance is not suitable for information retrieval due to its performance. We have improved The behavior of edit distance by extending its definition. We have compared the proposed similarity measure with the popular similarity measures for information retrieval.
著者
工藤 拓 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.20, pp.97-104, 2001-03-05
被引用文献数
8

本稿では,チャンキングの段階適用による日本語係り受け解析手法を惺案し,その評価を行う.従来法は,任意の二文節間の係りやすさを数値化した行列を作成し,そこから動的計画法を用いて文全体を最適にする係り受け関係を求めるというモデルに基づいていた.しかし,解析時に候補となるすべての係り関係の尤度を計算する必要があるため効率が良いとは言えない.本提案手法は,直後の文節に係るか係らないかという観点のみで決定的に解析を行うため,従来方法に比べ,モデル自身が単純で,実装も容易であり,高効率である.さらに,従来法では,個々の係り関係の独立性を前提としているが,本提案手法はその独立性を一部排除することが可能である.本提案手法を用い,京大コーパスを用いて実験を行った結果,従来法と比較して効率面で大幅に改善されるとともに,従来法以上の高い精度(89.29%)を示した.In this paper, we apply cascaded chunking to Japanese dependency structure analysis. A conventional approach consists of two steps: First, dependency matrix is constructed, in which each element represents the probability of a dependency. Second, an optimal combination of dependencies are determined from the matrix. However, this method is not always efficient since we have to calculate all the probabilities of candidates. Our proposed cascaded chunking model is quite simple and efficient, since it estimates whether current segment modifies immediately right-hand side segment to parse a sentence. In addition, proposed model does not assume the independence constraints in dependency relation. Experimental results on Kyoto University corpus show that our system achieves accuracy of 89.29%, higher than that of our previous system, as well as improves the efficiency of parsing.
著者
浦田 耕二 福井 美佳 藤井 寛子 鈴木 優 酒井 哲也 齋藤 佳美 市村 由美 佐々木 寛
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.36, pp.23-29, 2004-03-26
被引用文献数
6

ユーザからの質問に対し、映像・音声・取扱説明(テキスト)などで構成される表現力豊かなマルチモーダルコンテンツの検索技術、および、質問内容を理解しユーザが必要としている情報に対して的確に回答する質問応答技術を融合することにより、より分かりやすい情報提供を実現した質問応答型マルチモーダルヘルプを開発した。このシステムを用いて、オーブンレンジ、デジタルカメラの取扱説明書データ(テキスト160ページ、映像108分)を登録し、質問データ123件による実験を行い、次のような知見が得られた。(1)質問応答技術により取扱説明情報の探索作業が軽減される見込みを得た。(2)映像、音声、取扱説明書の該当ページの表示を併用することにより,取扱説明に関するわかりやすさが向上すること確認した。映像収集、編集について、作業の軽減と質の向上を支援する必要がある。We have developed a user-friendly help system by integrating multimodal content retrieval technology and question answering technology. Multimodal content retrieval enables the user to access contents with a rich power of expression such as those comprising video, speech and textual instructions, while question answering enables pinpoint access to the required information. We conducted a preliminary experiment using the manuals of a microwave oven and a digital camera (160 pages of text and 108 minutes of video) as the knowledge source, with 123 questions. Our findings are: (1) Question answering technology enables efficient access to the desired instructions; and (2) Responses in video/audio accompanied by presentation of a relevant manual page helps the user understand the instructions better. However, we need a mechanism for facilitating gathering/editing of video contents and for improving their quality.
著者
須藤 真理 横尾 英俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1995, no.106, pp.33-40, 1995-11-09
被引用文献数
10

Mgシステムは,英文を対象とする全文検索システムである.ファイルの効率的な管理のために,データ圧縮技術を最大限に利用している点に特徴がある.本論文では,このシステムを日本語対応に拡張する.拡張したシステムでは,日本語文書に対する字面処理によって転置ファイルを自動生成し,これを利用したブール検索や重み付き検索を可能にしている.このシステムによって,特に,日本語文書と重み付き検索との相性のよさが明確になる.The mg system is a full-text retrieval system for English documents, in which data compression techniques are fully utilized in order to realize maximal storage efficiency. This paper extends the system so that it can deal with Japanese texts. The extended system generates an inverted file from a set of documents by automatic extraction of terms with no use of dictionary or grammatical knowledge of the Japanese language. The system can accept several types of queries including Boolean and ranked ones. This paper shows that the retrieval by ranked queries and the Japanese language match well with each other.
著者
上田 洋 村上 晴美
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.59, pp.17-24, 2006-05-30

蔵書検索のために,ユーザの入力文字列に関連する件名を提案する手法を検討した.本手法では,Wikipedia Amazon Web Service GoogleのWeb情報源を用いて検索質問を拡張することにより,BSH4件名標目を提案する.コンピュータ用語を入力文字列とした実験の結果,出力された件名の関連度が一定水準以上であったこと Web情報源の統合使用は単体使用よりも有効であったこと OPACのデータを用いる手法と比べて遜色のない件名が出力できたこと,がわかった.また,コンピュータ用語や流行語を入力文字列とした実験の結果 OPACのデータを用いる手法では件名が提示されない場合に本法は提示できることを確認した.We propose a method to suggest BSH4 subject headings by expanding query according to user's input using such Web information sources as Wildpedia,AmazonWebService(AWS),and Google.Experimental results revealed the following,When computer terms were input,suggested headings were related to the input term;isuggested subject headings were better than we used a mixture of Wildpedia,AWS and Google han When we just used one of them;suggested subject headings were not inferior to those suggested by othermethods that use OPAC data.We also confirmed that when computer and buzz terms were input,our method can suggest subject headings where other methods cannot.
著者
千田 恭子 篠原 靖志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.86, pp.91-96, 2001-09-10

技術成果に関するPR資料やプレゼンテーションでは、専門家だけでなく一般の人にもアピールする表題をつける必要がある。そこで本研究では、専門的な技術性かを、専門知識のない一般の人にもアピールできる表題のつけ方を明らかにすることを目的とする。そのため、論文・報告書の表題(4325題)と、それと同種の研究成果を報じた新聞記事の見出し(1411題)との比較分析を行った。そして、新聞の見出しでは、専門知識のない人にもその技術の価値が伝わるように、「開発技術の具体的な動作内容でなく、開発目的を示すことで、その技術の要旨を表す」「開発技術の実現方法でなく長所を示すことで、その技術の新規性を表す」という方策をとっていることを明らかにした。In order to publish reports or pamphlets on newly developed technologies for the general public, the authors have to compose titles appealing to the common reader. In order to clarify the method of composing the titles, this research compared between paper titles and newspaper headlines. On comparison, it became clear that the following tactics is used in the newspapers headlines to get the value of the technology across to the reader who lacks expert knowledge. ・It is expressed that what sort of technology it is by the phrase expressing what purpose the technology is for, instead of by the phrase expressing what the technology does. ・It is express that what the novelty of the technology is by the phrase expressing its strong point, instead of by the phrase expressing the method of realizing it.
著者
廣川 佐千男 伊東栄典 下司 義寛 Yufeng Dou 池田 大輔
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.108, pp.31-36, 2005-11-02

iPodに代表される携帯メディアプレーヤーの出現により音楽業界の状況が大きく変わりつつある。iTMSに登録された個人的プレーリスト群に現れる曲目やアーティストの出現頻度の解析により、相互関連を表す概念グラフを構築する方式を提案する。Portable music players are chaning the music entertainment environment. They can download the music through network. This paper proposes a method for extracting relation and popularity of songs and artists which appear in playlists of iTMS(iTunes Music Store).
著者
高久 雅生 江草 由佳 宇陀 則彦 石塚 英弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.102, pp.119-128, 1999-11-30

Z39.50は情報検索のための国際標準プロトコルで、現在各国で実装が進められつつある。筆者らはこのZ39.50プロトコルを通じてDublin Core Matadata Element Setを共通スキーマとして検索・返戻できる書誌データ検索システムを構築した。今回、対象としたデータはJAPAN/MARCの日本語書誌データで、これをDublin Coreに変換した。本稿ではこのZ39.50検索システムについて報告する。This paper describes a Z39.50-based information retrieval system which can search bibliographic data through the Dublin Core Metadata Element Set as a common schema. The system consists of a metadata conversion module, a Z39.50 server, and a database module. The metadata conversion module converts from JAPAN/MARC records to Dublin Core metadata represented by RDF. The Z39.50 server searches through Dublin Core access point. The database module parses Dublin Core metadata written in XML, and makes index of metadata.
著者
齋藤耕一 大幢 勝利 櫻井 成一朗 寺野 隆雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2005, no.42, pp.17-24, 2005-05-19

安全を守る為の安全対策でもWeb上のリスクコミュニケーションが、盛んに行われている。しかし、Web上で参加者は、共通の認識がかけている場合があり、共通の危険に直面したときでも人それぞれの対応を示す。対応によっては、大きな事故の発生の要因になる。本文では、共通認識を前提としないメッセージの意図をくみ取るためのコンピュータによるリスクコミュニケーションの支援の方法を提案する。支援の方法の一つは、コミュニケーションのテキスト文をキーワードで表すことである。しかし、立場によってキーワードの意味が異なる。この問題を解決するために、共通認識の前提としない人の関わり合いの対話をモデル化し、この対話モデルによる分類学習を提案しここで現れた、メッセージの優先順序を立場の違いを表すメッセージの意図をとする。実験によってこの方法の有効性を示す。The conventional Risk Communication on web is a well-known method for creating safety programs、 and it is widely used for safety plans. We usually require a construction site to use a safety plan、 but problems usually arise in the application of the conventional Risk Communication on web to the safety plan due to various factors such as the difference in constructers' perceptions of the cause of construction accidents. This paper describes an idea for the execution of a safety plan by introducing various perspectives、 which are added to the background model of interest based on the empathic recognition with covering. The background models based on the empathic recognition with covering、 which is defined by the difference in constructers' perceptions of Risk recognition、 are explained on the basis of a machine learning method for classification learning. These models are assigned to each perspective. The safety plan can be determined even by an unskilled supervisor using the models obtained in this study.
著者
吉田 香 加藤俊一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2001, no.44, pp.65-72, 2001-05-21

本稿では,フルカラー絵画データベースART MUSEUMにおける感性モデルについて考察を行った.WEB上に公開しているART MUSEUMは,1998年4月から2001年3月までの3年間に5000件以上のアクセスがある.これらのアクセスログより,利用者のアクセス傾向を調査した.その結果,利用者のうち約半数がシステムへのフィードバックを行っていたこと,フィードバックを行った利用者は感性検索も積極的に行っていたこと,フィードバック回数は大半の利用者が1?3回だったこと,などがわかった.また,各利用者の感性モデルが,平均モデルからどれだけ変化しているのか比較を試みた.利用者プロファイルを用いて解析を行うにはデータが十分ではなかったため,今後の課題として,特にインタフェース部分の改良が挙げられる.This paper describes a study of Kansei modeling on the image retrieval system ART MUSEUM, which can treat Kansei information. We have had over 5,000 access logs on ART MUSEUM since April 1998 till March 2001, and checked these logs. As a results, it's found that half users have operated feedback to the system, they have repeated Kansei retrieval many times, but most of them have operated feedback only a few times. And we tried to compare each user's Kansei model with an average Kansei model. It's not enough data for data mining still now. It's need to develop user interface to feedback more easily.
著者
田中 久美子 岩崎 英哉
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1996, no.88, pp.49-56, 1996-09-12

コーパスから得られた共起情報は,共起関係を枝,語をノードとするグラフと見なすことができる.同じ語が複数の意味を持つことがあるという曖昧性によって,この共起グラフは全体でひとつの大きなグラフを形成している.本稿では,曖昧性を「共起関係の推移律」という観点から捉え,共起グラフから同じ意味・話題を成す部分グラフを推移律が成立するように抽出して全体をクラスタ分けするための手法を提案する.クラスタ分けされたグラフの性質などについても考察する.さらに,実際に20Mのコーパスから作成した共起グラフに対して本手法を適用した結果,および,それを用いた主成分分析による記事の分類を行なった結果も合わせて報告する.Co-occurrence information, obtained from a corpus, is a graph, regarding words as nodes and co-occurrences as branches. Subgraphs of different themes stay connected because of ambiguous words. This paper assumes the ambiguity as the non-transitivity in co-occurrence relationship and tries to cluster a graph into subgraphs in which transitivity holds. Several properties of such subgraphs are also discussed. The clustering method is applied to a cooccurrence graph obtained from 20M Japanese newspaper articles and its results are analyzed. They are also used to classify the articles.
著者
彭渠江 高倉 佐和 古郡廷治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.20, pp.59-66, 2001-03-05

本稿では、単語の意味的曖昧性を解く手法の開発と、それをもとにして行った曖昧性解消の実験結果を報告する。テキスト中の単語の語義(sense)は、一定の文脈の中で、その単語とよく共起する他の単語と高い相互情報量をもつ。この特徴を使い、単語(w)が使われている文脈中で出現し、wと類似度の高い単語のベクトルと、wがもつr個の語義のそれぞれが使われている文脈中で出現し、wと類似度の高いk個の単語のベクトルとの間の相互情報量を計算し、その値が最も高くなった密度値と結合している語義をwの語義として採用する。この手法によって行った実験では、91.5%の高率で多義語の正しい語義を特定することができた。We describe a method and its experimental results for word sense disambiguation that is based on a statistical measure of word similaritites. First, we obtain contextual-similarity vectors for the senses of a polysemous word using a corpus. Second, we define also the contextual representation for the same word appearing in text. Third, we do a calculation of distributional matrix between each contextual-similarity vector and the contextual representation for the word to be disambiguated. Fourth and finally, comparing the values of distributional matrices, we select the sense with the highest value as the meaning of the polysemous word. An experiment shows that the rate of finding correct word senses exceeds over 91%.
著者
新納 浩幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.86, pp.29-36, 2001-09-10
被引用文献数
3

自然言語処理では個々の問題を分類問題として定式化し,帰納学習の手法を利用して,その問題を解決するというアプローチが大きな成功をおさめている.しかしこのアプローチには帰納学習で必要とされる訓練データを用意しなければならないという大きな問題がある.この問題に対して,近年,少量のラベル付き訓練データから得られる分類規則の精度を,大量のラベルなし訓練データによって高めてゆくseed 型の学習が散見される.ここではその中心的な手法であるCo-training を語義判別規則に適用することを試みる.ただしCo-training では独立な組の素性集合を設定する必要がある.現実的にはこの独立性の条件が厳しいため,得られる規則の精度が頭打ちになってゆく.本論文ではこの問題を回避するために,追加事例の選択に素性間の共起性を考慮することでCo-training の手法を改良する.実験では3 つの語義選択問題について本手法を適用した.結果,通常のCo-training を適用する以上の精度の向上が見られた.In natural language processing,it is exective to convert problems to classi ?cation problems,and to solve them by an inductive learning method.However,this strategy needs labeled training data which is fairly expensive to obtain.To overcome this problem,some learning methods using unlabeled training data have been proposed.Co-training is representative in such methods.In this paper,we apply the co-training method to a word sense disambiguation problem.However,co-training needs two features which satisfy the conditional independence assumption.This assumption is too rigid.We have no choice but to use incomplete two features,and then the accuracy of learned rules reaches the ceiling.In this paper,we check co-occurrence between two features to avoid such phenomena when we add unlabeled instances to training data.We applied our method to word sense disambiguation problems for three words.Our method improved the precision of the original co-training.
著者
村上 晴美 平田 高志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.20, pp.167-174, 2001-03-05
被引用文献数
3

個人の外化記憶を構築し、知的生産活動を支援するシステムMemory-Organizerを試作した。本システムは、(a)ユーザのアイディアから外化記憶の作成・編集を支援する思考空間ブラウザ、(b)ユーザのWeb閲覧時の外化記憶の作成、収集、抽出を支援するオーバレイWebブラウザ、(c)ユーザの時系列の興味空間上に外化記憶を配置することにより外化記憶の想起を支援する興味空間ブラウザから構成される。本稿では、WWWからの情報獲得、整理に焦点をあて、本システムの機能を説明する。また、ユーザのWebブラウジング履歴から個人の興味空間を生成してWebページを整理する実験を行ったところ、興味空間ブラウザがユーザの興味空間を表していることや、過去の想起やWebページの整理に役立つ可能性があることがわかった。We have developed a system called Memory-Organizer which enables users to construct externalized memory and support users' creative activities. The system consists of (a) a thinking space browser which helps users to input and edit externalized memory and support creative thinking, (b) an overlay Web browser which helps users to gather, cut, and create information while browsing the World-Wide-Web, and (c) an interest space browser which helps users to recall externalized memory by displaying it chronologically on the users' interest space. In this paper, we focus on information acquisition and organization while browsing the Web and describe the system's functions. We conducted some experiments and found that the interest space browser displays the users' interest space, and it is useful for recalling their past and organizing browsed web pages.
著者
山崎 毅文 パッザーニマイク
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1995, no.87, pp.49-56, 1995-09-14
被引用文献数
4

概念シソーラスの構築は、機械翻訳、テキスト検索等自然言語処理システムにおいて重要なタスクである。本稿では、与えられた事例集合から、機械翻訳システム向け翻訳ルールの学習と概念シソーラスの構築とを同時に行なう手法を提案する。概念シソーラスの構築では、既存のシソーラスを利用しない場合/更新する場合の2つの手法を提案する。利用しない場合は、まず、帰納学習アルゴリズムの適用により翻訳ルールの学習を行なう。次に学習されたルールからカテゴリー間類似度行列を作成し、クラスタリング手法の適用により、シソーラスを構築する。シソーラスを更新する場合は、既存シソーラスを一旦カテゴリー間類似度行列に変換することにより、シソーラスを利用しない場合と同様の手法が適用できる。実験結果により、本手法で構築されたシソーラスが、機械翻訳タスクにおいて有用であることが確認された。This paper addresses the problem of constructing a semantic hierarchy for Japanese-English translation systems. The creation of a comprehensive hierarchy is one important step in this system because it is used to bias the learning of rules that indicate the English translation of Japanese verbs. We propose two methods of constructing a hierarchy: acquiring a hierarchy from scratch and updating a hierarchy. When acquiring a hierarchy from scratch, translation rules are learned by an inductive learning algorithm in the first step. A new hierarchy is then generated by applying a clustering method to internal disjunctions of the learned rules and new rules are learned under the bias of this hierarchy. When updating an existing manually-constructed hierarchy, we take advantage of its node structure. We report experimental results showing that the semantic hierarchies generated by our method yield learned translation rules with higher average accuracy.
著者
前田 晴美 糀谷 和人 西田 豊明
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1996, no.70, pp.1-8, 1996-07-25
被引用文献数
2

既存の雑多で構造の不均質な情報を統合する手法を提案する.基本となるアイディアとして,雑多な情報をゆるやかに関連づけるための連想構造とよぶデータ構造を用いる.連想構造は単純な表現であり,生データから容易に生成できることと,人間が直観的に理解しやすいことが特徴である.我々は,連想構造を用いて既存の情報源から情報を収集し,整理する過程を支援するシステムCM?2を試作した.CM?2では,()既存の雑多で構造の不均質な情報源から情報を取り込み,CM?2の連想構造を生成する情報キャプチャ機構,()与えられた視点から情報の切り出しと構造化を行う知的情報統合機構,()キーワードによる連想的な検索を可能にする連想検索機構を実現した.CM?2の有効性を実験によって確かめた.In this paper, we present a method to reorganize diverse information obtained from existing information sources. The basic idea is the use of a plain information representation called associative structures which enable to link information chunks using associative indexing. It is easy to generate associative structures from raw data and they are comprehensive to humans intuitively. We have developed a system called CM-2 which helps users to gather and reorganize information from existing information sources. We describe the system's three major facilities; (a) an information capture facility which allows users to gather information from heterogeneous information sources and generate CM-2 associative structures, (b) an information integration facility which helps users to reorganize information from the user's point of view, and an (c) associative retrieval facility which gives users access to information through associative indexing mechanisms using keywords. We verify our approach by analyzing results of experiments.
著者
森 浩一 和田 耕一 寅市 和男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.57, pp.17-23, 1999-07-16
被引用文献数
5

紙文書をデジタル化して利用する場合、一般的にはピクセル画像として扱われる。しかし、ピクセル画像では様々な出力デバイスの解像度を十分に活用した出力を得ることは難しい。これに対し関数化図形を用いた画像は、画像内の領域の輪郭線を近似連続関数で表現しているため小さいサイズの画像ファイルから任意の解像度で出力できる。本論文では、Dynamic Programmingを用いて輪郭線の分割と分割された輪郭線の関数近似を行って関数化図形を生成する手法について述べる。いくつかの実験によって提案する手法が紙文書のデジタル化に適している事を示す。Although pixel image has been used for digitizing paper documents, pixel image hardly exploits resolution of various output devices. On the other hand, the image represented by function approximation can be output in arbitrary resolution, because boundaries in the image are represented by approximated continuous functions. In addition, The image represented by function approximation has merits of its compact file size and fast drawing. In this paper, a new method, which divides boundaries and approximates the each partial boundary using Dynamic Programming for creating the image represented by function approximated shapes, is introduced. Some experimental results are shown to ensure the efficiency of proposed method for digitizing paper documents.