著者
川端 猛 西川 建
出版者
一般社団法人 日本生物物理学会
雑誌
生物物理 (ISSN:05824052)
巻号頁・発行日
vol.40, no.1, pp.52-56, 2000-01-25 (Released:2000-04-12)
参考文献数
7
被引用文献数
1 1 1
著者
Tetsuji Kuboyama Kouichi Hirata Hisashi Kashima Kiyoko F.Aoki-Kinoshita Hiroshi Yasuda
出版者
The Japanese Society for Artificial Intelligence
雑誌
Transactions of the Japanese Society for Artificial Intelligence (ISSN:13460714)
巻号頁・発行日
vol.22, no.2, pp.140-147, 2007 (Released:2007-01-25)
参考文献数
17
被引用文献数
5 11 27

Learning from tree-structured data has received increasing interest with the rapid growth of tree-encodable data in the World Wide Web, in biology, and in other areas. Our kernel function measures the similarity between two trees by counting the number of shared sub-patterns called tree q-grams, and runs, in effect, in linear time with respect to the number of tree nodes. We apply our kernel function with a support vector machine (SVM) to classify biological data, the glycans of several blood components. The experimental results show that our kernel function performs as well as one exclusively tailored to glycan properties.
著者
Shin-ichi Minato Kimihito Ito
出版者
The Japanese Society for Artificial Intelligence
雑誌
Transactions of the Japanese Society for Artificial Intelligence (ISSN:13460714)
巻号頁・発行日
vol.22, no.2, pp.156-164, 2007 (Released:2007-01-25)
参考文献数
17
被引用文献数
2 4

In this paper, we present a method of finding symmetric items in a combinatorial item set database. The techniques for finding symmetric variables in Boolean functions have been studied for long time in the area of VLSI logic design, and the BDD (Binary Decision Diagram) -based methods are presented to solve such a problem. Recently, we have developed an efficient method for handling databases using ZBDDs (Zero-suppressed BDDs), a particular type of BDDs. In our ZBDD-based data structure, the symmetric item sets can be found efficiently as well as for Boolean functions. We implemented the program of symmetric item set mining, and applied it to actual biological data on the amino acid sequences of influenza viruses. We found a number of symmetric items from the database, some of which indicate interesting relationships in the amino acid mutation patterns. The result shows that our method is helpful for extracting hidden interesting information in real-life databases.
著者
Shin-ichi Minato Hiroki Arimura
出版者
The Japanese Society for Artificial Intelligence
雑誌
Transactions of the Japanese Society for Artificial Intelligence (ISSN:13460714)
巻号頁・発行日
vol.22, no.2, pp.165-172, 2007 (Released:2007-01-25)
参考文献数
11
被引用文献数
1 5 9

Frequent item set mining is one of the fundamental techniques for knowledge discovery and data mining. In the last decade, a number of efficient algorithms for frequent item set mining have been presented, but most of them focused on just enumerating the item set patterns which satisfy the given conditions, and it was a different matter how to store and index the result of patterns for efficient data analysis. Recently, we proposed a fast algorithm of extracting all frequent item set patterns from transaction databases and simultaneously indexing the result of huge patterns using Zero-suppressed BDDs (ZBDDs). That method, ZBDD-growth, is not only enumerating/listing the patterns efficiently, but also indexing the output data compactly on the memory to be analyzed with various algebraic operations. In this paper, we present a variation of ZBDD-growth algorithm to generate frequent closed item sets. This is a quite simple modification of ZBDD-growth, and additional computation cost is relatively small compared with the original algorithm for generating all patterns. Our method can conveniently be utilized in the environment of ZBDD-based pattern indexing.
著者
尾崎 知伸 渡沼 智己 大川 剛直
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.22, no.2, pp.173-182, 2007 (Released:2007-01-25)
参考文献数
43
被引用文献数
1

Recently, the research area of mining in structured data has been actively studied. However, since most techniques for structured data mining so far specialize in mining from single structured data, it is difficult for these techniques to handle more realistic data which is related to various types of attribute and which consists of plural kinds of structured data. Since such kind of data is expected to be going to rapidly increase, we need to establish a flexible and highly accurate technique that can inclusively treat such kind of data. In this paper, as one of the techniques to deal with such kind of data, we propose data mining algorithms of mining classification rules in multidimensional structured data. First, an algorithm with two pruning capabilities of mining correlated patterns is introduced. Then, top-k multidimensional correlated patterns are discovered by using this algorithm repeatedly in the fashion like a beam search. We also show the algorithms for constructing classifiers based on the discovered patterns. Experiments with real world data were conducted to assess the effectiveness of the proposed algorithms. The results show that the proposed algorithms can construct comprehensible and accurate classifiers within a reasonable running time.
著者
Nozomi Kobayashi Kentaro Inui Yuji Matsumoto
出版者
The Japanese Society for Artificial Intelligence
雑誌
Transactions of the Japanese Society for Artificial Intelligence (ISSN:13460714)
巻号頁・発行日
vol.22, no.2, pp.227-238, 2007 (Released:2007-01-25)
参考文献数
19
被引用文献数
3 17 38

The task of opinion extraction and structurization is the key component of opinion mining, which allow Web users to retrieve and summarize people's opinions scattered over the Internet. Our aim is to develop a method for extracting opinions that represent evaluation of concumer products in a structured form. To achieve the goal, we need to consider some issues that are relevant to the extraction task: How the task of opinion extraction and structurization should be designed, and how to extract the opinions which we defined. We define an opinion unit consisting of a quadruple, that is, the opinion holder, the subject being evaluated, the part or the attribute in which it is evaluated, and the evaluation that expresses positive or negative assessment. In this task, we focus on two subtasks (a) extracting subject/aspect-evaluation relations, and (b) extracting subject/aspect-aspect relations, we approach each extraction task using a machine learning-based method. In this paper, we discuss how customer reviews in web documents can be best structured. We also report on the results of our experiments and discuss future directions.
著者
北川 えみ 北川 忠生 能宗 斉正 吉谷 圭介 細谷 和海
出版者
公益社団法人 日本水産学会
雑誌
日本水産学会誌 (ISSN:00215392)
巻号頁・発行日
vol.71, no.2, pp.146-150, 2005 (Released:2005-07-15)
参考文献数
15
被引用文献数
5 2

1988 年にオオクチバスフロリダ半島産亜種が放流された池原貯水池では,1996, 1997 年の遺伝学的調査においてフロリダ半島産亜種由来のミトコンドリア DNA(mtDNA)をもつ個体の割合は 56.8% であった。今回(2003 年)再調査を行った結果,本亜種由来の mtDNA をもつ個体は全体の 86.7% となり,前回調査より有意な増加がみとめられた。また,近畿地方の池原貯水池とは別水系の湖沼(津風呂湖,宝ヶ池,深泥池)からも本亜種由来の mtDNA をもつ個体が検出された。
著者
金田 健 鈴木 和幸
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. R, 信頼性 (ISSN:09135685)
巻号頁・発行日
vol.102, no.454, pp.35-38, 2002-11-08

近年、ユーザの誤使用・不注意など、ヒューマンエラーに起因する製品事故が大きな割合を占めてきている。このような不特定多数のユーザを対象とした市場型製品への事故の未然防止法に関しては種々の手法が提案されている。本研究では、これらの方法のさらなる改善を目指し、Web上のFAQを利用したヒューマンエラー事前抽出方法を検討する。
著者
石井 敏章 常盤 大樹 内田 尚和 高木 朗 小西 達裕 八名 和夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. ET, 教育工学 (ISSN:09135685)
巻号頁・発行日
vol.102, no.509, pp.19-24, 2002-12-06

学生対象のネットワーク実験において,教育効果を高めるためには学生の質問にきめ細かく対応するティーチングスタッフの存在が重要となる.計算機プログラミングや回路設計など定型的な技術の習得を目指す学習においては学習に困難をきたす箇所がほぼ決まっており定型的な質問が数多くなされることとなる.本稿では,TCP/IPネットワーキングにおける基礎事項からRIPルーティングプロトコルまでを学習する学生実験を例にとり,自然言語でなされる質問に対して,その意味を解釈し定型的な質問に対して自動的に自然言語で対応するシステムを提案する.提案システムの実現により,教師は高度な質問の対応に集中することが可能となり教育効果を高めることが期待される.
著者
陳亮 徳田 尚之 侯 平魁 永井 明 陳若愚 鄭然
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.50, pp.69-79, 2005-05-27

WORDNETのような開発に膨大な時間の掛かる同義語辞書に頼らずに、素人でも使える大型FAQシステム向け自然言語の質疑応答システムを構築した。FAQシステムを自然言語クエリにより検索する仕組みとして、本システムは差分LSI(DLSI)法によるコンテンツ検索と、テンプレート・オートマトン・マッチングによる統語検索を組み合わせというユニークな構想を持ち、次の3段階処理がその基礎となる。第一段階では、 FAQアイテムとクエリのターム展開の有効性に不可欠なtf-idf展開を保証するために、質問部と回答部間に存在する語彙ギャップを埋める処理をしたこと、第二段階では、類似意味のコンテンツ検索により、差分LSI法を意味的な一次フィルターとして用い、意味的に等価な質問部・回答部ペアのみに絞り込んだこと、第3段階目では、柔軟性に富む自然言語の統語検索機能を持つテンプレートマッチングにより最終的な意味的に等価な表現をもつ、最適なFAQの質問部・回答部ペアに絞り込みユーザに提示する。BURKE達の編集するのに膨大な労力を必要とする同義語辞書WORDNETに頼るFAQ Finder.に較べると、我々が開発したこのスキームは簡単に実現可能であり、大幅に労力が削減される。この方法の有効性はLucene FAQ System のFAQシステムで実験的に実証した。To facilitate and enhance the usability of a large FAQ system, we have developed a new user-friendly, combined content and syntactic search-based QA system that accepts free format natural language queries from users, and guide them to an answer item by locating and pinpointing the appropriate Q&A items within the FAQ dataset. To maximize the combined effects of both content and syntactic searches, we have introduced a three step core procedure comprising the term expansion of FAQ items and queries to ensure the validity of the tf-idf expansion, the DLSI (differential latent semantic indexing)-based semantic filtering step to capture semantically similar expressions in content; and the final flexible and powerful lexical template matching step to accommodate a rich variety of natural language queries of semantically similar expressions. Unlike the FAQ Finder of (Burke et al., 1997) which depends on a thesaurus-type dictionary such as Word-Net to match question and answer, the new scheme is simple to implement. An experimental investigation using the Lucene FAQ collection confirms the effectiveness of the method.
著者
宮本 勝 中谷 挽子 渡辺 昌洋 米村 俊一 小川 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HIP, ヒューマン情報処理 (ISSN:09135685)
巻号頁・発行日
vol.104, no.169, pp.7-12, 2004-07-02
被引用文献数
1

検索要求の表現と検索対象の表現が乖離している場合,適切に情報を絞り込むことが難しい.そこで,本稿では,情報を絞り込まず,長い検索結果リストを,大雑把に飛ばし読みしつつも,必要な情報を見逃さないような検索結果の表示方法を提案する.FAQを事例として評価した結果,飛ばし読みの方略をとり,本方式を高く評価する層,しない層,飛ばし読みができず,並び順を弁別できない層に被験者を層別できた.また,本方式を高く評価する層は,検索要求の表現と検索対象の表現が乖離している場合に,アルファベット順の表示方式では必要な情報を見逃す確率が高いが,本方式では大雑把に飛ばし読みをしつつも,必要な情報を見逃す確率が低いことが分かった.
出版者
日経BP社
雑誌
日経コンピュ-タ (ISSN:02854619)
巻号頁・発行日
no.615, pp.132-135, 2004-12-13

オリンパスイメージングは2000年以降、「FAQサイト」の充実に力を注いでいる。FAQ(よくある質問)とそれに対する回答をあらかじめ用意したサイトで顧客の疑問を解消できれば、応対にコストのかかるコールセンターへの問い合わせを減らせるからだ。今年4月にはサイトを大幅刷新し、使い勝手を向上させた。
著者
青山 裕大
出版者
社団法人情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.56, no.1, pp.9-13, 2006-01-01

電子情報を基にしたFAQの作成方法を通して, 電子情報の適切な取捨選択と蓄積について記述する。今日, インターネットの普及により日々膨大な電子情報が流通している。情報システムを駆使すれば膨大な情報を分析, 公開することが可能であるが, 膨大な情報をそのままの形で公開することによりコンテンツの品質低下を招き, ユーザからの信頼を損なう危険性がある。情報システムを駆使することによって膨大な作業でも短時間で処理できてしまう電子情報であっても, 全てを情報システムに頼ることなく, 情報システムとヒトとの作業配分を適切に行うことによって, 効率的でかつ効果の高いコンテンツを提供することが可能となる。
著者
井深 雄二
出版者
名古屋大学
雑誌
教育行政研究
巻号頁・発行日
vol.12, pp.73-95, 2003-03

国立情報学研究所で電子化したコンテンツを使用している。