著者
北上 始 國藤 進 宮地 泰造 古川 康一
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.26, no.11, pp.p1283-1295, 1985-11-15

人工知能の応用として知られているエキスパートシステムを作成するためには, 知識の表現, 獲得, 利用といった機能を支援する知識ベース管理システムが必要である. 本論文では, このシステムの構成法及び要素技術についての研究成果を報告している. 本知識ベース管理システムのインプリメンテーションは, 論理型プログラミング言語Prologで実施することを前提としている. 知識ベースの構造は, 著者らによって提案された次のような論理構成をとっている. 知識ベースを構成している各フレーム(知識の集合体)は, 主として次の五種の知識に分類されており, 知識ベースの拡張性を十分に反映できるように構成されている. 五種の知識としては, (1)構造化知識, (2)プログラム化知識, (3)制約型知識, (4)メソッド型知識, (5)辞書型知識がある. (1), (2)はオブジェクト知識, (3), (4), (5)はメタ知識とも呼ばれている. (1)の構造化知識は, 自然言語の分野で知られる概念階層関係を採用しており, (2)のプログラム化知識は, (1)で表現された知識を補うとともにそれを利用した種々のルールを表現している. (3)の制約型知識には, 動的に整合性を維持するためのtrigger型のメタ知識や, 矛盾検出用のinconsistencyの型のメタ知識があり, これらはメタ推論機能を使って容易に評価実行することができる. 特にtrigger型のメタ知識は, 自然言語処理の分野で知られる因果関係を表現するのに十分な機能をもっていることが述べられている. (4)のメソッド型知識は, 著者らが, 主に知識獲得と呼んでいる機能を提供するためのメタ知識である. ここでは, オブジェクト・レベルとメタ・レベルの二種類の知識獲得が存在することを述べている. また, 知識獲得時に, 制約型知識の評価実行を行うためのタイミングを制御するために, トランザクションという概念の導入が大切であることを述べている. (5)の辞書型知識は, データベースの分野のデータ辞書を拡張した知識であり, 知識ベース管理の処理効率向上及び種々のインタフェース向上のために利用される.
著者
高木 允 森 康真 田村 慶一 北上 始
出版者
社団法人情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.49, no.4, pp.93-104, 2008-03-15

本研究では,ブログの書き手であるブロガに焦点を当て,ブロガをノード,トラックバックによるつながりを辺としたグラフから,数カ月にわたって頻出し,かつ重複を許したコミュニティを発見する手法を提案する.提案手法は,複数のグラフから頻出部分グラフを抽出し,得られた頻出部分グラフに重複を許したクラスタリング手法を適用することにより,重複を許した頻出コミュニティを発見する.頻出部分グラフの抽出については,頻出部分グラフ抽出の問題を頻出アイテム集合抽出の問題に変換し,LCM 法を用いることで頻出部分グラフ抽出を達成している.重複を許したクラスタリングについては,頻出部分グラフをNewman らのクラスタリング手法を応用し,縮約グラフの作成と再クラスタリングすることで達成している.提案手法の有用性を確認するために,複数カ月にわたりブログデータを収集し,頻出コミュニティの抽出を行った.その結果,共通の興味・関心を持って頻出するコミュニティと,複数のコミュニティに重複してクラスタリングされるブロガを発見できた.In this study, we focus on bloggers who are writers of blog articles and propose a technique which extracts frequent and overlapped communities across multiple months from graphs consisting of nodes and edges. A node is defined as a blogger and an edge is a connection of trackback. First, the proposed technique extracts frequent communities by extracting frequent subgraphs. Second, the proposed technique extracts overlapping communities by clustering the extracted subgraphs. In the procedures of extraction of frequent subgraphs, we transform the frequent subgraphs extraction problem to the frequent itemsets extraction problem. In the first step, the LCM algorithm is applied to extract the frequent itemsets. In the second step,we applied the Newman's algorithm to find overlapping clusters. To confirm the availability of proposed technique, we collected the graph data and extracted the frequent communities.As a result, frequent communities which have common interests and the bloggers who are clustered into multiple clusters are extracted.
著者
高木 允 田村 慶一 森 康真 北上 始
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2007, no.54, pp.39-45, 2007-05-31

本研究では、Newman らの提案するネットワーク構造解析に基づくクリスプなクラスタリングアルゴリズムを改良し、ひとつのノードが複数のクラスタに重複してクラスタリングされることを許したグラフのクラスタリング手法を提案する。提案する手法は、一度 Newman らの提案するアルゴリズムを用いてグラフのクラスタリングを行った後、それぞれのクラスタをひとつのノードとした縮約グラフの作成を行う。縮約グラフを再度 Newman らの提案するアルゴリズムを用いてクラスタリングし、重複してクラスタリングされるノードを識別する。重複を許したクラスタリングを行うことで、クリスプなクラスタリングに比べ、柔軟なクラスタリングを行うことができる。ブログのトラックバックデータを用いた評価実験を行い、提案手法の有効性を示すことができた。In this paper, we propose a method of overlapping cluster based on network structure analysis which improves the clustering algorithm proposed by Newman et al. Newman's clustering algorithm is the crisp clustering algorithm. In the proposed technique, first, we cluster the nodes using the Newman's algorithm. Then, we make the contraction graph which is considerd a cluster as a node. In addition, we cluster the created contraction graph by using the Newman's clustering algorithm again and identify the overlapping nodes. Overlapping clustering is more flexible than crisp clustering. The experimental results using the trackback data based on blog represented efficacy of proposed technique.
著者
田村 真吾 田村 慶一 北上 始 平原 海詞
出版者
IEEE SMC Hiroshima Chapter
雑誌
IEEE SMC Hiroshima Chapter Young Researchers' Workshop proceedings = IEEE SMC Hiroshima Chapter若手研究会講演論文集 (ISSN:21873577)
巻号頁・発行日
pp.47-50, 2012

Extracting useful knowledge from a large-scale set of Web images, which are posted on the Internet, through social media sites, has become a new type of challenge. The main objective of this study is to extract the events and track the topics of a document stream that includes Web images, called an image document stream. This paper proposes a novel method for burst detection for an image document stream. The proposed method integrates a clustering technique with Kleinberg's burst detection. The experimental results show that the proposed method can extract the events and track the topics related to Web images posted on social media sites.
著者
横田 治夫 北上 始 服部 彰
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.31, no.10, pp.1-9, 1990-10-15

本稿では 知識ベース処理の1つとして 項関係上での単一化検索(RBU : Retrieval by Unincation)演算の繰り返しによりホーン節推論を行うアルゴリズムを示し その理論的な定式化を行う.項関係とは 関係データベースにおける関係(テーブル)の格納対象を 述語論理で用いられる項に拡張したものである.またRBU演算とは 項を取り扱うために関係代数演算の比較処理に単一化を導入し 条件と単一化可能な要素を項関係から検索する演算である.ホーン節を二進木表現にして項関係に格納し RBU演算を繰り返すことにより 後ろ向きおよび前向きの推論が可能であることを示す.ホーン節に対する後ろ向き推論の演繹方法としては Prolog等で採用されている節中の最左端負リテラルを選択するSLD演繹を対象とし RBU演算を使ってSLD演繹を実現するアルゴリズムを示す.一方 前向き推論としては SLD演繹と同様の選択関数を用いるようにした単位演繹であるSUD演繹を提案し RBU演繹による実現アルゴリズムを提案する.最左端の負リテラルを選択するSLD演繹およびSUD演繹は 探索規則が均等であれば 健全であり完全である.対象とするホーン節の集合が充足不能の場合には 提案したアルゴリズムは それぞれ反駁を求めて停止する.
著者
北上 始 館野 義男 五條堀 孝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS)
巻号頁・発行日
vol.1994, no.44, pp.17-26, 1994-05-27

三大国際DNAデータバンク(日、米、欧)で利用されている生物分類樹データベースは、全て、コンピュータを用いた生物学の研究に有用な電子化辞書である。しかしながら、それらの生物分類樹データベースは、無矛盾に統合化されていない。もし、それらが統合化されれば、統合化された電子化辞書を用いて、生物研究結果の間の比較や既存の研究結果から将来の研究方向の選択などに利用することができる。また、形態学上のデータから計算された生物分類樹と分子データから推論された分子進化系統樹との間を比較するのにも有効である。ここでは、生物分類樹データベースの無矛盾な統合化のために、既存の生物分類樹データベースを無矛盾にする方法について述べられている。データベースの矛盾は、生物学が、近年、急速に発展していることにより生じている。即ち、この急速な発達により、生物分類樹の再構成が頻繁に行われてるが、現存のデータベースにはそれが十分に行われていないのである。この矛盾解消のために、近傍検索によるエラー診断、統合性制約による矛盾ノード抽出、エラー修正ツールなどについて述べられている。また、分散環境における矛盾抽出方法についても述べられている。以上は、全て、関係データベース管理システムを用いて実現されている。All the taxonomy databases constructed with the DNA databases of the international DNA data banks are powerful electronic dictionaries which aid in biological research by computer. The taxonomy databases are, however not consistently unified with a relational format, If we can achieve consistent unification of the taxonomy databases, it will be useful in comparing many research results, and investigating future research directions from existent research results. In particular, it will be useful in comparing relationships between phylogenetic trees inferred from molecular data and those constructed from morphological data. The goal of the present study is to unify the existent taxonomy databases and eliminate inconsistencies (errors) that are present in them. Inconsistencies occur particularly in the restructuring of the existent taxonomy databases, since classification rules for constructing the taxonomy have rapidly changed with biological advancements. A repair system is needed to remove in consistencies in each data bank and mismatches among data banks. This paper describes a new methodology for removing both inconsistencies and mismatches from the databases on a distributed computer environment. The methodology is implemented in a relational database management system, SYBASE.