著者
喜田 拓也 南 俊朗
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.105, no.172, pp.151-156, 2005-07-07

多くの図書館において所蔵文献の検索にはOPAC (Online Public Access Catalog)が用いられている.しかしながら, 歴史の長い図書館では古い資料の書誌データが電子化されないままであり, そのような資料はOPACで検索することができない.すなわち, 利用者は図書目録カードが入った引出しの前まで出向き, カードを一枚一枚めくりながら目的の資料を探さなければならない.このような状況を打開する手段として, 図書目録カードのすべてを画像データ化し, Web上でカードを検索できるシステムを我々は提案してきた.本稿では, 新たに改善された本システムの概要について述べる.
著者
有村 博紀 宇野 毅明 湊 真一 平田 耕一 伊藤 公人 下薗 真一 喜田 拓也
出版者
北海道大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-04-01

本研究では,実世界と情報世界が融合した巨大な情報空間から有用な知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指す.とくに,大規模規模知識基盤形成システムのための基礎技術として,超高速半構造マイニングエンジンと,時空間情報を用いた半構造マイニング技術の研究開発,周辺技術として,確率的情報スキーマの導入と,知識連係技術と知識索引技術の研究開発を行った.開発した技術の実装と最適化によりプロトタイプシステムの構築を行った.
著者
竹田 正幸 定兼 邦彦 坂本 比呂志 瀧本 英二 坂内 英夫 稲永 俊介 喜田 拓也 畑埜 晃平 井 智弘 中島 祐人 成澤 和志
出版者
九州大学
雑誌
基盤研究(A)
巻号頁・発行日
2013-04-01

爆縮とは工学用語で,爆発の圧力が;外側ではなく内側へ集中する現象をいい,通常では得難い物理現象を発生させるために利用される.本研究では,膨れ上がるデータを爆発的に凝縮することにより,(i) データ量削減, (ii) データ処理の高速化,(iii) 知識獲得の三つを達成する基盤技術の確立を目指し,これを情報爆縮 (information implosion) と名付けた.情報爆縮基盤技術の確立のために,(A)高速データストリーム圧縮アルゴリズム,(B)圧縮データ上の高速データ処理アルゴリズム,(C)大規模データ解析アルゴリズムという3つの研究項目をおいて研究開発を行い多くの成果を得た.
著者
有村 博紀 喜田 拓也
出版者
情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.46, no.1, pp.4-11, 2005-01-15
参考文献数
13
被引用文献数
6

大量の電子化データの流れであるデータストリームから,有用な情報を少ない資源で効率よく取り出すためのストリームマイニング技術を概観する.まず,データストリームの特徴と,データマイニングの目的について整理し,限定された計算資源を用いて無限に続くデータストリームからマイニングを行うためのシステムに要求される性質について議論する.次に,さまざまな要約データ構造とオンライン化技術についてまとめ,最近の研究のうち特色のあるものを紹介する.
著者
有村 博紀 喜田 拓也
出版者
情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.46, no.1, pp.4-11, 2005-01

大量の電子化データの流れであるデータストリームから,有用な情報を少ない資源で効率よく取り出すためのストリームマイニング技術を概観する.まず,データストリームの特徴と,データマイニングの目的について整理し,限定された計算資源を用いて無限に続くデータストリームからマイニングを行うためのシステムに要求される性質について議論する.次に,さまざまな要約データ構造とオンライン化技術についてまとめ,最近の研究のうち特色のあるものを紹介する.
著者
大濱 郁 喜田 拓也 有村 博紀 阿部 敏久
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
巻号頁・発行日
vol.110, no.476, pp.9-16, 2011-03-21

我々は,人間行動履歴の地理的クラスタリングについて議論する.本論文では,この問題を,二次元時系列データのセグメンテーション問題として定式化し,二つのクラスタリング手法,LS-linHMMとX-linHMMを提案する.前者のLS-linHMMは,線形制約付きHMMを用いたクラスタリングと情報量規準を用いたモデル選択を組み合わせ,クラスタ数の自動推定を行う.また,X-linHMMは,x-meansのアイデアを取り入れた2状態線形HMMによる階層的クラスタリングであり,LS-linHMMよりも高速なクラスタリングを実現している.今回,これらの手法を,GPSタグ付き写真コンテンツのクラスタリングに適用することを試みる.また,実データを用いた実験により,単純なx-meansよりも提案手法が効果的に動作することを確認した.
著者
喜田 拓也
出版者
日本データベース学会
雑誌
日本データベース学会論文誌 (ISSN:18831060)
巻号頁・発行日
vol.8, no.1, pp.125-130, 2009-06
被引用文献数
5

本論文では,刈り込み接尾辞木を用いた新たな可変情報源系列固定長符号化(VF符号化)の手法を提案する.この符号化手法は,頻度情報に基づいて刈り込んだ接尾辞木を文節木として用いてVF符号化する.VF符号は,すべての符号語が等長であるという工学的に好ましい性質があり,圧縮パターン照合などへの重要な応用がある.実験の結果,提案符号は,自然言語文書などに対して約41%の圧縮率を達成しており,良く知られているHuffman符号や,古典的なVF符号であるTunstall符号よりも圧縮性能が良いことがわかった.In this paper, we propose a new VF-coding method. It uses a frequency-base-pruned suffix tree as a parse tree. VF codes have some desirable features from engineering aspects, and there are some important applications such as compressed pattern matching. Experimental results show that the proposed code achieves the compression ratio of about 41% for a natural language text, which is better than Tunstall code and Huffman code.