著者
坂倉 悠太 天笠 俊之 北川 博之
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2012, no.3, pp.1-8, 2012-07-25

本稿では,閲覧者の増加や検索エンジン最適化のために多くのユーザアカウントを用いて対象 Web リソースをブックマークする "複数のユーザアカウントを用いた集中的ブックマーク (Intensive Bookmarking using Multiple Accounts, IBMA)" の検出手法を提案する.効率的に IBMA を検出するために,ブックマーク中の Web リソースもしくは Web サイトの共通性に基づいて,ユーザアカウントのクラスタリングをする.具体的には,類似した Web リソースもしくは Web サイトの集合をブックマークしているユーザアカウントをクラスタリングする.このために,二つのブックマーク集合に対する三つの類似度を提案する.実験により,提案手法が,実際のデータセットにおいて IBMA を正しく検出できることを示した.また,類似度ごとの提案手法の精度を評価し,特徴を述べる.This paper proposes a scheme of detecting "Intensive Bookmarking using Multiple Accounts" (IBMA), where many social bookmark accounts are used to create bookmark entries linking to the target web resources with the aim of increasing site visitors or optimizing search result ranking. To efficiently detect IBMA, we propose to use clustering social bookmark user accounts according to the similarity with respect to the bookmarked web resources or web sites. Specifically, we cluster users who create bookmarks linking to similar set of web resources or web sites. For this, we propose three similarity measurements over two sets of bookmarks. We experimentally show that the proposed scheme successfully detects IBMA spammers in a real dataset. We also evaluate the accuracy of the proposed scheme with varying the similarity measurements, and characterize them.
著者
松本 明 森嶋 厚行 北川 博之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.67, pp.83-90, 2002-07-18

既存のXML問合せ言語や操作系では,ユーザはテキストエディタや視覚的操作系を用いて問合せを直接記述する.我々はこれらとは全く異なるアプローチのXML操作系であるXLearnerの研究開発を行っている.XLearnerは,サンプルのXML要素に対するユーザの例示操作からシステムがXQuery問合せを推論する.構造化データであるRDB等と異なり,例示操作に基づくXQuery問合せ推論は自明ではない.XLearnerはXQuery問合せに対するシステマティックな推論機構を提供する.XLearnerを用いた問合せ推論過程では,ユーザとシステムのインタラクションが必要となる.本稿では,本推論機構の概要,および,問合せ推論に必要なインタラクション数に関する実験結果について報告する.Existing XML query languages are textual or graphical languages in which we can specify queries for XML manipulation. This paper explains XLearner, a different kind of manipulation framework for XML. XLearner infers XQuery queries based on operations of sample XML elements. Inferring queries for XML is a non-trivial task, because XML is a kind of semistructured data, in contrast to relational databases whose data structure is completely regular. XLearner gives a systematic way to infer XQuery queries. The algorithm requires interactions between the system and the users. The paper reports an overview of its inference mechanism and experimental results on the number of required interactions.
著者
佐藤 三久 朴 泰祐 建部 修見 天笠 俊之 櫻井 鉄也 山本 有作 高橋 大介 北川 博之
出版者
筑波大学
雑誌
基盤研究(A)
巻号頁・発行日
2005

P2Pグリッドとは、従来、各研究組織にある計算資源を共有することが目的であったグリッド技術を、P2P技術を活用しオフィスおよび個人のPCなどの潜在的な計算資源をグリッドの計算資源として活用するものである。本研究の目的は、期待される大量の計算資源による大容量コンピューティングのためのP2Pグリッド基盤を構築・利用する技術を確立し、その有効性を検証することである。1. P2P環境の潜在的な計算資源をグリッドの計算資源として活用するために、多くのPCで利用されているWindowsにおいてLinuxバイナリを実行するためのシステムBEEとUDPによるファイアウォール越えを用いたP2Pオーバーレイネットワークを開発した。さらに、P2P環境における認証機構として、匿名相互証明書とP2P通信を用いる認証方式AUBReX、他のジョブスケジューラと相互に協調し資源を共有する機構について開発した。2. 大容量コンピューティングのプログラミングモデルとして、RPCモデルから広域ネットワーク上の大容量データを効率的に扱うためのデータレイヤOmniStorageを開発し、それを拡張し、多数のノードに分散配置された大量データに対して、グローバルなデータ並列操作を行うプログラミング環境を提案した。また、大規模スケーラブルP2PにおけるXMLデータ管理について、MLデータの内容による検索に着目し,P2Pネットワーク上でXMLデータのキーワード検索を可能にする手法を考案した。3. P2Pグリッド向きのアルゴリズムとして、複素積分を用いた非線形固有値計算アルゴリズムや前処理手法を開発した。また、P2Pグリッドの有望な高性能な計算資源として、ヘテロジーニアスマルチコアであるCellプロセッサを取り上げ、この資源を利用するための数値計算ソフトウエアを実装した。
著者
塩川 浩昭 北川 博之 川島 英之 渡辺 陽介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.767-780, 2010-06-01
被引用文献数
2

近年,実世界から得られるストリームデータに対する問合せ要求が増大し,それらを実現するストリーム処理システムが研究開発されてきた.そして,地理的に離れた情報源の統合や負荷分散を実現させるために,ストリーム処理システムを分散配置させて利用する分散ストリーム処理システムが注目されている.分散ストリーム処理システムでは,複数のストリーム処理システムの入力と出力をつなぎ合わせることにより分散環境を構築するため,分散配置されたノートが一つでも停止してしまうと,システム全体が停止してしまうという問題がある.この問題を解決するため,本論文では,分散環境において高信頼化を実現するSemi-Active Standby方式を提案する.本方式は,既存方式であるActive Standby方式,Upstream Backup方式を統一化した方式であり,高信頼化におけるリカバリ時間とバンド幅使用率の調整を可能にする.本論文では,Semi-Active Standby方式の動作特性の詳細について述べる.また,我々が開発したプロトタイプシステムで行った評価実験について述べる.
著者
渡辺 陽介 北川 博之
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.10, pp.873-886, 2004-10-01
被引用文献数
15

今日,情報配信の形態としてデータ放送やプッシュ型情報サービスなどのデータストリームが注目されており,その数と種類が増加している.そのため,ストリーム型情報源の高度利用の重要性が高まっている.データストリームから必要なデータを抽出したり加工するための手段として,連続的問合せがある.多数のストリーム型情報源に対する多数の連続的問合せが与えられた際,その効率的実行が要求される.本論文では,そのためのアプローチとして,連続的問合せに対する複数問合せ最適化方式を提案する.本研究が想定する複数のデータストリームの処理環境では,連続的問合せ中の演算においてウィンドウなどの時間条件を用い,かつ利用者がその情報を必要とするタイミングで提供することが必要である.このような連続的問合せは,同一の演算であっても実行タイミングによって全く異なる結果を生成し得るため,従来のバッチ処理などを想定した複数問合せ最適化手法をそのまま適用することは困難である.本提案手法は,実行タイミングの違いによる問合せの参照範囲の違いを考慮し,参照範囲が近い同士の問合せをグループ化することにより効率的な実行処理プランを導出する.