著者
川中 翔 西田 京介 倉島 健 星出 高秀 藤村 考
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. LOIS, ライフインテリジェンスとオフィス情報システム (ISSN:09135685)
巻号頁・発行日
vol.112, no.35, pp.121-126, 2012-05-10

Twitterを情報源としてユーザ属性を活用したブランド特徴分析手法を提案する.提案法ではツイートから抽出するブランドの特徴語と,自己紹介文から抽出するユーザの属性語の共起から,ブランドの特徴語毎に関係の強い属性語を獲得する.提案法は,特に新しい点として,周囲のユーザから該当する属性語推定手法を含む.Twitterの実データを用いた実験において、属性語推定手法はランキング手法に比べ良い結果を示した.提案法は,限定的な実験ながら,属性語推定を行うことで,特徴語と関係の強い属性語を数多く獲得することを可能にした.
著者
谷本 直人 藤村 考
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.3, pp.37-42, 2005-01-19

ネット・コミュニティにおいて提供される様々な情報の評判を定量化する方法を述べる。本稿で提案するEigenRumorアルゴリズムは、コミュニティの参加者による情報の提供と、提供された情報に対する参加者による評価という2種類の行為を参加者から情報へのリンクとみなし、リンク分析によりそのネット・コミュニティでの情報の評判をスコアリングする。本アルゴリズムは、コミュニティ参加者の貢献度も同時に算出するため、コミュニティの中の「良い」参加者を特定するためにも有効である。また、評判の算出で重要な「さくら攻撃」に対する耐性について評価した結果を報告する。This paper describes a method for quantifying the degree of reputation for information resources provided in Electronic communities. The EigenRumor algorithm, proposed here, calculates the reputation scores based on a link analysis approach by considering information provisioning and information evaluation actions as links from participants to information resources. This algorithm also calculates the contribution level of participants in the electronic community and it is used to identify "good" participant as well as "good" information. The robustness of the algorithms against "ballot stuffing" attack is also discussed.
著者
宮田 章裕 塩原 寿子 藤村 考
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.52, no.4, pp.1438-1452, 2011-04-15

本論文では,文章を読む方向とそれに直交する方向を考慮した2次元のブロックを索引・検索のキーとする2次元文字ブロック検索手法を提案し,書籍内の局所領域にデジタルコンテンツへのハイパーリンク設置を可能にするシステムKappanを紹介する.従来,書籍内にハイパーリンクを設置する際はマーカを用いる方法があったが,この手法はあらかじめ書籍内にマーカを記載する必要がある.一方,システム上に書籍内のテキストと位置を関連付けておけばマーカは不要である.すなわち,書籍内を撮影した画像をシステムに送信すれば,システムは画像からOCR(Optical Character Recognition)により抽出したテキストを検索語として位置を特定し,その位置に関連付けられたコンテンツを提示できる.このとき,大量の書籍の中から一意に位置を特定するためには,長く連続するテキストを検索語とする必要がある.ところが,一般ユーザが撮影した画像にはOCR誤認識が約35%発生するため,長いテキストには誤認識文字が含まれて正しく検索できないという問題があった.特に書籍内の局所領域からは抽出できる検索語数が少なく,この問題は深刻である.提案手法は少ない文字数で書籍内の各局所領域に固有なパターンを表現できるので,OCR誤認識が発生する書籍内の局所領域画像から一意に位置を特定できる.73,231文書から局所領域画像を含む文書を一意に特定する検証実験では,提案手法はノイズがない状態で99%,ノイズが33%の状態でも92%の精度を示し,比較手法を上回ることを実証した.We present a text search method which takes into account not only the reading direction but also the non-reading direction. We use this method to develop a prototype system called Kappan. It enables service providers and users to create hyperlinks in books without markers. Existing techniques generally require markers to be printed on the page if a hyperlink is to be created. We consider that utilizing the concept of the search index makes markers unnecessary, i.e., the system can detect positions using text extracted from images via OCR (Optical Character Recognition) and provide users with position associated digital contents. Traditional text indexing methods must extract long character sequences from the partial image in order to identify the area exactly given the sheer number of book pages. However, considering that the average OCR error rate is more than 35 percent if the partial image is captured by a camera-equipped cellular phone, it is highly probable that many characters would be misrecognized and area identification would thus fail. In contrast, our indexing method can extract area-specific clues using fewer characters that can identify the area exactly even when the partial image is small and the extracted text contains misrecognized characters. An experiment proves that our method can identify the exact area from 73,231 documents with the high accuracy rates of 99 percent and 92 percent for OCR error rates of 0 percent and 33 percent, respectively.
著者
倉島 健 岩田 具治 星出 高秀 高屋 典子 藤村 考
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.6, no.2, pp.30-41, 2013-03-29

ユーザの過去の行動履歴から次の行動を予測し推薦するためのジオトピックモデルを提案する.提案モデルは,ユーザの行き先が,1) 家,勤務地,学校などが存在するユーザの行動範囲からの近さと,2) ユーザ自身の興味情報によって決まるという仮定に基づく確率的行動モデルである.ユーザの行動範囲が場所の選択に与える影響を明示的にモデリングすることで,位置情報(緯度,経度)以外の潜在的な場所特徴とそれに対するユーザの興味を効果的に学習することができる.評価実験においては,ユーザの興味情報を推定することでユーザの行動を高精度に予測できることを,レストランとランドマークの訪問履歴を用いて示す.さらに,人々のランドマーク選択を説明するためのユーザの興味対象が"アート","自然","建築物","知名度","眺めの良さ"などの潜在的なランドマーク特徴であることを明らかにした.This paper proposes a method that analyzes the location log data of multiple users to recommend locations to be visited. The method uses our new topic model, called Geo Topic Model, that can jointly estimate both the user's interests and activity area hosting the user's home, office and other personal places. By explicitly modeling geographical features of locations and users, the user's interests in other features of locations, which we call latent topics, can be inferred effectively. Experiments are conducted using Flickr-based and Tabelog-based location logs to evaluate the recommendation performance of the proposed method in terms of the accuracy of predicting visit selections. We also show that our model can estimate latent features of locations such as art, nature, construction, popularity and great views from location logs of landmark visits, and describe each user's preference based on them.
著者
倉島 健 岩田 具治 入江 豪 藤村 考
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. LOIS, ライフインテリジェンスとオフィス情報システム (ISSN:09135685)
巻号頁・発行日
vol.111, no.152, pp.7-12, 2011-07-14
参考文献数
17
被引用文献数
1

これまでに,旅行者の現在地,空き時間,興味に応じてトラベルルートを自動推薦する技術を提案してきた.本稿では,新たに,旅行者の移動手段も考慮し,空き時間内で周れるトラベルルートを生成する手法を述べる.また,写真共有サイトの画像群からランドマークの代表画像を抽出する手法も述べる.これにより,トラベルルート(ランドマークのシーケンス),旅行者の移動手段に応じて推定した旅行時間,そして,ランドマークの典型的な画像から成る"旅行プラン"を提示可能となる.
著者
倉島 健 岩田 具治 入江 豪 藤村 考
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. LOIS, ライフインテリジェンスとオフィス情報システム (ISSN:09135685)
巻号頁・発行日
vol.109, no.450, pp.55-60, 2010-02-25
被引用文献数
4

写真共有サイトのジオタグ情報を人々の旅行履歴として利用したトラベルルート推薦手法を提案する.提案法においては,現在地からアクセスしやすい場所と自分の興味に合致した場所に旅行者は移動しやすいと仮定し,写真共有サイトのジオタグ情報からフォトグラファーの行動モデルを生成する.この行動モデルを用いて,現在地,空き時間,個人の興味に合うトラベルルート推薦を実現する.写真共有サイトFlickrの71,718人に関するジオタグ情報に基づく実験により,行動予測における提案法の有効性を示す.
著者
松林 達史 山田 武士 藤村 滋 藤村 考
出版者
情報処理学会
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.1, no.1, pp.88-101, 2008-09-26
被引用文献数
1

本研究では,ラベル付きグラフ可視化のための,ラベルどうしが重ならない効率的な可視化座標計算の手法を提案する.従来のラベル付きグラフ可視化の座標計算アルゴリズムはForce-directed法やバネモデルといった,ノードを"点"として扱う座標計算を行うために,文字列や,異なるサイズのラベルを扱う場合,ラベルどうしが重なってしまうという問題が生じる.ラベルの重なりを回避する手法はいくつか提案されているが,いずれの手法も可視化計算を行った後に,再び座標計算処理を必要とする.これ等の手法では大規模なグラフ可視化では計算量が莫大となり,さらに元の可視化結果を破壊してしまうという問題が生じる.そこで,各ノードの斥力項として,ラベルサイズに依存した固有楕円ポテンシャルを与え,さらに,点対称ポテンシャルと固有楕円ポテンシャルの関数の重ね合わせる手法を提案する.提案法により,メンタルマップを保ちつつ,かつ,局所的なラベルの重なりを回避できることを示した.We present a new graph layout algorithm for a graph with node labels. The proposed algorithm can generate a graph layout efficiently avoiding overlapping of node labels. Most of the conventional algorithms such as force-directed and spring methods compute node positions by treating nodes as "points", and thus may cause node overlapping when strings or labels with various sizes are added to the nodes. Most of the conventional approaches to solve this problem require an initial graph layout creation phase without considering label sizes and a separate layout adjustment phase for overlap removal as its post processing. These methods are not suitable for a large-scale graph layout, because their computational costs are high and they may even destroy the initial graph layout. The proposed algorithm gives an individually different ellipsoidal potential to each node depending on its label size as well as a common point-symmetric potential, and the combination of these two potentials defines the repulsion force. This enables an efficient graph layout that can avoid local node overlaps while maintaining the mental map.
著者
藤村 考
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.108, no.119, pp.57-62, 2008-06-23
被引用文献数
1

BLOGRANGER TGは、大規模タグクラウド・インタフェースを有する新しいブログナビゲーションシステムである。タグクラウドの背景画像として地形図を導入し、タグ間の関連を直感的に把握できるようにした。本システムは、直近の5週間の約1500万の日本のブログ記事を分析し、約5000の有益なタグを自動抽出している。タグクラウドは毎週更新され、ブログ界全体の最新の構造を俯瞰することを可能にした。本稿では、BLOGRANGER TGの開発の経緯と目的、そして実現されている技術の概要について述べる。
著者
川中 翔 宮田 章裕 東中 竜一郎 星出 高秀 藤村 考
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.25, 2011

レビュー記事を用いてブランド間の競合関係を分析する手法を提案する.提案手法は,要因語出現分布の類似度を用いてブランド間の競合度を計算する.なお,本稿では,消費行動実施の決断にポジティブな影響を与えた事象や状態,条件を要因と定義し,個別の要因を抽象的に表現する語を要因語と定義する.提案手法はブランドペア毎に,Belkの消費者場面フレームワークに基づく5つの異なる競合度を計算する.
著者
倉島 健 藤村 考 奥田 英範
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.92, no.3, pp.301-310, 2009-03-01
被引用文献数
4

大規模ブログデータから,人間の経験に関する興味深い知識を発見する経験マイニング手法を提案する.経験とは,状況(時間,空間),行動(動作,対象),主観(評価,感情)とから成る情報であると定義する.一般に,人間の行動や,その行動を起こした結果として人間が抱く感情は,時間的・空間的要因によって規定されるため,状況,行動,主観との間には一定のルールが存在する.このルールの中でも特に,状況(時間,空間)に特有な行動と感情を表現するものを人間の経験に関する興味深い知識として発見する.本論文では,5属性(時間,空間,動作,対象,感情)を大規模ブログデータから抽出し,更に,得られた経験情報の中から,データマイニング分野で提案されているルールの"興味深さ"指標を用いた相関ルール抽出を行うことで,このような知識を発見する手法を述べる.また,感情属性に基づき,経験が動作主にとって成功だったのか,それとも失敗だったのかを導き出す手法も述べる.提案手法を実装したシステムにより約4,800万件のブログから知識発見を試みた結果,状況に特有な行動と感情を表現するルールの発見に至った.
著者
甲谷優 川島 晴美 藤村 考
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.247-252, 2008-09-14
被引用文献数
1

教えて!goo,Yahoo Answers をはじめとする QA サイトの利用が普及してきている. Adamic らは, Yahoo Answers の各カテゴリを分析し異なるタイプのコミュニケーションがとられている 3 つのクラスタに分類した.まず,教えて!goo の各カテゴリをコミュニケーションタイプで 3 種類に分類し, Adamic らと同様の分析を行うことで Yahoo Answers の分析結果と比較する.次に,コミュニケーションは時間とともに変化するという性質に着目する. Adamic らの行った QA ネットワーク分析には時間の尺度が考慮されていないが,本研究では QA ネットワークが時間とともにどう成長していくのかを分析する.Recently, the question-answer (QA) site, such as Oshiete! goo or Yahoo Answers becomes more and more popular. Adamic et al. analyzed question-categories in Yahoo Answers, and they classified the categories into three clusters. The clusters are different from each other in communication types. First, we classify categories in Oshiete! goo into three groups according to the same way as Adamic et al. did, and compare Oshiete! goo with Yahoo Answers. Furthermore, we study the dynamic structure of social interaction pattern which Adamic et al. did not addressed.