著者
後藤 清豪 高田 秀志
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.41, pp.1-8, 2010-11-05

現状のウェブでは検索エンジンや推薦アルゴリズムの発達により,求める情報を容易に得ることが可能である.しかし,明確に求めているわけではないが,与えられれば好奇心が刺激されるような情報である「意外な情報」を得る手段として確立されたものはない.一方で,日常生活においては,人との交流や会話などから「意外な情報」を偶然得られることがある.そこで本研究では,ソーシャルメディアにおいて,意外な情報の提供者になり得る人物を推薦する手法を考える.その一つとして,ソーシャルメディア上のユーザの行動から,被推薦者にとって意外な情報の提供者となり得る人物を推薦する手法を提案する.また,本手法をTwitterを対象として実装し,推薦した人物が被推薦者にとって意外な情報の提供者になり得るかどうかを,他の人物推薦システムと比較して検証する.
著者
田代 祐一 大石 哲也 越村 三幸 藤田 博 長谷川 隆三
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.40, pp.1-6, 2010-11-05

Web上の情報が増大するにつれ,ユーザが望む情報を推薦したり,フィルタリングしてくれるような技術の必要性が高まっている.近年,普及しているソーシャルメディアのひとつにソーシャルブックマークがあるが,このソーシャルブックマークにおけるあるユーザのブックマーク情報はユーザの嗜好に基づいてフィルタリングされた情報とみなすことができる.そこで,本研究では特定のトピックについて有用な情報を多くブックマークしているユーザを発見し,推薦する手法を提案する.
著者
北山 大輔 李 龍 角谷 和俊
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.35, pp.1-8, 2010-11-05

ある目的地への行き方を調べるなど旅行の計画を立てる時に,デフォルメ地図は頻繁に利用される.しかしながらデフォルメ地図は過剰な編集や誤った編集によって,ユーザに誤解や誤情報を与えることがある.そのため,地図の信憑性を分析し,デフォルメを評価する手法が必要となる.デフォルメ地図の種類によって,許容される編集と許容されない編集があると考えられる.例えば,道案内をするための地図であれば,参考として書かれている周辺のオブジェクトの位置関係は誤っていても許容されるが,経路上のオブジェクトの位置関係は正確でなければならない.このように,デフォルメの評価はデフォルメの種類ごとに異なると考えられる.そこで本研究では,デフォルメ地図に記載されているオブジェクトの空間的な配置の特性と,表示されているオブジェクト間の意味的な関係に基づきデフォルメ地図を分析する手法を提案する.
著者
岡田 崇 湯本 高行 新居 学 高橋 豐
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.33, pp.1-8, 2010-11-05

本論文では,Web 上での概念間の共通性に基づいた比較可能性の判定を行う手法を提案する.比較可能性とは概念が持つ重要な特徴が共通しているかどうかを表すものであり,似ているかどうかを表す指標である類似性とは異なる.概念は一般的な言葉を複数用いて説明できる語であり,その説明には他の概念や説明語を用いて表現される.説明語とは一般的に用いられる言葉のことで,それ以上の説明が不要な語である.本研究で扱う概念は商品や機能などに限定している.比較可能性の判定には,概念と説明語から生成した重み付き有向グラフを用いて行う.具体的には,概念の持つ特徴などを説明している文から重要な語を抽出し,それらの集合の関係から判定を行う.提案手法の有用性を評価するために,評価実験を行った.実験により,比較可能な概念間において,共通する重要な特徴が抽出できていることがわかった.
著者
本村 徹太郎 清水 敏之 吉川 正俊
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.29, pp.1-8, 2010-11-05

近年,多くの XML データが蓄積されるにつれ,XML キーワード検索が重要になっている.有用な結果を得るためには,効果的な検索結果を効率的に求めることだけでなく,検索結果を理解できるような情報を付加することが望ましい.我々は,検索結果の理解支援のために,検索結果と同じ結果を返す代替問合せを取得する方法を提案する.代替問合せは検索結果の異なる側面を表しているため,利用者は検索結果の隠れた関係を推測することで検索結果を深く理解する,あるいは利用者自身の問合せを洗練することなどが可能となる.
著者
押野 泰平 浅野 泰仁 吉川 正俊
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.27, pp.1-8, 2010-11-05

Web の構造的特徴に基づくグラフパターンは,web 解析や情報検索に重要な役割を果たしている.我々は web の構造情報だけでなく時間情報をも用いた新たなグラフパターンとして,時間グラフパターンというものを提案し研究を行ってきた.これまでの研究では,頻出グラフパターンを列挙することによってサンプルグラフ集合から時間グラフパターンをマイニングする手法を提案した.本稿ではマイニングされたパターンを用いた web 解析として,web サイトを話題の盛り上がり時における三つの役割として一次情報源,盛り上げ役,まとめ役に分類することを試みる.新たなグラフマイニング手法を用いることで,これまで達成できなかった三つの分類が可能になったことを示す.
著者
見市 高一 川越 恭二
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-151, no.25, pp.1-7, 2010-11-05

Yahoo! 知恵袋や教えて! goo などの QA サイトで質問回答の検索を行う利用者 (以下,検索利用者と呼ぶ) が多数存在し,日常の疑問の解決や情報交換が行われている.QA サイト内において過去に質問を行った質問者の質問意図と,検索利用者の検索意図との間に差が生じるため,求める回答にも差が生じ,結果的に検索利用者の意図した回答が取得できないという問題が存在する.そこで,検索利用者の検索意図が複数存在することに着目し,これらを入力することでシステムがその意図を反映し,検索利用者の意図した回答の検索が行うことが可能であると考えた.本研究では,この複数存在する検索意図のことを S 項目と定義する.評価実験の結果,Yahoo! 知恵袋の検索結果と比較して,S 項目を用いた回答検索手法の検索精度が向上した.
著者
小河 真之 原田 史子 島川 博光
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-150, no.17, pp.1-8, 2010-07-28

現在インターネット広告では,様々な広告提示手法が用いられている.しかし,消費者が知りたいと思う商品の特徴や消費者が好む広告のデザインやメッセージを考慮していない.また,消費者の状況を考慮できておらず,最適な広告が提供できていない.本論文では,消費者の購買行動時における情報探索行動を考慮し,消費者の状況と消費者が必要とする商品情報とデザインおよびメッセージを個人に合わせた,インターネット広告の構成手法を提案する.本手法では消費者の情報収集行動に着目し,消費者の状況を把握する.また,分類された広告の商品情報とデザインを用いて,消費者の特性を抽出する.そして,これらの定量的な指標で表された消費者の状況や特性をもとに,消費者一人ひとりに合わせた広告を構成する.本手法により,各消費者に説得力のある広告メッセージが選択でき,各消費者に合わせた個別広告が提供できる.
著者
山本 和英 中山 匠
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2010-NL-198, no.1, pp.1-7, 2010-09-09

日本語の動詞と形容詞はその形態によって明確に分類されている。ところが両者の意味を考えると一部の動詞は動作というよりも対象とする事物の状態を表現 (すなわち形容) していると見なしたほうが自然である。本稿ではこのような日本語の動詞と形容詞の分類の意味的ずれに着目し、新たな用言の分類 「形状性用言」 「作用性用言」 を提案する。まず動詞・形容詞という形態上の対比よりもより意味に近い形状性・作用性という分類が実用上有益であることを議論し、形状性用言の定義、及び辞書の作成に際しての検討課題を整理する。
著者
柴木 優美 永田 昌明 山本 和英
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2010-NL-198, no.3, pp.1-8, 2010-09-09

Wikipedia を利用し,人に関する大規模な is-a 関係のオントロジーを構築する手法を提案する.本手法では初めに,人を表すカテゴリを機械学習による分類器で判定し,Wikipedia の階層構造をそのまま利用して is-a 関係だけから構成される人のカテゴリ階層を構築する.その後,人を表すカテゴリが付与されている記事から,人を表す記事をインスタンスとして抽出する.機械学習では,カテゴリ名及びカテゴリの周辺の単語が,日本語語彙大系のインスタンスとどのようにマッチするかを素性にした.その結果,人を表すカテゴリを適合率 99.3%,再現率 98.4%,人を表すインスタンスを適合率 98.2%,再現率 98.6% で抽出することができた.
著者
池田 和史 柳原 正 松本 一則 滝嶋 康弘
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.68-77, 2010-09-28

ブログ上の文書には口語的な表現や特有の表記などのくだけた表現が多数含まれるため,一般の形態素解析器を用いても十分な解析精度を得ることはできない.くだけた表現は人手により辞書登録されることが一般的であるが,人的コストの大きさや専門的な知識を必要とすることが課題である.本稿ではくだけた表現を正規な表現に修正することで高精度な形態素解析を実現する手法を提案する.提案手法ではくだけた表現の修正候補文字列をくだけた表現の少ない文書から自動的に検索し,修正ルールを生成する.生成した多数の修正ルールから文脈に適した修正ルールを選択的に適用するために,検索結果における修正候補文字列の出現頻度,修正前後の文字列間における編集距離,修正前後の文の形態素解析結果の比較,を用いて修正ルールをスコアリングする手法を合わせて提案する.提案手法と従来手法の性能比較評価実験を行い,各手法における未知語の出現率や単語区切りの正確さ,修正前後の文の意味変化を定量的に評価した.提案手法では従来手法と同程度の単語区切りの正確さを維持しながら,対象文章の未知語出現数を 36.1% 減少させることに成功した.これは従来手法における未知語減少数の 2.5 倍以上である.
著者
廣嶋 伸章 戸田 浩之 松浦 由美子 片岡 良治
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.33-45, 2010-09-28

Web 検索において,あるクエリが入力された際に,そのクエリの種別を知ることができれば,それに応じてシステムの応答を変化させることが可能となり,適切な検索結果を提示することができる.たとえば,あるクエリの種別が 「グルメ」 であることが分かれば,レシピ検索とブログ検索の結果を提示することができる.このようなシステムの応答を変化させるための条件であるクエリの種別をクエリタイプと呼ぶことにする.クエリの属するクエリタイプを知ることで,上で述べたような利便性の高い検索サービスが実現できる.そこで本論文では,様々なクエリに対してクエリタイプを判定する手法を提案する.提案手法では,単語に対してその単語の分野を表す概念ベクトルが付与された概念ベースを参照して,クエリに関する文書から得られたクエリ分野ベクトルと各クエリタイプ分野ベクトルとのコサイン距離に基づきクエリタイプを判定する.実験では,27 のクエリタイプに対し,提案手法単独で 64.6%,Wikipedia などの情報を利用した手法を組み合わせることにより 77.1% の精度で判定を行うことができた.
著者
藤田 遼治 太田 学
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.78-87, 2010-09-28

我々は,検索結果の推移を用いてユーザの検索意図を推測し,ユーザの代わりに検索質問を生成して検索する先読み検索を提案する.本研究では,検索結果の推移に加え,ユーザが入力した検索質問の変化パターンを利用してユーザの検索意図を推測する.本稿では実装したプロトタイプシステムを,擬似適合性フィードバックによる検索,および Google が示す検索キーワード候補による検索と比較することにより評価を行った.さらに,先読み検索において検索質問変化パターンを考慮することの効果を定量的に評価した.
著者
数原 良彦 宮原 伸二 植松 幸生 金田 有二 藤野 昭典 片岡 良治
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.99-111, 2010-09-28

情報検索において,機械学習の枠組みでランキング関数の最適化を行うランキング学習が重要な課題である.従来のランキング学習手法では人手による適合性評価,もしくはクリックログから得られる訓練データを利用してきた.我々は,これらの複数情報源を適切に利用し,より高精度なランキング学習を達成することを目標とする.我々は複数情報源から得られる訓練データは,適合性分布が異なると考えた.そのため,訓練データの適合性分布が同一であることを仮定している従来の教師あり学習に基づくランキング学習手法では,複数情報源を用いたランキング学習の実現が困難だと考えられる.そこで我々は,分布が異なる訓練データを用いて転移学習の枠組みに着目し,転移学習をランキング学習に適用することによって適合性分布が異なる複数の情報源を用いたランキング学習の実現を試みる.本稿では,転移学習の枠組みに基づくランキング学習手法 TRankBoost を提案し,商用モバイルウェブ検索エンジンの実データを用いた評価実験によって有効性を検証した.評価実験により,TRankBoost によって,従来手法である RankingSVM,RankBoost と比べて NDCG@5,10 の値で上回る精度のランキングを実現することを示した.
著者
稲垣 陽一 中島 伸介 張 建偉 中本 レン 桑原 雄
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.3, no.3, pp.123-134, 2010-09-28

本研究ではブロガの体験熟知度に基づいたブログランキングシステムの開発を行った.ユーザが入力した検索キーワードに対して,関連するトピックを複数抽出し,各トピックに関するブロガの体験熟知度を算出する.これに基づいてブログエントリのランキングを行う.熟知度スコアが高いブロガ (熟知ブロガ) が書いたエントリは,熟知度スコアが低いブロガが書いたエントリよりもランキングが上位となる.ブロガの熟知度スコアは,ブロガが過去に投稿したエントリ内で,各トピックに関して共起に基づいて抽出した特徴語をどれほど使ったかを分析することで算出される.なお,開発したシステムは,視点の異なる複数のランキングを提示するとともに,エントリ投稿者 (ブロガ) の特性に関する補助情報を提示している.これにより,ユーザは閲覧するブログエントリの信頼性を自分なりに判断することが可能となる.我々は開発した実証実験システムをWeb上で公開するとともに,これを用いた評価実験を行った.提案システムにより提示される熟知ブロガおよびブログエントリの妥当性が十分に高いことを確認できた.
著者
平尾 努 鈴木 潤 磯崎 秀樹
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.2, no.1, pp.1-9, 2009-03-31

従来の文短縮手法の多くは,入力された文を構文木として表現し,その部分木を削除することで,短縮文を生成する.このようなアプローチは文法的な短縮文を生成するという観点からは理にかなっている.しかし,多くの場合,人間は構文木の刈り込みだけで短縮文を生成するわけではない.これは,構文情報に過度に依存することが,高品質な文短縮を行うための妨げとなることを示している.そこで,本稿では,構文情報を用いない文短縮手法を提案する.短縮文の言語としてのもっともらしさを構文情報を用いずに評価するため,原文と大規模コーパスから得た統計情報を組み合わせた新たな言語モデルを提案する.提案手法を文献 18) のテストセットを用いて評価したところ,自動評価指標においては,提案手法が従来法より優れていることを確認した.さらに,提案手法が日本語だけでなく英語でも有効であることも示す.
著者
小田嶋哲哉 李珍泌 朴泰祐 佐藤三久 塙敏博 児玉祐悦 RaymondNamyst SamuelThibault OlivierAumage
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2012-HPC-135, no.9, pp.1-8, 2012-07-25

GPU クラスタ上でのプログラミングは,様々なプログラミングフレームワークが直交しており,複雑になってしまうことが多い.本研究では,XMP をアクセラレータを持つ並列計算機向けに拡張した言語仕様 XMP-dev の一実装として,GPU と CPU によるハイブリッドワークシェアリングを容易に行うことができる XMP-dev/StarPU を提案し,プロトタイプ実装を行う.XMP-dev は,XMP が本来提供している分散メモリノードへのデータと処理の分割・通信の機能に加え,各ノードでの処理の一部を GPU にオフローディングをすることが可能である.しかし,現在の実行モデルでは GPU にオフロードされた部分はすべて GPU により実行され,CPU との協調計算やワークシェアリングを行うことができない.本研究では,StarPU をバックエンドスケジューラとして用い,計算をタスクという単位で GPU や CPU へスケジューリングをすることで,GPU / CPU のワークシェアリングを可能とする.本稿では,現在開発中の XMP-dev/StarPU のプロトタイプコンパイラと同等の動作をするハンドコンパイルしたコードを用いて重力 N 体問題について評価を行う.結果として,GPU/CPU ワークシェアリングは機能しているが性能向上は十分ではなく,大きな要因は GPU と CPU の性能差に対応する十分な問題サイズを与えることが難しいこと,また,これを改善するために何らかの負荷バランス機能が必要であることがわかった.
著者
松木保浩 稲垣 嘉信 坂本 久 喜田弘司 垂水 浩幸
雑誌
情報処理学会研究報告コンピュータと教育(CE)
巻号頁・発行日
vol.2006, no.108(2006-CE-086), pp.59-66, 2006-10-21

近年,学生がレポート作成時にwebで手軽に調査できるようになって来たが,ただ写しているだけという弊害も指摘されている.そのような中,まじめにレポートを作成した学生には努力を正当に評価されたいという要求がある.本稿では,レポート作成中のコピー操作やキーボード操作など,学生のレポート作成過程を記録し,教師にレポート作成時間や文字の入力頻度などの様々な解析結果を閲覧させることにより,まじめな学生が正当な評価を受けられるよう支援するシステムについて,基本設計と予備調査実験について述べる.