著者
大島 裕明 小山 聡 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.47, no.19, pp.98-112, 2006-12-15
被引用文献数
15

本研究では,ユーザが与えた1語のクエリに対して,Web検索エンジンが持つ情報のみから同位語とそのコンテキストを発見する手法について提案する.同位語とは,共通の上位語を持つような語のことである.従来研究として,同位語や,上位語,下位語などを求めるような研究は数多くあるが,それらはWeb上の文書を利用するものも含めて,巨大なコーパスを解析して大量の結果を求めるというものであった.我々の提案する手法では,Web文書のタイトルやスニペットといったWeb検索エンジンが持つ情報のみを,少ない回数のWeb検索によって取得し,それらを解析して同位語を発見する.提案手法では,ある語に対する同位語は並列助詞「や」で接続されることを利用してWeb検索エンジンに対するクエリを作成して,その検索結果のみから同位語を得る.そこでは何の事前準備も必要なく,また,あらゆる分野の語に対して同位語を発見することができる.さらに,発見された同位語とクエリの語の背後にあるコンテキストも同時に取得する.このような同位語発見は,Web検索におけるクエリ拡張や想起支援や,何かを調べるにあたって他のものと比較したいときの比較対象の発見など,幅広い分野で利用することができると考えられる.We propose a method of using only a Web search engine index to discover coordinate terms, i.e., terms that have the same hypernym. Several research methods acquire coordinate terms, but they require huge corpora or many Web pages. Our proposed method uses only the information in a Web search engine index such as titles and snippets of Web pages. These are obtained by a few Web searches, and then they are parsed to discover coordinate terms. We focus attention on coordinate terms that are connected by the coordinating particle "ya," and use those to make queries for a Web search engine. Our method does not require any preprocessing, and can find coordinate terms for terms in any field. At the same time, we find the background context between a query term and each discovered coordinate term. Such a service for discovering coordinate terms can be used in any field for such purposes as query expansion, word remembrance support system, or finding comparable objects.
著者
大島 裕明 山本 祐輔 山家 雄介 高橋 良平 ヤトフト アダム 中村 聡史 田中 克己
出版者
社団法人情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.61, no.1, pp.2-7, 2011-01-01
被引用文献数
1

Web情報には多様な情報が存在しており,本当に信じてよいのかどうかは慎重に検討しなくてはならない。特に,Web2.0コンテンツは,これまでの本や新聞などのメディアよりも,情報の品質が低い可能性があるため,信憑性の検証が必要であると考えられる。本稿では,そのようなWeb情報の信憑性という課題に対して,情報技術がどのような役割を果たせるかということについて議論する。まず,情報の信憑性という概念について整理を行う。また,現在,Web情報の信憑性に関連して行われている研究について紹介する。さらに,われわれが行っているWeb情報の信憑性検証技術に関する研究の紹介を行う。
著者
山本 祐輔 山本 岳洋 大島 裕明 川上 浩司
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.12, no.1, pp.24-37, 2019-01-16

本稿では,ウェブ検索エンジンなどの情報アクセスシステムを用いて情報を精査し,正確なウェブ情報を収集する能力「ウェブアクセスリテラシー」を測定する尺度と質問紙を提案する.提案したリテラシー尺度の信頼性,妥当性の評価を行うために,クラウドソーシングサービスを用いて534名のウェブユーザにオンライン調査を行った.因子分析の結果,ウェブアクセスリテラシー尺度は7因子構造であった.また,ウェブアクセスリテラシー尺度の総合得点は,当該尺度と関連すると考えられる健康リテラシー尺度得点と弱い正の相関(r=0.32,p<.001)を,ウェブ情報に対する信用度と弱い負の相関(r=-0.20,p<.001)を示した.さらに,情報リテラシー関係の講義の受講経験別にウェブアクセスリテラシー尺度得点を確認したところ,統計的有意差が確認された(F(1, 525) = 8.82,p<.01).信頼性を示すクロンバックのα係数については,6つの因子は0.8以上,1因子については0.76であった.
著者
岡 隆之介 大島 裕明 楠見 孝
出版者
公益社団法人 日本心理学会
雑誌
心理学研究 (ISSN:00215236)
巻号頁・発行日
pp.90.17236, (Released:2018-12-25)
参考文献数
22
被引用文献数
1

The purpose of this study was to develop and test the validity of an item set of simile interpretations for metaphor research. We conducted three tasks. In an interpretation generation task, 50 university students generated up to three interpretations for each of 120 simile expressions collected by Nakamoto and Kusumi (2004). In a conventionality rating task, 24 university students rated the conventionality of vehicles based on the most typical interpretation collected in the interpretation generation task. In a metaphor preference rating task, 24 university students rated their metaphor form preference. Our results showed significant positive correlations between topic-vehicle similarity ratings collected in a previous study and the number of interpretations. In addition, linear regression analysis of the metaphor preference rating showed significant positive effects of vehicle conventionality, topic-vehicle similarity, and entropy. These results solidly replicated the results reported in previous studies and confirmed the validity of an item set of simile interpretations. The usefulness of simile interpretations collected in this study for future metaphor studies is discussed.
著者
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.105, no.171, pp.179-184, 2005-07-06

近年, デジタルカメラ付き携帯電話やノートPCが普及してきており, 個人の所有するコンテンツが増加してきている.これらのコンテンツの中には他者にとって有用なコンテンツが含まれている.また, アドホックネットワークやインスタントメッセンジャーの様にユーザ同士がPeer-to-Peerに接続し, 自律分散的に形成されるネットワークが生まれてきている.そこで我々はこの様な環境においてコンテンツを共有・検索する手法について提案する.従来型のP2Pネットワークにおける検索ではファイル名とのキーワードマッチングのみであった.提案手法では, あるコンテンツの文脈情報-コンテンツの置かれている状況-を抽出・提示する事により, ユーザがコンテンツを評価できるようにしたり, 発見的に関連コンテンツを検索したり出来るようにする.
著者
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.67, pp.229-235, 2005-07-13

近年,デジタルカメラ付き携帯電話やノートPC が普及してきており,個人の所有するコンテンツが増加してきている.これらのコンテンツの中には他者にとって有用なコンテンツが含まれている.また,アドホックネットワークやインスタントメッセンジャーの様にユーザ同士がPeer-to-Peer に接続し,自律分散的に形成されるネットワークが生まれてきている.そこで我々はこの様な環境においてコンテンツを共有・検索する手法について提案する.従来型のP2P ネットワークにおける検索ではファイル名とのキーワードマッチングのみであった.提案手法では,あるコンテンツの文脈情報??コンテンツの置かれている状況??を抽出・提示する事により,ユーザがコンテンツを評価できるようにしたり,発見的に関連コンテンツを検索したり出来るようにする. Recently, a cellular phone with a digital camera and a PDA have been popular , and then contents stored in a local computer are increasing. Some of them are useful for others. At the same time, many autonomous distributed networks emerge, such as ad-hoc networks or instant messengers. They are composed of indivisual users. We propose a method to share and search contents in those networks. Traditional method to search on a P2P network is just matching search keywords with file or directory name and it is insufficient. We propose a search method for P2P contents based on context of contents. Here, the context of contents means the situation which relates to contents and help you understand it better. The context makes users possible to understand the outline of the contents and to discover related contents.
著者
橋口 友哉 山本 岳洋 藤田 澄男 大島 裕明
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.36, no.1, pp.WI2-B_1-13, 2021-01-01 (Released:2021-01-01)
参考文献数
25

In this study, we tackle the problem of retrieving questions from a corpus archived in a Community Question Answering service that a consultant having distress can feel empathy with them. We hypothesize that the consultant feels empathy with the questions having a similar situation with that of the consultant’s distress, and propose a method of retrieving similar sentences focusing on the situation of the distress. Specifically, we propose two approaches to fine-tuning the pre-trained BERT model so that the learned model better captures the similarity of the situation between distress. One tries to extract only the words representing the situation of the distress, the other tries to predict whether the two sentences show the same situation. The data for training the models are gathered by the crowdsourcing task where the workers are asked to gather the sentences whose situation is similar to the given sentence and to annotate the words in the sentences that represent the situation. The data is then used to fine-tune the BERT model. The effectiveness of the proposed methods is evaluated with the baselines such as TF-IDF, Okapi BM25, and the pre-trained BERT. The results of the experiment with 20 queries showed that one of our methods achieved the highest nDCG@5 while we could not observe any significant differences among the methods.
著者
佃 洸摂 大島 裕明 山本 光穂 岩崎 弘利 田中 克己
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.7, no.1, pp.1-17, 2014-03-28

本稿ではユーザが与えた1語のクエリに対して,そのクエリに関する意外な情報を発見する手法の提案を行う.提案手法では,クエリに対して意外度の高い関連語を発見し,クエリと意外度の高い関連語を基に意外な情報を発見する.その際,クエリの関連語の中でもクエリとの関係が非典型的であり,かつ認知度が高い関連語ほど意外度が高いという仮説に基づいて関連語の意外度を求める.たとえば提案手法により,“落合博満”というクエリに対して“ガンダム”という関連語の意外度が高いことが分かり,これを基に“落合博満はガンダムマニアである.”という意外な情報を発見できる.提案手法では,Wikipediaから得られる情報のみを用いてクエリに対する意外な情報の発見を行う.実験では75語のクエリを用いて評価を行い,クエリと関連語間の関係の非典型度,および関連語の認知度を考慮することの有効性を示した.
著者
神門 典子 吉岡 真治 山本 岳洋 酒井 哲也 相澤 彰子 大島 裕明
出版者
国立情報学研究所
雑誌
基盤研究(A)
巻号頁・発行日
2016-04-01

平成28年度の研究実績の概要は下記の通りである。(1)ユーザの状況の捕捉と分析:探索的検索の例として、網羅的な情報探索タスク、探索中のユーザの時間認識、および、モバイル検索と音楽検索における複雑さの異なる検索タスクにおいて、ユーザ実験を行い、ログと、視線・インタビュー・アンケートなどのインタラクションデータを収集し、タスクと状況に応じた傾向を分析した。(2)ユーザの状況に応じて、ユーザを支援する技術: a) 網羅的情報探索のタスクにおいて探索を支援するクエリ推薦インターフェース、b) マルチファセット検索インタフェース、c)検索結果の多様化と多段階要約提示、d)ファセット検索の精緻化に必要な要素技術として 1) Wikipedia、DBPediaなどからのNamed Entityの属性抽出と組織化、2)文書中の非自然言語要素(数式など)へのアクセスについて、研究を進めた。上記a)は、あるクエリに対する未知の適合情報を含む度合いを、観点多様性と既知適合情報のディスカウントを考慮して定式化している。ユーザ実験の結果、既存方式よりも有効なことが示唆された。b)は、広く多様なタスクに適用可能な基盤技術の一つである。c)は、モバイル検索など、画面の小さいデバイスを用いて、探索的な検索において、特に有用である。(3)検索の基礎技術として、検索の多様化について研究を進めた。また、検索実験の規模(とくに、検索課題(topic)数)による実験結果の信頼性・妥当性を検証する方式を提案し、数学・統計学の理論に基づいて考究するとともに、多くの実例に適用して検証をすすめた。
著者
大島 裕明 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.112, no.75, pp.49-54, 2012-05-29

本稿では,まず,東京の寿司屋に対するオンラインレビュー情報について,専門家による評価情報とどの程度異なるかを明らかにする.さらに,オンラインレビュー情報で提供されている情報を用いて専門家による評価情報と似たような寿司屋のランキングを行う手法について,HITSアルゴリズムを基にした手法を提案する.提案手法について評価実験を行い,その有効性を明らかにする.
著者
加藤 龍 大島 裕明 山本 岳洋 加藤 誠 田中 克己
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2013-DBS-157, no.16, pp.1-6, 2013-07-15

本研究では,クエリとしてある目的が与えられた際に,その目的を達成するために必要なタスク集合をウェブから発見するタスク検索を提案する.本稿では,タスク検索の第一歩として,入力クエリを効果的にクエリ拡張することで,元のクエリでは発見不可能なタスクを含んだウェブページを収集する手法について提案する.提案手法では,検索連動型広告に着目し,動詞の出現パターンを用いてタスクに関連した動詞を抽出することで,クエリ拡張を行う.
著者
竹原 幹人 大島 裕明 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.105, no.171, pp.29-34, 2005-07-06
参考文献数
17

本論文では, Blogからニュース記事に対する意見を抽出し, Blogの書き手の興味を考慮して意見を提示するシステムの提案を行う.従来のWebではなくBlogという枠で考えることで, より最近の話題についての意見などの情報を提示することができ, また現在重要なものではなく今後重要になるかもしれない情報に着目することができるようになると思われる.Blogでは, 話題となっているニュースに対し, 書き手独自の視点に立った意見が書かれることが多い.多くのBlogからこのような意見を抽出し, 統合して提示を行う.またBlogには, 同じ書き手が書いた過去の記事が含まれる.これまでに書かれた記事から, 書き手の持つ興味を推測することが可能である.この興味を利用して意見を提示することで, ある話題に対しどのような人がどのような意見を述べているかを把握することができる.
著者
中谷 誠 Jatowt Adam 大島 裕明 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. データベース・システム研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.146, pp.253-258, 2008-09-14
参考文献数
13

検索語が属する分野における専門語は,ユーザが検索結果に含まれるウェブページの内容を理解する上で重要な役割を持っている.専門語が多く含まれるウェブページは,非専門家ユーザにとっては理解しづらいが,一方で専門家ユーザにとっては読みやすく詳細な情報を得る上で有用である.本研究では,Wikipediaのリンク構造とカテゴリ構造を用いて,ユーザの入力した検索語からその語に関する専門語を抽出する手法について述べる.Wikipedia中で検索語が含まれている記事のカテゴリ情報を集約することによって検索語の属する専門領域を検出し,その領域の内外でリンクの出現頻度を分析することによって専門語を抽出する.本研究の提案手法は幅広い分野を網羅しており多言語対応しているWikipediaを用いているので,検索語の分野や言語に関係なく専門語を取得することができる.
著者
大島 裕明
出版者
京都大学
雑誌
若手研究(B)
巻号頁・発行日
2009

本課題では、リアルタイムに知識発見を行う技術の開発を行った。主に、2つの異なる方向性を持つ構文パターンを用いてWeb検索を行い、その検索結果のテキストから効率的に目的の知識を獲得する手法を用いて、様々な知識発見手法を開発した。様々な種類の知識を発見するために、適切な構文パターンを発見する手法についても開発した。さらに、様々な知識発見手法を用いたアプリケーションの作成を行った。
著者
田中 克己 チャットウィチェンチャイ ソムチャイ 田島 敬史 小山 聡 中村 聡史 手塚 太郎 ヤトフト アダム 大島 裕明
出版者
京都大学
雑誌
特定領域研究
巻号頁・発行日
2006

ウエブからの同位語等の概念知識の抽出,ウエブ検索クエリの意図推定・自動質問修正,ウエブ情報の信憑性分析,ユーザインタラクションやウエブ1.0情報とウエブ2.0情報の相互補完による検索精度改善に関する技術開発を行った.
著者
大島 裕明 小山 聡 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.72, pp.345-351, 2004-07-14
被引用文献数
2

個人のコンピュータには,その個人がどのような知識を持っているか,どのような考え方をしているか,ということが分かる情報が含まれている.しかし,それらはコンピュータに利用できるような状態にはなっていない.現在,さまざまな分野でシソーラスのような一般的な概念体系が用いられているが,個人のコンピュータに存在するコンテンツから個人的な概念体系が作成されれば,さまざまな分野におけるパーソナライザーションが可能になる.本稿では,個人コンピュータに存在する文書とその分類の方法から,個人的な概念体系を作成する手法について提案を行い,作成された個人的な概念体系を用いてウェブ情報検索におけるパーソナライゼーションを行う手法について提案を行う.A personal computer has a lot of documents. Those include much information that shows what the user is interested in, knows, and so on. However, the computer just has the information and it can not be used automatically. Now, common concept classification like thesaurus is used in many fields, so if the personal concept classification is created automatically based on the personal contents in the personal computer, it will be possible to be personalized in many fields. In this paper, we propose the way to create the personal concept classification from the personal contents and the method of the Web search personalization.
著者
小谷 彬 大島 裕明 小山 聡 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.149, pp.35-40, 2006-07-06

Webサイトには効率よく必要な情報を得るために,サイトマップが存在し,そのサイトの構造や内容に基づいて情報が整理され提示されている.ユーザにとっては,それが複数のWebサイト間で同様の形式で整理されていることが望ましい.なぜなら類似したWebサイト間において,共通の項目に関するページを比較して閲覧することは,ユーザにとって負担であり困難でもあるからである.そこで我々は複数のWebサイト間における共通属性を抽出し,その共通属性の各属性に該当するWebページを抽出する手法を提案する.その結果,複数のWebサイトに共通のサイトマップが生成できることになる.共通属性抽出においては,属性を一語で表すための手法について述べ,さらに属性間の階層化や類似属性の統合のために,複数の語で属性を現す属性拡張の手法についても述べる.
著者
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.104, no.176, pp.157-162, 2004-07-06

近年P2Pネットワークが注目されて久しい.P2Pネットワークはサーバクライアントモデルに比べて,情報共有が容易なモデルであると考えられる.しかしながら,そこでの情報検索は検索の高速化という側面においては研究が盛んであるものの,情報検索という面においてはファイル名とクエリとのマッチングという原始的な手法が主であり,十分とはいえなかった.このため本論文ではP2Pネットワークにおける検索についての問題点を発見し,従来より柔軟な検索手法について提案する.
著者
羽多野 一磨 大島 裕明 是津 耕司 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.71, pp.199-205, 2004-07-13

近年P2Pネットワークが注目されて久しい.P2Pネットワークはサーバ・クライアントモデルに比べて,情報共有が容易なモデルであると考えられる.しかしながら,そこでの情報検索は検索の高速化という側面においては研究が盛んであるものの,情報検索という面においてはファイル名とクエリとのマッチングという原始的な手法が主であり,十分とはいえなかった.このため本論文ではP2Pネットワークにおける検索についての問題点を発見し,従来より柔軟な検索手法について提案する.Recently, P2P network has been drawing attention. It is easier to share information on P2P network model than on server-client model. However, almost all researches study on improvement in the speed of retrieval. On the aspect of the information retrieval, matching file name with query is major, but it is very primitive and not enough to retrieve information efficiently. So, we find the problems of information retrieval on traditional P2P network, and we propose the system which provides more flexible information retrieval than one in the past.