文献一覧: 平手勇宇 (著者)

3 0 0 0 検索エンジンのランキングにおける日本語版ウィキペディアの影響力(テーマ,膨大なデータから学ぶもの)

著者: 曽根広哲吉田泰明平手勇宇山名早人
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日: vol.108, no.94, pp.89-94, 2008-06-12
被引用文献数: 1

検索エンジンはインターネットで情報を探す手段として欠くことができない.また,ユーザは検索エンジンの検索結果から得られる情報はテレビからの情報とほぼ同等の信頼性があると認知しているという調査報告がある.すなわち,検索エンジンのランキングを調べることによって,あるサイトが社会に与える影響力の一端を把握できると考えられる.本稿では,今やインターネット上の百科事典の代名詞ともなったウィキペディアが社会に与える影響力を調べることを目的として,日本語版ウィキペディアの検索エンジンにおけるランキング解析を行った.実験の結果,全記事のうち,上位10位以内にランキングされた記事はYahoo! JAPANとGoogleでは約9割,MSNでは約7割となった.また,Yahoo! JAPAN,MSNともに,ウィキペディアの新規記事は「はてなダイアリーキーワード」と比べ,最初から上位10位以内に現れる傾向が強く,上位のランキングを維持する傾向があることが分かった.以上のようにウィキペディアの影響力は大きいものであるということが実験結果から確認できた.

2011-12-30 13:02:48
1 Delicious
2 + 1 Twitter

https://ci.nii.ac.jp/naid/110006951817

2 0 0 0 Webページを対象とした著作権違反自動検知システム(ウェブ属性抽出)

著者: 田代崇上田高徳堀泰祐平手勇宇山名早人
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日: vol.106, no.149, pp.23-28, 2006-07-06

2010-10-14 00:45:11
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110004833162

1 0 0 0 ウィキペディアを対象とした編集回数に依存しない編集者の信頼度測定手法

著者: 櫻井宏樹吉田泰明平手勇宇山名早人
雑誌: 電子情報通信学会技術研究報告. DE, データ工学
巻号頁・発行日: vol.108, no.93, pp.115-120, 2008-06-12
参考文献数: 14

2017-12-15 20:56:41
1 + 0 Twitter

https://ci.nii.ac.jp/naid/10030997519

1 0 0 0 商用検索エンジンのランキングに関する定量的評価と特徴解析

著者: 吉田泰明上田高徳田代崇平手勇宇山名早人
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告. DBS,データベースシステム研究会報告 (ISSN:09196072)
巻号頁・発行日: vol.143, pp.441-446, 2007-07-02
参考文献数: 17
被引用文献数: 2

現在,Web上の情報は膨大であり,欲しい情報をWeb上から探すために検索エンジンが広く用いられている.このように,検索エンジンのランキングが与える社会的影響は大きいにも関わらず,ユーザは検索エンジンのランキング手法を理解せずに利用しているのが現状である.本稿では,各種検索エンジンの特徴を明らかにすべく,週に一回1000のクエリを用い主要な3つの検索エンジンのランキングの比較と特徴の解析を行った.その結果,主要な検索エンジン間ではランキングの上位ほど揃いやすく,ランキングの時間変化の特徴にも違いがあることが分かった.また,ランキングと逆リンク数にも相関があることが分かった.

2013-10-18 11:12:06
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110006381460

1 0 0 0 Webページを対象とした著作権違反自動検知システム

著者: 田代崇上田高徳堀泰祐平手勇宇山名早人
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日: vol.2006, no.78, pp.27-33, 2006-07-13
被引用文献数: 1

近年のWebページ総数の飛躍的な増加に伴い,歌詞や新聞記事の無断引用などの著作権侵害のWebページの数も増大している.そこで本稿では,著作権違反の疑いのあるページを自動検出するシステムを提案する.本システムではまず,検索ワードを,指定された文章を文節単位に区切り組み合わせることにより生成し、GoogleやYahoo!が提供しているWebサービスを用いて著作権違反の候補ページを収集する.次に候補ページを類似度をもとにランキングを行ない,ユーザーに提示する.ランキングに用いた類似度は文節をもとにした最長共通部分列から求める.評価実験を行った結果,歌詞,新聞記事,ブログ等からなるWebページをシードとして,著作権侵害ページを検出することができた.Due to explosive increase of the number of web pages, the number of copyright violation web pages, such as lyrics or news citation pages without permission, has also been increased. To solve this problem, we propose a system for detecting copyright violation web pages. The proposed system consists of three steps. Firstly, the system generates search keywords on phrasal units, called "bunsetsu", which are included in the "seed page." Secondly, on search keywords generated by the first step, the system gathers candidate of web pages violating copyright by using Google or Yahoo! web service. Finally, the system re-ranks the candidate web pages with similarity to the seed page. Here, we adopted "Longest Common Subsequence" of phrasal units, as a similarity measurement. Our evaluation confirmed that proposed system is able to extract copy violation web pages correctly.

2010-10-14 00:30:26
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110004849331

1 0 0 0 検索エンジンのランキングにおける日本語版ウィキペディアの影響力 (データ工学)

著者: 曽根広哲吉田泰明平手勇宇山名早人
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告 (ISSN:09135685)
巻号頁・発行日: vol.108, no.93, pp.89-94, 2008-06-19
被引用文献数: 2

2010-09-01 18:30:12
1 + 2 Twitter

https://ci.nii.ac.jp/naid/110006951013

1 0 0 0 商用検索エンジンのヒット数に対する信頼性の検証

著者: 舟橋卓也上田高徳平手勇宇山名早人
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日: vol.2008, no.88, pp.139-144, 2008-09-14
被引用文献数: 2

これまでに検索エンジンのヒット数を利用した研究が数多く行われている.こうした研究では、当該クエリに対するヒット数を用いることにより,翻訳支援や自然言語処理支援など様々なアプリケーション構築を目指している.従来,検索エンジンのヒット数は信頼できるという仮定の下で用いられてきた.しかし検索エンジンが返すヒット数の信頼性に対する検証は筆者の知る限り行われていない.もしもヒット数が不正確な場合,ヒット数を利用した研究の信頼性は疑わしいものとなる.そこで本論文では,検索エンジンのヒット数に対してその信頼性の検証を行う.検証実験では,日本で広く用いられている商用検索エンジンである Google,Yahoo! Japan,Live Search が提供している検索 API を利用した.また実験に利用するクエリとして,日本語 Wikipedia からランダムに選択した 1 000 件の記事タイトルを使用した.検証実験の結果,ヒット数は 5% ~ 50% の確率で,推定を行った理想的なヒット数に対して 5% 以上大きさが異なることがわかった.A number of studies have been using Search Engines' hit count. The goal of these studies is to build applications for translation support or natural language processing support. These studies assume that the hit count is reliable. However, none of the studies have been verifide the reliability of Search Engines' hit count. If the hit count is unreliable, studies using hit count become also unreliable. The purpose of this paper is to verify the reliability of Search Engines' hit count. In this experiment, we used Search APIs provided by Google, Yahoo! Japan and Live Search. Furthermore, we randomelyrandomly extracted 1,000 keywords from the titles of the articles on Wikipedia as queries. The verification experiment shows that hit count is depart from estimated ideal hit count in 5 - 50% of the time.

2009-12-03 15:45:06
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110006980286