著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.10, pp.2917-2928, 2006-10-15
参考文献数
18
被引用文献数
14

シソーラス辞書は,情報検索や自然言語処理,対話エージェントなどの研究領域において幅広くその有用性が実証されてきた.しかし,自然言語処理などによる従来のシソーラス辞書自動構築では,形態素解析や同義語・多義語の処理など,語の関連性を解析する前段階の処理において精度低下を招く要因がいくつかある.また,辞書作成時と利用時のタイムラグにより最新の語や概念への対応が困難であるという問題もある.そこで本論文では,これら2 つの問題を解決するために,ここ数年で急速にコンテンツ量を増加させたWiki ベースの百科辞典である「Wikipedia」に対し,Web マイニングの手法を適用することでシソーラス辞書を自動構築する方法を提案する.Thesauri have been widely used in many applications such as information retrieval, natural language processing (NLP), and interactive agents. However, several problems, such as morphological analysis, treatment of synonymous and multisense words, still remain and degrade accuracy on traditional NLP-based thesaurus construction methods. In addition, adding latest/miner words is also a difficult issue on this research area. In this paper, to solve these problems, we propose a web mining method to automatically construct a thesaurus by extracting relations between words from Wikipedia, a wiki-based huge encyclopedia on WWW.
著者
白川 真澄 中山 浩太郎 荒牧 英治 原 隆浩 西尾 章治郎
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.3, pp.525-539, 2011-03-01

固有名詞や専門用語,及びこれら概念間の関係を網羅した大規模オントロジーの構築は,意味中心のWebを実現する上で重要な基盤技術である.最近の研究では,Wikipediaにおける概念の網羅性を活用した大規模オントロジーの自動構築に注目が集まっているが,概念間の関係の網羅性が低いことが課題であった.そこで本研究では,Wikipediaマイニングによって抽出した情報にWeb全体の情報を組み合わせることで,概念及び概念間の関係の種類を網羅した大規模オントロジーの自動構築を目指す.本論文では,大規模オントロジーの自動構築の核となる関係抽出の手法として,Wikipediaから抽出した連想シソーラスを利用して関係の深い概念ペアを取り出し,Web検索によって概念間の関係を抽出する手法を提案する.また,固有名詞間の様々な関係を定義した大規模オントロジー構築への第一歩として,提案手法を用いて実際にオントロジー構築を試みる.
著者
伊藤 雅弘 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.20, pp.39-49, 2007-12-15
被引用文献数
2

近年,知識処理の有用なコーパスとして,ユーザ同士が協調してコンテンツを編集するWeb事典である「Wikipedia」に多大な注目が集まっている.筆者らはこれまでの研究において,Wikipediaに対してリンク構造を解析することで精度の良いシソーラス辞書が構築できることを示してきた.しかし,膨大な記事数を持つWikipediaを解析するためには,高い精度を保ったままスケーラビリティのさらなる向上が技術的な課題であった.そこで,本研究ではリンクの共起性解析に着目し,スケーラビリティの高いシソーラス辞書構築手法を提案する.提案手法の性能評価のために行った実験の結果,共起性解析を用いた手法は従来手法よりも少ない計算時間で,高精度なシソーラス辞書を構築できることを確認した.さらに,共起性解析とtfidfを融合させることによって,より高い精度が実現できることを確認した.Wikipedia, a huge scale Web based encyclopedia, attracts great attention as a valuable corpus for knowledge extraction. We have already proved how effective it is to construct a Web thesaurus. However, we still need high scalability methods to analyze the huge amount of Web pages and hyper links among articles in the encyclopedias. In this paper, we propose a scalable Web thesaurus construction method from Wikipedia by using link co-occurrence. Experimental results show that the proposed method based on link co-occurrence analysis was better on scalability and accuracy than previous methods. Moreover, the method combining tfidf with link co-occurrence analysis brought higher precision.
著者
白川 真澄 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

文書をあらかじめ設定したカテゴリに分類するタスクは,情報検索の分野において重要な課題である.文書分類の一般的なアプローチとしてナイーブベイズが挙げられるが,教師データを用意するためのコストが問題であった.そこで本研究では,Wikipediaのカテゴリ構造を解析することで,ナイーブベイズに必要な教師データ,すなわち,ある語句が出現したときのカテゴリの事後確率を自動的に計算する手法を提案する.
著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.128, pp.115-122, 2006-11-30
被引用文献数
1

Wikipediaは,WWW上に構築された百科事典であり,誰もが簡単にWebブラウザを通じて編集可能であるために,膨大な数の記事が投稿,公開されている.しかし,2005年末から2006年初頭にかけて,虚偽の記事が投稿されるような事件が発端となり,コンテンツの信頼性が大きな問題となってきた.筆者らは,これまでの研究でWikipediaにおける記事同士の関係性を抽出する手法について提案し,その有効性を証明してきたが,このように不特定多数のユーザがコンテンツを管理するような環境においては,信頼性を考慮した解析手法が重要となる.本研究では,Wikipediaのダイナミクスと信頼性の問題を分析するとともに,リンク構造解析アルゴリズムについて検討し,記事関連性抽出における信頼性の高い情報抽出方法を模索する.Wikipedia is a Web-based dictionary that can easily be edited through Web browsers by any Internet user. Thus huge amounts of articles are published and managed on it. However, after a number of article reliability issues, the trust problem on Wikipedia is still in controversy. In previous works, we proved the effectiveness and potential of the article association extraction based on Wikipedia mining. In this paper, we first analyze the link structure of Wikipedia and dynamics of Wikipedia. Then, we present an effective method for link structure mining for Wikipedia and describe how link structure mining for Wikipedia is helpful for extracting trusted information.
著者
中山 浩太郎 伊藤 雅弘 Maike ERDMANN 白川 真澄 道下 智之 原 隆浩 西尾 章治郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.24, no.6, pp.549-557, 2009 (Released:2009-10-20)
参考文献数
25
被引用文献数
5 4 2

Wikipedia, a collaborative Wiki-based encyclopedia, has become a huge phenomenon among Internet users. It covers a huge number of concepts of various fields such as arts, geography, history, science, sports and games. As a corpus for knowledge extraction, Wikipedia's impressive characteristics are not limited to the scale, but also include the dense link structure, URL based word sense disambiguation, and brief anchor texts. Because of these characteristics, Wikipedia has become a promising corpus and a new frontier for research. In the past few years, a considerable number of researches have been conducted in various areas such as semantic relatedness measurement, bilingual dictionary construction, and ontology construction. Extracting machine understandable knowledge from Wikipedia to enhance the intelligence on computational systems is the main goal of "Wikipedia Mining," a project on CREP (Challenge for Realizing Early Profits) in JSAI. In this paper, we take a comprehensive, panoramic view of Wikipedia Mining research and the current status of our challenge. After that, we will discuss about the future vision of this challenge.
著者
服部 元 原 隆浩 滝嶋 康弘 菅谷史昭 西尾 章治郎
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.1, no.2, pp.26-37, 2008-09-30
被引用文献数
1

近年,携帯電話やゲーム機,カーナビゲーションシステム,テレビなど,Web ブラウザを搭載している PC 以外の機器が増加している.しかしながら,それらの機器は一般にキーボードを搭載せず,数字ボタンや十字キーなどの限られた入力インタフェース(以下,リモコン型 UI と呼ぶ)のみを備えているものが多い.そのため,Web ページの閲覧は容易に行えるものの,Web ページの検索を行う場面では,試行錯誤しながら検索語入力を行い検索結果を絞り込むという PC と同等の検索手法は困難であることから,リモコン型 UI 端末向けの使いやすい Web 検索方法が求められている.そこで本論文では,閲覧中の Web ページに表示されている語の中からユーザが検索したい語 (注目語) を指定すると,システムが自動的に最適なページを提示するクリック型検索手法を提案する.本手法は,検索に重要な語を注目語の周辺から抽出することを特徴としており,品詞や意味,表示方法などに基づく語単独の重要度と,注目語との距離や共起の度合いに基づく重要度の2つの指標からなる周辺語重要度モデルを利用して,語の重要度を算出している.本手法を実装して検索結果に対する主観評価実験を行った結果,注目語のみで行った検索において評価が低かった検索結果のうち,最大で 63.6% のケースにおいて満足度が向上することを示した.また,2 クリック以内の検索結果に対しては,従来方式のみの場合と比較して,満足するケースが最大で 63.3% から 76.0% に向上することを示した.The Internet today provides an ubiquitous environment for viewing Web pages. Now we can view them on many kinds of terminals such as mobile phones, video game machines, car navigation systems, and television sets, besides PCs. On the other hand, most of them have limited input devices which consist of 9 number buttons and 4 direction buttons, which we call “Remote controller type input devices.” This limitation causes a difficulty to the Internet search task that we have to input correct key words by trying and erring until we find the best Web page. Therefore, we need a search system to make the task easier for Remote controller type input devices. This paper proposes a new search system, click based Web search system, which automatically searches related Web pages with a core word and surrounding words when a user clicks a specified word (the core word). The most important technique used in this system is a method to calculate the importance of each surrounding word based on a surrounding word weighting model. This model consists of the importance based on their parts of speech, meanings and expression, and the importance based on the distance and cooccurernce between a core word and the word. We performed subjective evaluation and showed that the proposed method have achieved a satisfaction rate of 63.6%, which is much higher than the results produced by other common methods on low evaluated cases. When applying to the second click the proposed method helps to increase satisfaction rate from 63.3% when only using common method to 76.0% of the final result.
著者
中山 浩太郎 伊藤 雅弘 ERDMANN Maike 白川 真澄 道下 智之 原 隆浩 西尾 章治郎
出版者
The Japanese Society for Artificial Intelligence
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.24, no.6, pp.549-557, 2009
被引用文献数
3 4

Wikipedia, a collaborative Wiki-based encyclopedia, has become a huge phenomenon among Internet users. It covers a huge number of concepts of various fields such as arts, geography, history, science, sports and games. As a corpus for knowledge extraction, Wikipedia's impressive characteristics are not limited to the scale, but also include the dense link structure, URL based word sense disambiguation, and brief anchor texts. Because of these characteristics, Wikipedia has become a promising corpus and a new frontier for research. In the past few years, a considerable number of researches have been conducted in various areas such as semantic relatedness measurement, bilingual dictionary construction, and ontology construction. Extracting machine understandable knowledge from Wikipedia to enhance the intelligence on computational systems is the main goal of "Wikipedia Mining," a project on CREP (Challenge for Realizing Early Profits) in JSAI. In this paper, we take a comprehensive, panoramic view of Wikipedia Mining research and the current status of our challenge. After that, we will discuss about the future vision of this challenge.
著者
義久 智樹 原 隆浩
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.58, no.4, pp.898-907, 2017-04-15

センサなどのモノがインターネットに接続される流行は,IoT(Internet of Things)と呼ばれ,近年非常に注目されている.これらのモノから継続的に発生するデータを入力として,あらかじめ登録された問合せ(連続問合せ)を実行するストリーミング処理技術が研究されている.これらの研究では,データが入力されてから連続問合せの結果を得るまでのストリーミング処理にかかる時間を短縮している.近年のIoT環境の普及により,高頻度なデータの発生源が分散してインターネットに接続されており,さらなるストリーミング処理時間の短縮が求められている.そこで本研究では,IoT環境におけるストリーミング処理時間短縮手法を提案する.提案手法では,センサが接続された処理サーバが分散していると想定したうえで,各連続問合せを個別に処理できるいくつかの部分条件に分割してストリーミング処理を行う.評価の結果,提案手法は従来手法よりも最大通信ホップ数と平均通信量を削減でき,ストリーミング処理時間を短縮できることを確認した.
著者
水野 聖也 大澤 純 原 隆浩 西尾 章治郎
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.114, no.101, pp.33-38, 2014-06-14

近年,パーソナライズされた情報推薦の技術が普及しており,それに伴って,嗜好抽出の重要性が高まっている.本稿では,ユーザがスマートデバイスにインストールしているアプリケーションを基に,嗜好抽出を行う手法を提案する.この手法では,マーケット上に記載されているアプリケーションの説明文からキーワードを抽出し,各キーワードを,キーワードの特徴度,アプリケーションの固有度,アプリケーションの1日の平均利用時間に基づいた3つ指標を用いてスコアリングを行うことにより,キーワードとその重要度を表すスコアの形式でユーザの嗜好を表現する.被験者実験の結果,保有アプリケーションが嗜好抽出の情報源として有用であることが確認された.また,結果をもとに各スコアリング指標の特性の検証を行ったところ,保有アプリケーション数が十分多いユーザに対して,アプリケーションの固有度に基づくスコアが有効である傾向が見られた.また,端末の利用時間の長いユーザに対して,アプリケーションの利用時間に基づくスコアの有効性が示唆された.
著者
白川 真澄 中山 浩太郎 原 隆浩 西尾 章治郎
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.5, no.3, pp.51-63, 2012-09-28

語句をカテゴリ (トピック) に分類した概念辞書は,文書分類をはじめ様々なアプリケーションの基盤リソースとして必要とされている.代表的な概念辞書である WordNet は一般語を網羅的に定義しているが,固有名詞や専門用語,新語はあまり網羅されていない.一方,大規模 Web 百科事典である Wikipedia はそのような語句を数多く定義しており,また,語句を分類するためのカテゴリ構造を有している.しかし, Wikipedia のカテゴリ構造は,複数の親やループを許容するネットワーク構造であるため,ある語句がどのカテゴリに属しているかを判別するのは難しい.そこで本研究では,グラフ理論に基づいて Wikipedia のカテゴリネットワークを解析し,確率的に語句を分類する手法を提案する.また,語句の確率的分類の結果を教師データとし,ナイーブベイズによる文書分類を行う. Web 検索のスニペットを代表的な 8 カテゴリに分類するタスク,および科学に関するニュースのスニペットを 8 つの領域に分類するタスクにおいて評価を行い,提案手法の有効性を確認した.
著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.56, 2008-06-12

Wikipedia は知識抽出のための有用なコーパスとして,人工知能や情報検索,Web マイニングなどの研究分野で最近急速に注目を集めている.筆者らの研究グループでは,Wikipedia から高精度な大規模連想シソーラスを構築できることを証明してきたが,is-a 関係などのような,より明確な意味関係の抽出が技術的課題であった.本研究では,リンク構造解析による重要文抽出と,自然言語処理を利用した解析手法を提案し,意味関係を抽出することで,Wikipedia から機械可読な概念辞書を自動的に構築することを目指す.The fact that Wikipedia is an invaluable corpus for knowledge extraction has been confirmed in various research areas such as AI, IR and Web Mining. In our previous researches, we have proved that we can extract a huge scale and accurate association thesaurus from Wikipedia. However, to construct a Web ontology from Wikipedia, extracting explicit relation types is a remaining technical issue. In this paper, we propose a method to construct a Web ontology from Wikipedia based on parsing and link structure analysis.
著者
中山 浩太郎 伊藤 雅弘 Erdmann Maike 白川 真澄 道下 智之 原 隆浩 西尾 章治郎
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.2, no.4, pp.49-60, 2009-12-24

Wikipediaは,インターネットを通じて誰でも編集可能なオンライン百科事典であり,ここ数年で爆発的に成長したソーシャルメディアの一種である.特に,自然言語,人工知能,データベースの研究分野で活発に研究が進められており,連想関係抽出や,対訳辞書構築,オントロジ構築など,数多くのWikipediaを対象とした研究が行われてきた.また,最近では多様なアプリケーションへWikipediaマイニングの成果を適用する事例が報告されており,その有用性が示されてきた.しかし,多量の研究発表が行われる一方で,全体像を把握することが困難になりつつあるのも事実である.本サーベイ論文では,これら最新のWikipedia研究を紹介しつつ,概観することで研究の目的面・技術面から分類し,Wikipedia研究の動向を探る.Wikipedia, an Wiki based online encycropedia, has become an emergent social media because of the significant effeciency for sharing huge amount of human knowledge via Web browsers. Especially, in NLP, AI and DB research areas, a considerable number of researches have been conducted in past several years. Relatedness measurement, bilingual dictionary extraction and ontology construction are ones of main Wikipedia Mining research areas. Furthermore, researches on application based on structured data extracted by Wikipedia Mining are becoming one of the essentials of Wikipedia research areas. In this survey paper, we introduce the new research papers and summarize the researches from both technical aspect and directional aspect.
著者
上原 隆浩 泉尾 佳苗
出版者
JAPANESE PHYSICAL THERAPY ASSOCIATION
雑誌
日本理学療法学術大会
巻号頁・発行日
vol.2009, pp.B4P2138-B4P2138, 2010

【目的】重症心身障害児/者の中でGMFCSレベル5を示す児/者は姿勢コントロールが困難で姿勢変換に介助を必要とし、1日を通して取れる姿勢が限られ、背臥位で過ごす時間が多くなる。背臥位で長期間過ごすことにより脊柱側弯、胸郭変形、風に吹かれた股関節などの変形が起こり、非対称姿勢を呈するようになる。非対称姿勢は重力の影響を多く受けており、非対称姿勢の改善には重力を考慮したポジショニングの提供が必要であると考えられる。背臥位での下腿下垂法は下肢の重量を軽減させることで、変形予防、体圧不均等軽減等が可能であるが、重症心身障害児施設入所者の場合、介助者は複数で多職種となり、ポジショニングの統一が難しい場合が多く、また下腿を下垂させる為の設定も必要となり、日常生活への導入が難しい。今回、当園入園の男性に対し24時間姿勢ケアの一つとして背臥位での下腿下垂法を実施。重力の影響を考慮したポジショニングを円滑に日常生活へ導入する一手段となることを目的とし、病棟職員との協動により24時間を考えたポジショニングが定着した症例の取り組みの内容について報告する。<BR>【方法】症例は37歳男性、小頭症。平成13年10月当園入園。捻れを伴った脊柱左凸側彎あり。GMFCSレベル5。頚部の軽度随意回旋はみられるが、その他の自発運動は乏しい。声かけにより笑顔を見せ、発声することもある。食事は胃瘻より摂取。日常的に取る姿勢は背臥位が多く、その他に食事時は右背側臥位、午後より1時間程度腹臥位にて過ごす。平成20年11月、評価項目として背臥位での体圧分布、回旋モーメントの評価。1時間ごとの24時間の写真による姿勢の評価を行った。評価後理学療法時間を利用し、下腿下垂法を実施。病棟内プレイルーム、ベッド上で実施する為に、牛乳パック、すのこを使用した台を作成。その上で背臥位をとるようにした。日中過ごすプレイルーム内、移動、活動場面で使用する車椅子上、夜間ベッド上で下腿下垂法を取れるようにし、病棟看護師長、担当看護師に方法、効果を説明、理解を得た後、平成21年1月、病棟職員へ伝達。統一したポジショニングを提供した。<BR>【説明と同意】今回の発表にあたり、症例の保護者への内容の説明を口頭及び文章で行い、同意を得ている。<BR>【結果】数回の病棟職員への伝達後、24時間を通してのポジショニングが統一して出来るようになった。体圧の不均等が軽減し、下肢の脱力や持続的は脊柱の伸張が可能になった。下腿下垂法実施前は左大転子部に褥瘡があったが、実施後約2ヶ月で治癒となった。また保護者から「外泊時同様のポジショニングを行ったが以前と比べ、力が抜けやすくなり夜間もよく眠るようになった」との意見もあった。<BR>【考察】下腿を下垂させることで不安定な下肢を安定させることが出来、下肢の重量による骨盤、脊柱へのねじれ、体圧分布不均等が軽減出来た。また頭部に使用していた枕を低くすることで、頭部の床への押しつけも軽減し、全身的に脱力することが可能になったと考えられる。統一したポジショニングの実施については、まず病棟看護師長、担当看護師といったキーパーソンに方法や効果を説明し、十分な理解を得た上で病棟に伝達したことで、理学療法士が確認できない時間のポジショニングの確認が徹底出来。またプレイルーム、車椅子上、ベッド上で行うポジショニングのクッションを統一することで、ポジショニング内容及び実施が定着しやすかったと考える。<BR>【理学療法学研究としての意義】重症心身障害児/者の変形を進行させる要因である重力や支持接触面の影響はあらゆる姿勢、場面で常時受けているものであり、生活を支援する上で重要な要因である。その中でポジショニングは変形予防や自発活動の促通を行うことが可能であり、24時間を通して支援する必要があると考えられる。今回の報告により多職種、複数の職員へ24時間を考えたポジショニングを伝達し、また使用物品を安価で手に入れやすいものを使用したことは介助者の知識、技術や場所に関係なくポジショニングを提供する方法が提示できると考えられる。今回の24時間のポジショニングについて、今後その経過を追うことで下腿下垂法及び24時間姿勢ケアの効果,問題点を検証できるのではないかと考える。
著者
川上 慶士 大澤 純 原 隆浩 Xie Xing
雑誌
マルチメディア,分散協調とモバイルシンポジウム2016論文集
巻号頁・発行日
vol.2016, pp.714-721, 2016-07-06

スマートフォンの普及によって,ユーザの生活履歴を収集することが容易になってきている.しかし,センサを用いるだけでそれらのログを収集する既存研究では,意味的な情報を含む具体的な状況や,ユーザの主観的な状況に関する情報のような,高度なコンテキスト情報は得られないという欠点がある.そこで,筆者らの研究グループでは,スマートフォンの利用履歴と高度なコンテキスト情報を収集することを目的として,「こんてきすとモンスター」 というアプリケーションを運用している.このアプリケーションでは,ユーザに一定時間ごとに同伴者,活動,調子などの情報を選択形式で直接入力してもらうことで,ユーザの状態を表す,高度なコンテキストに関する情報を収集している.また,ゲーム要素を導入することで,ユーザの負担軽減を図っている.しかしこのゲーム自体は,ユーザの入力内容と独立して動作するため,ユーザが定期的に自身のコンテキストを正しく入力する意欲は大きくない.そこで本研究では,こんてきすとモンスターにユーザのコンテキスト情報をフィードバックするライフログ機能の導入を行い,約 1 年間に渡りユーザの動向を調査しライフログ機能の効果を検証した.その結果から,ライフログ機能を利用するタイミングに一定の傾向があり,ライフログ機能を利用する頻度が高いほど,こんてきすとモンスターを継続して利用する傾向があることが判明した.
著者
佐々木 勇和 原 隆浩 西尾 章治郎
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.52, no.1, pp.175-186, 2011-01-15

アドホックネットワークでは,膨大なデータの中から必要なデータのみを効率的に取得するため,端末が何らかの値(スコア)によって順序付けられたデータの上位k個のものを検索するTop-k検索を用いることが有効である.本論文では,アドホックネットワークにおいて,トラヒックの削減と検索結果の取得精度の低下を抑止を目的とするTop-k検索手法を提案する.提案手法では,各端末がヒストグラムを作成し,ネットワーク全体のk番目のスコアを推定する.次に,推定したk番目のスコア以上のスコアを持つデータを返信することで,できる限り検索結果に入るデータのみを返信する.また,返信先の端末とのリンク切断を検出した端末は,他の隣接端末にクエリ応答を返信することで,検索結果の取得精度の低下を抑止する.In mobile ad hoc networks , to acquire only necessary data items, it is effective that each mobile node retrieves data items using a top-k query, in which data items are ordered by the score of a particular attribute and the query-issuing mobile node acquires data items with the k highest scores. In this paper, we propose a query processing method for top-k query for reducing traffic and also keeping high accuracy of the query result. In this method, each node constructs a histogram and estimates the k-th score in the entire network. When transmitting a reply, each mobile node sends back only data items whose scores are larger than the estimated k-th score to reduce traffic as much as possible. Moreover, when a mobile node detects the disconnection of a radio link, it sends the reply to another neighboring node to keep high accuracy of the query result.
著者
中山 浩太郎 原 隆浩 西尾 章治郎
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.10, pp.2917-2928, 2006-10-15

シソーラス辞書は,情報検索や自然言語処理,対話エージェントなどの研究領域において幅広くその有用性が実証されてきた.しかし,自然言語処理などによる従来のシソーラス辞書自動構築では,形態素解析や同義語・多義語の処理など,語の関連性を解析する前段階の処理において精度低下を招く要因がいくつかある.また,辞書作成時と利用時のタイムラグにより最新の語や概念への対応が困難であるという問題もある.そこで本論文では,これら2 つの問題を解決するために,ここ数年で急速にコンテンツ量を増加させたWiki ベースの百科辞典である「Wikipedia」に対し,Web マイニングの手法を適用することでシソーラス辞書を自動構築する方法を提案する.
著者
西尾 章治郎 原 隆浩 寺田 努 小川 剛史
出版者
大阪大学
雑誌
基盤研究(A)
巻号頁・発行日
2005

無線通信機能をもつ小型センサノードで形成するセンサネットワークに対し、(1)センサネットワークノードのための動的機能交換ミドルウェア、(2)センサネットワークのためのデータ配置管理技術、(3)センサネットワークのためのデータ送受信技術の3 テーマを中心に研究を推進し、センサネットワークのためのデータ処理基盤となる技術の研究開発を行った。本研究の成果は、多数の学術論文誌や国際会議録等に掲載され、国内外において高い評価を得ている。