著者
白川 真澄 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2008, no.56, pp.89-96, 2008-06-12

分類辞書(タクソノミー)は,文書分類や情報検索などのアプリケーションにおいて幅広くその有用性が実証されてきた.しかし分類辞書の自動構築に関する従来研究では,自然言語処理の技術的限界やノイズデータに起因する精度低下の問題がある.そこで本稿では,大規模Web百科事典の Wikipedia に構築されたカテゴリ構造(ネットワーク)を用いて,概念をベクトル化する手法を提案する.The availability of the taxonomy, which is a kind of category-sorted dictionary, has been demonstrated by various applications such as document classification and information retrieval. However, existing works on automatic taxonomy construction have the problem of decreasing the accuracy due to the technical limitation of statistical NLP (Natural Language Processing) and noise data. In this work, we propose concept vectorization methods using the category network structured in Wikipedia, a large scale Web encyclopedia.
著者
中山 浩太郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

筆者らは,Wikipediaを解析することで大規模な連想シソーラス「Wikipediaシソーラス」を構築してきた.バージョン3では,連想関係だけでなく,半教師あり学習によるクラス分類や,Web検索を利用した精度向上アルゴリズムなどを摘要している.本発表では,構築手法とアルゴリズムの詳細について,デモを交えて紹介する.
著者
伊藤 雅弘 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

近年,Wikipediaが知識抽出のためのコーパスとして注目を集めている.一方で,記事によっては誤った記述や虚偽の記述がなされており,記事の信頼性が問題となっている.そこでWikipediaのコンテンツの信頼性向上が必要とされている.本研究では,Wikipediaの記述の言語解析とWeb検索エンジンによってWeb上の情報を用いることで,Wikipediaの記述の信頼性を評価する手法を検討する.
著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.59, pp.23-28, 2004-05-28
被引用文献数
1

近年,電子カルテに代表される医療分野での情報化・電子化が急速に進んでいる.特に,患者情報をPDAで閲覧する病院内モバイル技術や3D-CG の医用イメージ技術を用いた新しいカルテ等の研究が盛んである.そのため,医療の現場ではモバイル端末上で3D 医用イメージを閲覧できるシステムが要求されている.しかし,PDA や携帯電話をはじめとするモバイル端末では,搭載できるCPU の性能やメモリ量,バッテリー等が問題となり,多くの計算が必要となる3D-CG のレンダリング処理エンジンの実装が未だ不十分である.そこで,本研究では,筆者らが開発したモバイル端末用3D フレームワーク「3D-Raven」を電子カルテに導入することにより,モバイル端末上でも利用可能な3D 電子カルテシステムを実現した.Medical information technologies, such as EMR(Electronic Medical Record), have dramatically advanced in the past few years. Especially, "mobile" and "medical imaging (3D)" are important keywords in the stream. However, high-quality 3D graphics still remain beyond the computational capability of mobile device because of the limitation of CPU, memory, battery, and so on. In this paper, we propose a 3D framework for mobile device, which we call "3D-Raven". This enables mobile device to render high-quality 3D graphics.
著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.128, pp.115-122, 2006-11-30

Wikipediaは,WWW上に構築された百科事典であり,誰もが簡単にWebブラウザを通じて編集可能であるために,膨大な数の記事が投稿,公開されている.しかし,2005年末から2006年初頭にかけて,虚偽の記事が投稿されるような事件が発端となり,コンテンツの信頼性が大きな問題となってきた.筆者らは,これまでの研究でWikipediaにおける記事同士の関係性を抽出する手法について提案し,その有効性を証明してきたが,このように不特定多数のユーザがコンテンツを管理するような環境においては,信頼性を考慮した解析手法が重要となる.本研究では,Wikipediaのダイナミクスと信頼性の問題を分析するとともに,リンク構造解析アルゴリズムについて検討し,記事関連性抽出における信頼性の高い情報抽出方法を模索する.Wikipedia is a Web-based dictionary that can easily be edited through Web browsers by any Internet user. Thus huge amounts of articles are published and managed on it. However, after a number of article reliability issues, the trust problem on Wikipedia is still in controversy. In previous works, we proved the effectiveness and potential of the article association extraction based on Wikipedia mining. In this paper, we first analyze the link structure of Wikipedia and dynamics of Wikipedia. Then, we present an effective method for link structure mining for Wikipedia and describe how link structure mining for Wikipedia is helpful for extracting trusted information.