著者
中山 浩太郎 伊藤 雅弘 Erdmann Maike 白川 真澄 道下 智之 原 隆浩 西尾 章治郎
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.2, no.4, pp.49-60, 2009-12-24

Wikipediaは,インターネットを通じて誰でも編集可能なオンライン百科事典であり,ここ数年で爆発的に成長したソーシャルメディアの一種である.特に,自然言語,人工知能,データベースの研究分野で活発に研究が進められており,連想関係抽出や,対訳辞書構築,オントロジ構築など,数多くのWikipediaを対象とした研究が行われてきた.また,最近では多様なアプリケーションへWikipediaマイニングの成果を適用する事例が報告されており,その有用性が示されてきた.しかし,多量の研究発表が行われる一方で,全体像を把握することが困難になりつつあるのも事実である.本サーベイ論文では,これら最新のWikipedia研究を紹介しつつ,概観することで研究の目的面・技術面から分類し,Wikipedia研究の動向を探る.Wikipedia, an Wiki based online encycropedia, has become an emergent social media because of the significant effeciency for sharing huge amount of human knowledge via Web browsers. Especially, in NLP, AI and DB research areas, a considerable number of researches have been conducted in past several years. Relatedness measurement, bilingual dictionary extraction and ontology construction are ones of main Wikipedia Mining research areas. Furthermore, researches on application based on structured data extracted by Wikipedia Mining are becoming one of the essentials of Wikipedia research areas. In this survey paper, we introduce the new research papers and summarize the researches from both technical aspect and directional aspect.
著者
井上 大輝 木村 仁星 中山 浩太郎 作花 健也 Rahman Abdul 中島 愛 Patrick Radkohl 岩井 聡 河添 悦昌 大江 和彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.1H3J1302, 2019 (Released:2019-06-01)

深層学習を活用した胸部 X 線写真の自動診断は現在盛んに研究されている.診断精度を改善するためには,異常と疑われる局所画像を抽出し,深層学習ネットワークの入力とするかが重要である.そこで本研究では,「診断時に医師が凝視している領域を異常と疑われる局所画像として抽出できるのではないか」 という仮説を立てた上で,視線データを基に抽出された局所画像を入力とする深層学習モデルを構築した.その結果,視線データを使用しない場合,または医師訓練を受けていない被験者の視線データを使用した場合に比べて,医師の視線データを使用した場合により高い精度が認められ,視線データの有用性を示した.
著者
中山 浩次
出版者
日本細菌学会
雑誌
日本細菌学雑誌 (ISSN:00214930)
巻号頁・発行日
vol.56, no.4, pp.573-585, 2001-11-15 (Released:2009-02-19)
参考文献数
64
被引用文献数
3

口腔偏性嫌気性細菌 Porphyromonas gingivalis は成人性歯周炎の発症・増悪に関わる最重要細菌であり, 血液寒天培地上での黒色集落形成, 赤血球凝集性, ヘモグロビン吸着性, 糖非発酵性, 強力な菌体表面および菌体外プロテアーゼ産生性などの興味深い性状を示す細菌である。本菌の分子遺伝学的解析手段の開発を行うとともに, 本菌のスーパーオキシドジスムターゼ (SOD) 遺伝子 (sod) のクローニングおよびsod変異株の構築を行い, sod変異株が高度に酸素感受性を示すことから嫌気性菌においてもSODが酸素障害抵抗性において非常に重要であることを発見した。また, 本菌のもつ主要なプロテアーゼであるジンジパイン群 (RgpとKgpプロテアーゼ) の遺伝子 (rgpA, rgpB, kgp) のクローニンゲとそれらの欠損株を構築した。三重変異株を含むいくつかの多重変異株を作製し, 性状を検討することでこれらの遺伝子群が本菌の特性ともいえる黒色集落形成, 赤血球凝集性およびヘモグロビン吸着性に深く関与していることがわかり, 赤血球からのヘム鉄獲得蓄積機構という独特な鉄獲得戦略を明らかにした。また, RgpはFimA線毛タンパクなどの菌体表面タンパクの成熟化過程のプロセッシングを行うプロテアーゼであることを発見し, Rgpプロテアーゼが多彩な目的のためにその酵素活性が利用される“多目的酵素”であることを示した。
著者
中山 浩次
出版者
日本細菌学会
雑誌
日本細菌学雑誌 (ISSN:00214930)
巻号頁・発行日
vol.72, no.4, pp.219-227, 2017 (Released:2017-11-07)
参考文献数
49
被引用文献数
1

Bacteroidetes門にはBacteroides属, Prevotella属, Porphyromonas属等, ヒトに共生・寄生する多くの細菌が含まれる。私たちはPorphyromonas属に含まれる歯周病原細菌であるPorphyromonas gingivalisの主要な分泌性プロテアーゼであるジンジパインおよび宿主定着性に寄与する線毛について研究を進めてきた。その過程でジンジパインは従来報告されていない分泌機構で分泌されることがわかった。さらにこの分泌機構はBacteroidetes門細菌に広く存在する機構であることやBacteroidetes門細菌の滑走運動と密接な関係があることがわかり, Por分泌機構(のちにIX型分泌機構と改名)と命名された。また, 線毛については線毛タンパク質がリポタンパク質として菌体表面に輸送され, アルギニン・ジンジパインによって限定分解されることで線毛形成が生じることがわかった。この新規の形成機構を有する線毛はBacteroides属をはじめBacteroidetes門Bacteroidia綱の細菌に広く存在することがわかり, V型線毛と命名された。
著者
松尾 豊 PRENDINGER HELMU 中山 浩太郎
出版者
東京大学
雑誌
新学術領域研究(研究領域提案型)
巻号頁・発行日
2016-06-30

(i)記号処理を組み込んだDeep Q Networkの構成に関しては、低次元の状態表現を獲得する手法に関する研究を進めた。具体的には、部分的な観測を扱うニューラルネットワークのモデルとして,人間の視覚的注意を模倣した注意機構(attention mechanism)を持つモデルが提案されている。しかし,これらのモデルでは,注意機構の学習がタスクから定義される外的な報酬信号を用いた強化学習によって行われており,外部からの報酬信号が得られない問題設定下では注意機構の学習を行うことができない。そこで、特定のタスクに依存しない方法で注意機構を学習させ,状態の予測を行う手法を構築した。また、よりロバストな状態表現の学習を行うため、深層敵対的強化学習(DARL)を複数のドメインに対して適用する研究も行った。その結果を、深層学習に関する国際会議のワークショップで発表した。次に (ii) 文章からの画像の生成モデルを用いた、画像空間での演算処理 に関して、文章(ソース文)から画像を生成し、それを別の言語での文章(ターゲット文)に変換する方式のニューラル機械翻訳(NMT)を実現した。単純に行うと精度の問題があるため、ソース文からターゲット文の変換を行うseq2seqのモデルに、画像の情報を加えるというアプローチをとった。すなわち、テキストと画像が持つ意味情報を,潜在変数として陽に含むニューラル翻訳モデルを提案した。実験では,Multi30kという,画像とそれに対応する英独の対訳コーパスを用い,提案モデルとの比較を行った.標準的な翻訳精度評価指標である METEORスコアにおいて全てのベースラインを上回った.また、この研究の過程において、seq2seqの学習時により密な報酬を与えることで精度がよくなることを発見し、 その結果を、深層学習に関する国際会議のワークショップで発表した。
著者
中山 浩太郎 原 隆浩 西尾 章治郎
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.10, pp.2917-2928, 2006-10-15

シソーラス辞書は,情報検索や自然言語処理,対話エージェントなどの研究領域において幅広くその有用性が実証されてきた.しかし,自然言語処理などによる従来のシソーラス辞書自動構築では,形態素解析や同義語・多義語の処理など,語の関連性を解析する前段階の処理において精度低下を招く要因がいくつかある.また,辞書作成時と利用時のタイムラグにより最新の語や概念への対応が困難であるという問題もある.そこで本論文では,これら2 つの問題を解決するために,ここ数年で急速にコンテンツ量を増加させたWiki ベースの百科辞典である「Wikipedia」に対し,Web マイニングの手法を適用することでシソーラス辞書を自動構築する方法を提案する.
著者
中山 浩太郎
出版者
東京大学
雑誌
若手研究(A)
巻号頁・発行日
2015-04-01

本研究課題では,最新の脳科学の知見を活かしてスケーラビリティの高いDeep Learning手法を開発し,柔軟な知識処理機構を実現することを目指している.本機構が目指す目標は,多様なタスク(アプリケーション)へ適用可能な汎用性の高い知識処理のモデルおよび,大規模なデータをリアルタイムに処理可能な並列処理に最適化された計算モデルの2点である.特に重要なのは,一般的な計算環境(PC等)でも実行可能な並列計算のためのモデルであり,GPU(OpenCL等)を利用した多コア環境で実行可能なモデルを構築する.さらに,本手法の有効性を実証するために,プロジェクトの前半ではスパムフィルタなどの比較的シンプルなタスクやデータに適用するが,プロジェクト後半では連想検索とオープンQAの二つのアプリケーションを期間内に構築することを目指して研究活動を推進してきた。以上の予定と活動に基づき、2016年度は予定どおり基礎研究に軸足を置きつつ、アプリケーションへの適用を試験的に進めてきた。特にスパース性の高いWebデータへの適用を積極的に進め、研究開発を推進してきた。さらに、当初の研究計画に基づき、研究成果の対外発信を強化してきた。論文誌で研究成果が掲載された他、情報処理学会論文誌を始めとする国内論文誌へ論文を投稿中である。また、Deep Learning系のトップカンファレンスにも積極的に論文を投稿中である。
著者
保住 純 飯塚 修平 大澤 昇平 中山 浩太朗 高須 正和 嶋田 絵理子 須賀 千鶴 西山 圭太 松尾 豊
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

世界各国のコンテンツ消費トレンドを統一的に把握するプラットフォームを構築するための、Web上のデータマイニングで得られる情報から消費トレンド指数を算出するシステムの設計手法を提案し、その精度を検証する。具体的には検索エンジンやTwitter、Wikipediaのページ情報を素性に用いた、日本のマンガ消費のトレンド指数を6ヶ月先まで予測するシステムを設計し、その精度の検証を行う。
著者
白川 真澄 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2008, no.56, pp.89-96, 2008-06-12

分類辞書(タクソノミー)は,文書分類や情報検索などのアプリケーションにおいて幅広くその有用性が実証されてきた.しかし分類辞書の自動構築に関する従来研究では,自然言語処理の技術的限界やノイズデータに起因する精度低下の問題がある.そこで本稿では,大規模Web百科事典の Wikipedia に構築されたカテゴリ構造(ネットワーク)を用いて,概念をベクトル化する手法を提案する.The availability of the taxonomy, which is a kind of category-sorted dictionary, has been demonstrated by various applications such as document classification and information retrieval. However, existing works on automatic taxonomy construction have the problem of decreasing the accuracy due to the technical limitation of statistical NLP (Natural Language Processing) and noise data. In this work, we propose concept vectorization methods using the category network structured in Wikipedia, a large scale Web encyclopedia.
著者
中山 浩太郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

筆者らは,Wikipediaを解析することで大規模な連想シソーラス「Wikipediaシソーラス」を構築してきた.バージョン3では,連想関係だけでなく,半教師あり学習によるクラス分類や,Web検索を利用した精度向上アルゴリズムなどを摘要している.本発表では,構築手法とアルゴリズムの詳細について,デモを交えて紹介する.
著者
伊藤 雅弘 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.24, 2010

近年,Wikipediaが知識抽出のためのコーパスとして注目を集めている.一方で,記事によっては誤った記述や虚偽の記述がなされており,記事の信頼性が問題となっている.そこでWikipediaのコンテンツの信頼性向上が必要とされている.本研究では,Wikipediaの記述の言語解析とWeb検索エンジンによってWeb上の情報を用いることで,Wikipediaの記述の信頼性を評価する手法を検討する.
著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.59, pp.23-28, 2004-05-28
被引用文献数
1

近年,電子カルテに代表される医療分野での情報化・電子化が急速に進んでいる.特に,患者情報をPDAで閲覧する病院内モバイル技術や3D-CG の医用イメージ技術を用いた新しいカルテ等の研究が盛んである.そのため,医療の現場ではモバイル端末上で3D 医用イメージを閲覧できるシステムが要求されている.しかし,PDA や携帯電話をはじめとするモバイル端末では,搭載できるCPU の性能やメモリ量,バッテリー等が問題となり,多くの計算が必要となる3D-CG のレンダリング処理エンジンの実装が未だ不十分である.そこで,本研究では,筆者らが開発したモバイル端末用3D フレームワーク「3D-Raven」を電子カルテに導入することにより,モバイル端末上でも利用可能な3D 電子カルテシステムを実現した.Medical information technologies, such as EMR(Electronic Medical Record), have dramatically advanced in the past few years. Especially, "mobile" and "medical imaging (3D)" are important keywords in the stream. However, high-quality 3D graphics still remain beyond the computational capability of mobile device because of the limitation of CPU, memory, battery, and so on. In this paper, we propose a 3D framework for mobile device, which we call "3D-Raven". This enables mobile device to render high-quality 3D graphics.
著者
中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.128, pp.115-122, 2006-11-30

Wikipediaは,WWW上に構築された百科事典であり,誰もが簡単にWebブラウザを通じて編集可能であるために,膨大な数の記事が投稿,公開されている.しかし,2005年末から2006年初頭にかけて,虚偽の記事が投稿されるような事件が発端となり,コンテンツの信頼性が大きな問題となってきた.筆者らは,これまでの研究でWikipediaにおける記事同士の関係性を抽出する手法について提案し,その有効性を証明してきたが,このように不特定多数のユーザがコンテンツを管理するような環境においては,信頼性を考慮した解析手法が重要となる.本研究では,Wikipediaのダイナミクスと信頼性の問題を分析するとともに,リンク構造解析アルゴリズムについて検討し,記事関連性抽出における信頼性の高い情報抽出方法を模索する.Wikipedia is a Web-based dictionary that can easily be edited through Web browsers by any Internet user. Thus huge amounts of articles are published and managed on it. However, after a number of article reliability issues, the trust problem on Wikipedia is still in controversy. In previous works, we proved the effectiveness and potential of the article association extraction based on Wikipedia mining. In this paper, we first analyze the link structure of Wikipedia and dynamics of Wikipedia. Then, we present an effective method for link structure mining for Wikipedia and describe how link structure mining for Wikipedia is helpful for extracting trusted information.