著者
グェンミン テイ 伊藤 雅博 川村 隆浩 田原 康之 大須賀 昭彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理 (ISSN:09135685)
巻号頁・発行日
vol.111, no.70, pp.39-44, 2011-05-19

本研究の最終目的は,計算機がユーザの状況を把握し,それに応じて皆の経験に基づく最適な行動パターンを推薦することである.これを実現するために,皆の経験に基づく行動パターンの集合知(行動パターンの構成要素,行動パターン間の関係)が必要である.そして,これらの行動パターンの表現,参照,更新の方式が必要である.しかし,皆の経験に基づく行動パターンの集合知を人手で構築するには膨大なコストがかかる.そこで,本論文は行動パターンの集合知である意味ネットワークの自動構築手法を提案する.まず,webコーパスから取得した行動文の中に現れる行動属性を自動的に抽出する.次に,抽出された行動データ(行動属性と行動属性間の関係)をN3で記述する.最後に,行動主と行動間の関係(遷移関係,因果関係)で,行動間のリンクを付け,意味ネットワークを構成する.
著者
田中 俊行 グェン ミンティ 中川 博之 田原 康之 大須賀 昭彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.11, pp.1751-1761, 2011-11-01

インターネットの普及に伴い,Web上には商品やサービス(対象物)に対する多くの評判情報が蓄積されている.しかし,誰でも発信できるが故に,情報は膨大となり,それら全てに目を通すことは利用者にとって多大な負担となる.そのような背景から,レビューから意見を自動的に抽出する研究が盛んに行われており,意見を<対象物,評価視点(属性),評価値>の三つ組と捉え抽出する研究も行われている.しかしながら多くの研究は,評価視点や評価値の抽出に辞書を用いており,ジャンルごとに必要となる辞書の構築のためのコストは小さいとはいえない.また,単に辞書を用いてマッチングを行っただけでは,精度が上がらないのが現状である.そこで本論文では,教師あり学習を用いて,レビューサイトから意見を抽出する手法を提案する.提案手法は,従来の手法のように大規模な辞書をあらかじめ用意する必要がないため,コストを大幅に抑えることが可能である.実験の結果,辞書をあらかじめ用意しない既存手法と比較して,最大で適合率は約26%,再現率は約47%向上した.また,既存研究では個別の辞書を必要とするような他ジャンルに対して本手法を適用した結果,ほぼ変わらない精度で抽出することができ,他ジャンルへの適用の可能性を示すことができた.
著者
佐藤 大輔 中川 博之 田原 康之 大須賀 昭彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.11, pp.1773-1782, 2011-11-01

本論文では,閲覧中のWeb上のニュース記事に対する意見を個人のブログから収集し,その本文中の主張部分を抽出して提示するシステムの提案を行う.現在ニュースサイトにコメント欄が用意されているところは少なく,検索エンジンを用いても個人の意見のみを収集するのは容易ではない.そこで個人の意見を述べやすい場であるブログに着目してニュース記事に関連した意見を集め,主張を抽出する.本研究では主張とは意見の中で筆者が強く述べている主観的な部分を指す.開発中の主張提示システムの中で,本論文では主張抽出に焦点を当てる.主張抽出には人手により主張であるとされた文章から形態素解析を利用して特徴的な抽出ルールを設定した.本システムによりユーザはニュースサイトを閲覧すると同時に意見の多角的な見方が可能になり,より深い洞察が得られるようになる.評価実験において人手による正解との適合率を求めたところ70.0%となった.
著者
浜本 一知 田原 康之 大須賀 昭彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.11, pp.1812-1824, 2011-11-01

ライフログなどの個人情報を提供し,プロバイダより情報推薦などの個人サービスを受ける場合,多くの個人情報を提供することで更に品質の高い個人サービスを受けることができる反面,情報の漏えいや流用などによるプライバシ侵害の危険性も増える.そこで本論文では,ユーザごとに設定する希望匿名度に対応する属性を開示する前に,匿名度に影響を及ぼす二つの要素,(1)プロバイダのユーザ背景情報,(2)コミュニティの状況,をチェックし匿名度に反映させることで開示属性を調整し,結果,無用な情報開示を避けることを特徴とするプライバシ保護エージェントを提案する.(1),(2)それぞれにおいて,課題を分析し,解決への提案手法について述べ,(1)は事例モデルによる実験的机上検証,(2)は歩行者モデルを用いたコミュニティを想定し机上検証により,提案手法の妥当性と有効性を確認した.
著者
グェン ミンティ 川村 隆浩 中川 博之 田原 康之 大須賀 昭彦
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.26, no.1, pp.166-178, 2011 (Released:2011-01-06)
参考文献数
31
被引用文献数
2

In our definition, human activity can be expressed by five basic attributes: actor, action, object, time and location. The goal of this paper is describe a method to automatically extract all of the basic attributes and the transition between activities derived from sentences in Japanese web pages. However, previous work had some limitations, such as high setup costs, inability to extract all attributes, limitation on the types of sentences that can be handled, and insufficient consideration interdependency among attributes. To resolve these problems, this paper proposes a novel approach that uses conditional random fields and self-supervised learning. Given a small corpus sample as input, it automatically makes its own training data and a feature model. Based on the feature model, it automatically extracts all of the attributes and the transition between the activities in each sentence retrieved from the Web corpus. This approach treats activity extraction as a sequence labeling problem, and has advantages such as domain-independence, scalability, and does not require any human input. Since it is unnecessary to fix the number of elements in a tuple, this approach can extract all of the basic attributes and the transition between activities by making only a single pass. Additionally, by converting to simpler sentences, the approach can deal with complex sentences retrieved from the Web. In an experiment, this approach achieves high precision (activity: 88.9%, attributes: over 90%, transition: 87.5%).
著者
鈴木 誠 大須賀 昭彦 後藤 正幸 須子 統太
出版者
湘南工科大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

文字N-グラムに基づく言語独立なテキスト分類手法である蓄積手法を提案した。蓄積手法は、索引語を形成する際に文字N-グラムを使用するので、言語固有の文法構造に依存しない。テキスト文書がUnicodeで表現されてさえいれば、蓄積手法は異なる言語に対しても同一のプログラムを用いて文書を分類することができる。そこで、この蓄積手法を用いて英語と日本語と韓国語と中国語のテキスト文書の分類実験をした。その結果、英語のReuters-21578は94.5%、日本語の毎日新聞の実験データは88.5%、韓国語のハンギョレー新聞の実験データは90.2%、中国語の人民日報の実験データに対しても92.6%の精度で分類することができた。このように、蓄積手法が様々な言語で比較的高い精度で分類できることを確認した。さらに、蓄積手法の数理モデルを構築し、その数理的な意味を解明することができた。
著者
服部 正典 長 健太 大須賀 昭彦 一色 正男 本位田 真一
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151915)
巻号頁・発行日
vol.J86-D1, no.8, pp.543-552, 2003-08-01

ユビキタス環境において状況依存型のコンピューティング環境をすることを目的とした「ユビキタスパーソナライズエージェント」について述べる.本技術はユビキタス環境において収集が可能となる様々なユーザ関連データやイベント情報からユーザの状況を自動認識する「状況認識エージェント」とユビキタス環境に存在する各種デバイスとサーバシステム間でパーソナライズに関する処理の適切な分散を実現する「軽量知的モバイルエージェント」によって構成される.本論文では特にモバイルエージェント適用の効果に関して,実証実験を通した評価を実施することでその有効性の確認と考察を行う.