著者
吉原 輝 関 和広 上原 邦昭
出版者
一般社団法人情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2015, no.4, pp.1-6, 2015-02-24

投資家が投資を行う際,株価等の数値情報の他に,新聞記事等の言語情報を基に株の売買を判断する.この判断を支援するため,これまで様々な研究が行われており,数値情報を対象にした研究では,株価の時系列データの特性が多く利用されている.これに対し,言語情報を対象にした研究では,その特性がほとんど利用されていない.これは,言語情報が株価に与える影響の時間的な変化を人手でルール化することが困難だからである.一方で,画像認識や音声認識などの分野において近年注目を集めている深層学習 (Deep Learning) は,大規模なデータから有益な特徴の抽出が可能である.そこで本研究では,深層学習のアプローチを応用し,時間的な変化を考慮した再帰的なネットワークを構築することで株価動向の推定を行う手法を提案する.入力に新聞記事のデータを用いることで,言語情報が与える影響の時間的な変化を捉えることができる.実際の新聞記事と株価のデータを用いて 10 銘柄の株価動向推定を行い,本手法の有効性を示す.
著者
吉原 輝 藤川 和樹 関 和広 上原 邦昭
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

経済指標は現実世界の様々な事象によって変動する.これらの事象は,新聞記事やマイクロブログなどの言語情報に表出するため,これらの言語情報を分析すれば,経済指標を推定できる可能性がある.しかし,発信される全ての言語情報を人手で全て分析することは難しい.一方で,近年注目を集めている深層学習は,大規模なデータから有益な特徴の抽出が可能である.本研究では,この技術を応用することで,経済指標動向の推定を行う.
著者
宮西 大樹 関 和広 上原 邦昭
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.27, no.3, pp.223-234, 2012 (Released:2012-03-28)
参考文献数
32

This paper proposes a framework to predict future significance or importance of nodes of a network through link prediction. The network can be of any kind, such as a co-authorship network where nodes are authors and co-authors are linked by edges. In this example, predicting significant nodes means to discover influential authors in the future. There are existing approaches to predicting such significant nodes in a future network and they typically rely on existing relationships between nodes. However, since such relationships are dynamic and would naturally change over time (e.g., new co-authorship continues to emerge), approaches based only on the current status of the network would have limited potentiality to predict the future. In contrast, our proposed approach first predicts future links between nodes by multiple supervised classifiers and applies the RankBoost algorithm for combining the predictions such that the links would lead to more precise predictions of a centrality (significance) measure of our choice. To demonstrate the effectiveness of our proposed approach, a series of experiments are carried out on the arXiv (HEP-Th) citation data set.
著者
関 和広 藤井 敦 石川 徹也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.9, no.3, pp.63-85, 2002-07-10 (Released:2011-03-01)
参考文献数
26
被引用文献数
1 2

日本語では, 読み手や聞き手が容易に推測できる語は頻繁に省略される. これらの省略を適切に補完することは, 自然言語解析, とりわけ文脈解析において重要である. 本論文は, 日本語における代表的な省略現象であるゼロ代名詞に焦点を当て, 確率モデルを用いた照応解析手法を提案する. 本手法では, 学習を効率的に行なうため, 確率モデルを統語モデルと意味モデルに分解する. 統語モデルは, ゼロ代名詞の照応関係が付与されたコーパスから学習する. 意味モデルは, 照応関係が付与されていない大規模なコーパスを用いて学習を行ない, データスパースネス問題に対処する. さらに本手法では, 照応解析処理の精度を高めるために確信度を定量化し, 正解としての確信が高いゼロ代名詞のみ選択的に結果を出力することも可能である. 新聞記事を対象にした照応解析実験を通して本手法の有効性を示す.
著者
宮西 大樹 関 和広 上原 邦昭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.7, no.2, pp.1-10, 2014-06-30

マイクロブログ検索には,単語を用いた疑似適合フィードバックによるクエリ拡張が有効である.しかし,単語は意味的・時間的な曖昧性を持つため,単語を用いたクエリ拡張は有効に機能しない場合がある.そこで,本稿では,単語や2語以上の単語の組合せであるコンセプトを用いた疑似適合フィードバックによるクエリ拡張手法を提案する.さらに,提案手法は検索クエリと同時期に出現するコンセプトの頻度の時間遷移に関する情報を疑似適合フィードバックに組み入れることで,マイクロブログサービスのリアルタイム性を考慮する.代表的なマイクロブログデータであるTweets2011コーパスを用いた実験から,提案するコンセプトを用いたクエリ拡張によって,検索クエリに適合し,かつ情報量の豊富な文書を効果的に検索できることを示す.Incorporating the temporal property of words into query expansion methods based on relevance feedback has been shown to have a significant positive effect on microblog searching. In this paper, we propose a concept-based query expansion method based on a temporal relevance model that uses the temporal variation of concepts (e.g., terms or phrases) on microblogs. Our model naturally extends an extremely effective existing concept-based relevance model by tracking the concept frequency over time. Moreover, the proposed model produces important concepts that are frequently used within a particular time period associated with a given topic, which have more power to discriminate between relevant and non-relevant microblog documents than words. Our experiments using a corpus of microblog data (the Tweets2011 corpus) show that the proposed concept-based query expansion method improves search performance significantly, especially when retrieving highly relevant documents.
著者
岡村 直人 関 和広 上原 邦昭
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2011, no.9, pp.1-7, 2011-05-09

感染症サーベイランスには,大別して医療機関の情報を利用した方法とWeb情報を利用した方法がある.Web情報はリアルタイム性が高く,感染症の蔓延防止を目的とする感染症サーベイランスに有用である可能性がある.本論文では,Web情報,特にソーシャルメディアを用いた感染症サーベイランスの第一歩として,インフルエンザを対象にTwitterの有効性を実験的に調査する.Twitterに投稿されたインフルエンザの症状を含むtweetの分類を行い,実際のインフルエンザ報告件数との関係を分析する.There are roughly two types of syndromic surveillance; One uses information from medical institutions and another gathers information from the Web. The information used by the latter, such as consumer generated media (CGM), may reflect more real-time events and thus may be more useful for syndromic surveillance since detecting early infection of a target syndrome prevents wider spread of the syndrome. This paper investigates the usefulness of CGM, specifically microblogs, for syndromic surveillance focusing on influenza. We collect a number of microblog posts (tweets) which include symptoms of influenza and study their size and transition against those of reported true influenza cases.
著者
関 和広 上原 邦昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. LOIS, ライフインテリジェンスとオフィス情報システム (ISSN:09135685)
巻号頁・発行日
vol.110, no.42, pp.1-6, 2010-05-13

ブログやマイクロブログ(Twitterなど)といったソーシャルメディアの利用者の増加に従い,これら新しいメディアからの情報の抽出・利用についての研究が盛んに行われている.本研究では,ソーシャルメディアを実世界のオブジェクトのメタデータと捉え,これが従来の情報検索に及ぼす影響について議論する.特に本稿では,ソーシャルブックマークに注目し,熟練者による従来の統制語彙に基づく索引との比較を通して,情報検索におけるその有用性を検証する.より具体的には,生物医学分野の文献を題材とし,各論文に付与されたMeSH索引語(統制語彙に基づく索引)とソーシャルブックマークサービスの1つであるCiteULikeを利用して付与されたソーシャルタグを比較し,その特徴と有用性を様々な観点から実験的に調査する.実験の結果,情報検索においてソーシャルタグはMeSHと相補的に機能し,ソーシャルタグの網羅性が高まるほど検索精度が向上することが示された.