著者
一瀬 航 嶋田 和孝
雑誌
研究報告情報基礎とアクセス技術(IFAT) (ISSN:21888884)
巻号頁・発行日
vol.2017-IFAT-124, no.4, pp.1-6, 2017-02-03

近年,機械学習を用いたテキストマイニング手法によって,テキスト情報と市場変動の関係性を発見し,市場分析に応用する研究が増えている.また,Web ニュースは企業の株価に少なからず影響を与えており,世に存在する個人投資家がこのニュース記事を参考にしていると考えると,Web ニュースから未来の株価が予測できる可能性がある.そこで本論文では,Web ニュースを対象とし,より多くの投資家が市場の分析に用いていると考えられる指標である日経平均株価の予測を目的とする.テキストを用いた金融予測では膨大なテキスト情報を用いて機械学習を行うことが一般的である.しかし,投資家は市場に影響を与える多様な情報を自ら取捨選択し,独自の着眼点にしたがって市場の分析を行っている.本研究では,この着眼点,つまり,分析にどのような情報が必要なのかという知識を専門家の分析記事から抽出し,これにより機械学習の精度が向上するかの検証と新素性の提案を行う.
著者
田川 裕輝 嶋田 和孝
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.4, pp.357-391, 2018

<p>本研究では,日本で人気のある野球に着目し,Play-by-play データからイニングの要約文の生成に取り組む.Web 上では多くの野球に関する速報が配信されている.戦評は試合終了後にのみ更新され,"待望の先制点を挙げる"のような試合の状況をユーザに伝えるフレーズ(本論文では Game-changing Phrase; GP と呼ぶ)が含まれているのが特徴であり,読み手は試合の状況を簡単に知ることができる.このような特徴を踏まえ,任意の打席に対して,GP を含む要約文を生成することは,試合終了後だけでなく,リアルタイムで試合の状況を知りたい場合などに非常に有益であるといえる.そこで,本研究では Play-by-play データから GP を含む要約文の生成に取り組む.また,要約生成手法としてテンプレート型文生成手法と Encoder-Decoder モデルを利用した手法の 2 つを提案する.</p>
著者
嶋田 和孝 楠本 章裕 横山 貴彦 遠藤 勉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.112, no.110, pp.25-30, 2012-06-22
被引用文献数
1

複数人談話を対象とし,談話中の盛り上がり箇所を検出する手法について提案する.対話の盛り上がりを推定できれば,ユーザ心理の把握や,それに基づく詳細な対話状態の理解などが可能になる.提案手法では,言語的特徴の他に,笑いという状態に着目する.対話に現れる笑いを外部からの発話や行動に対して発生したものか,自発的な笑いかに分類する.また,笑いの大きさを3段階に分けて,特徴とする.これらの笑い特徴と,bag-of-wordsや時間的特徴,その他の言語的特徴などを組み合わせて,分類器に適用する.実験では,5分程度の複数人対話のデータを10セット用意し,提案手法で評価した.実験結果より,bag-of-wordsのみによる分類器と比較して,笑い特徴を利用した提案手法の有効性が確認された.
著者
上原 尚 嶋田 和孝 遠藤 勉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.112, no.367, pp.13-18, 2012-12-12

本論文では,Webから観光情報を抽出し,複数の特徴ベクトルから観光地間の類似性を評価することで,観光地を推薦するシステムを提案する.本システムでは,入力をユーザのお気に入りの観光地とすることにより,観光地の幅広い特徴分析に対応し,同時にユーザの嗜好解析も実現する.観光地の特徴ベクトルは,(1)知恵袋・ブログ上での共起キーワードと(2)時系列分布,(3)知恵袋上でのカテゴリ構造,(4)観光地周辺施設,(5)地図画像から生成する.これらの特徴ベクトルからベクトル空間モデルの考え方のもと,コサイン類似度の算出を行い,類似性の高い観光地を推薦する.さらにどこが特徴的なのかを明確に表現するため,差分の可視化にも取り組む.
著者
上原 尚 嶋田 和孝 遠藤 勉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.112, no.367, pp.13-18, 2012-12-19

本論文では,Webから観光情報を抽出し,複数の特徴ベクトルから観光地間の類似性を評価することで,観光地を推薦するシステムを提案する.本システムでは,入力をユーザのお気に入りの観光地とすることにより,観光地の幅広い特徴分析に対応し,同時にユーザの嗜好解析も実現する.観光地の特徴ベクトルは,(1)知恵袋・ブログ上での共起キーワードと(2)時系列分布,(3)知恵袋上でのカテゴリ構造,(4)観光地周辺施設,(5)地図画像から生成する.これらの特徴ベクトルからベクトル空間モデルの考え方のもと,コサイン類似度の算出を行い,類似性の高い観光地を推薦する.さらにどこが特徴的なのかを明確に表現するため,差分の可視化にも取り組む.
著者
山口 純平 嶋田 和孝 榎田 修一 江島 俊朗 遠藤 勉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.109, no.470, pp.25-30, 2010-03-08

本稿では,隠れに頑健な人物識別手法として,顔特徴とコンテキスト情報を用いた手法について報告する.本手法では,顔特徴として正面顔と目,鼻などの顔部品を用い,CLAFIC法により類似度を求める.またコンテキスト情報には衣服の情報を使用し,衣服特徴として4つの特徴を用い,それぞれ類似度を求める.これらの特徴から得られた類似度を統合し,人物識別を行う.顔の一部が隠れた画像に対して,顔特徴のみで識別を行った場合の結果と本手法で識別を行った場合の結果を比べることで,コンテキスト情報として衣服特徴を用いることの有効性を確認した.