著者
斉藤 いつみ 貞光 九月 浅野 久子 松尾 義博
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.24, no.2, pp.297-314, 2017-03-15 (Released:2017-06-15)
参考文献数
16
被引用文献数
1

ソーシャルメディア等の崩れた日本語の解析においては,形態素解析辞書に存在しない語が多く出現するため解析誤りが新聞等のテキストに比べ増加する.辞書に存在しない未知語の中でも,既知の辞書語からの派生に関しては,正規形を考慮しながら解析するという表記正規化との同時解析の有効性が確認されている.本研究では,これまで焦点があてられていなかった,文字列の正規化パタン獲得に着目し,アノテーションデータから文字列の正規化パタンを統計的に抽出する.統計的に抽出した文字列正規化パタンと文字種正規化を用いて辞書語の候補を拡張し形態素解析を行った結果,従来法よりも再現率,精度ともに高い解析結果を得ることができた.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
pp.DSF-515, (Released:2015-12-15)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
西川 仁 平尾 努 牧野 俊朗 松尾 義博 松本 裕治
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.20, no.4, pp.585-612, 2013-09-13 (Released:2013-12-12)
参考文献数
29

本論文では,複数文書要約を冗長性制約付きナップサック問題として捉える.この問題に基づく要約モデルは,ナップサック問題に基づく要約モデルに対し,冗長性を削減するための制約を加えることで得られる.この問題は NP 困難であり,計算量が大きいことから,高速に求解するための近似解法として,ラグランジュヒューリスティックに基づくデコーディングアルゴリズムを提案する.ROUGE に基づく評価によれば,我々の提案する要約モデルは,モデルの最適解において,最大被覆問題に基づく要約モデルを上回る性能を持つ.要約の速度に関しても評価を行い,我々の提案するデコーディングアルゴリズムは最大被覆問題に基づく要約モデルの最適解と同水準の近似解を,整数計画ソルバーと比べ100倍以上高速に発見できることがわかった.
著者
宮崎 千明 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博 佐藤 理史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.31, no.1, pp.DSF-E_1-9, 2016-01-06 (Released:2016-01-08)
参考文献数
13

Characterizing dialogue system utterances is important in making human-computer interaction systems more friendly and human-like. A method is described for achieving this by converting functional expressions according to their generation probabilities, which are calculated for specific characters. Experimental results show that the method can add characteristics of the target profiles (i.e., gender, age and closeness with a conversation partner) to dialogue system utterances and in so doing can generate a large variety of linguistic expressions.
著者
本間 幸徳 貞光 九月 西田 京介 浅野 久子 松尾 義博
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2017-SLP-116, no.26, pp.1-6, 2017-05-08

本稿では,ある文書におけるユーザの検索要求に対し,一つ以上の文を回答として提示する部分文書検索手法を提案する.検索要求によっては提示すべき文が文書中に散在する場合があるため,提案手法では,文間の関係性に基づいて推定した文書構造を用いることで,文書に散在する文の集合を部分文書として抽出する.また抽出された部分文書について,分散表現を利用した意昧ベクトルを作成し,検索スコアの算出に用いることで検索精度の向上を図る.評価実験により,文書構造に基づいて部分文書を抽出し,対応する意昧ベクトルを検索に用いることで,ユーザの検索要求に適した検索結果が得られることを示す.
著者
片山 太一 小林 のぞみ 牧野 俊朗 松尾 義博
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第27回全国大会(2013)
巻号頁・発行日
pp.1F44, 2013 (Released:2018-07-30)

ユーザに合わせたシステム構築のためには、ユーザの知識を理解することは重要である。既存の研究では、人手で単語に難易度を付与し、その情報を利用してユーザの知識推定を行ってきた。しかし、専門性が高くなるとあるトピックには詳しいが他のトピックには詳しくないといったユーザもいるため、一般的な難易度のみを利用して知識推定を行うことは難しい。本研究では、トピック情報を利用することで、上記の問題を解決する。
著者
小林 のぞみ 平野 徹 東中 竜一郎 牧野 俊朗 松尾 義博
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第29回全国大会(2015)
巻号頁・発行日
pp.2L34, 2015 (Released:2018-07-30)

我々は,パーソナライズ可能な音声対話エージェントの実現に向け,ユーザが自身について述べた情報(ユーザ情報)を扱いやすい形で抽出することを進めている.本発表では,ユーザ情報抽出の一部として述語項構造抽出を対象に,特にシステムの質問とユーザの回答(質問回答ペア)に着目し,従来の述語項構造解析では抽出できない問題について述べ,その解決方法を提案する.
著者
森田 一 奥村 学 東中 竜一郎 松尾 義博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.2012, no.3, pp.1-6, 2012-11-15

Twitter 上の対話はチャットのログ等とは異なり,発話にはリプライやリツイートといった明示的な形で他の発話と関連していることを示す情報が含まれる場合がある.そのため,これらの情報を積極的に利用することが Twitter 上の発話間の関係を同定する際には重要となる.関係の同定によく用いられている Markov Logic Network (MLN) 上で Twitter 特有の情報を利用し,発話間の関係の有無とその種類の同定を行うモデルを提案する.一方,発話系列には長さに制限がなく非常に長い対話となることもしばしば存在する.このような長い発話に MLN を適用する際に, MLN が大きな問題に対しては計算が困難であることが問題となる.本稿では MLN に対して SVM における動的素性に対応する動的述語を導入することにより,分割した系列に対して近似的に推論が行えるように MLN に対して拡張を行う.
著者
平野 徹 牧野 俊朗 松尾 義博
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.27, 2013

CGM上のクチコミを用いて自社製品等のマーケティング分析を行うことで、タイムリーにユーザの反響を知ることができる。しかし クチコミを抽出するだけでは、クチコミを投稿した人がどんな人かわからないため、自社製品に対してクチコミしたユーザ層の分析等はできなかった。 本研究では、クチコミ投稿者の日々のつぶやきの内容から、そのユーザの性別・年齢等の属性を推定する手法を提案する。