著者
萩行 正嗣 河原 大輔 黒橋 禎夫
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.21, no.2, pp.213-247, 2014-04-18 (Released:2014-07-17)
参考文献数
12
被引用文献数
2 3

現在,自然言語処理では意味解析の本格的な取り組みが始まりつつある.意味解析の研究には意味関係を付与したコーパスが必要であるが,従来の意味関係のタグ付きコーパスは新聞記事を中心に整備されてきた.しかし,文書には多様なジャンル,文体が存在し,その中には新聞記事では出現しないような言語現象も出現する.本研究では,従来のタグ付け基準では扱われてこなかった現象に対して新たなタグ付け基準を設定した.Webを利用することで多様な文書の書き始めからなる意味関係タグ付きコーパスを構築し,その分析を行った.
著者
萩行 正嗣 上谷 珠視 東 宏樹 大竹 清敬
出版者
一般社団法人 電子情報通信学会
雑誌
電子情報通信学会 通信ソサイエティマガジン (ISSN:21860661)
巻号頁・発行日
vol.15, no.3, pp.200-210, 2021 (Released:2021-12-01)
参考文献数
14

近年,ICT の発達に伴い,災害対応の現場でもこれらを活用した災害対応の効率化が行われている.特にTwitter やLINE に代表されるコミュニケーションツールは被災者一人一人と災害対応機関とのコミュニケーションを変えつつある.本稿では,現在コミュニケーションツールが災害対応の現場で活用されている例やその背景にある技術について紹介するとともに,我々が開発中の防災チャットボットSOCDA の機能と展望についても紹介する.
著者
萩行 正嗣 河原 大輔 黒橋 禎夫
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.21, no.3, pp.563-600, 2014-06-16 (Released:2014-09-16)
参考文献数
22
被引用文献数
2 3

日本語では用言の項が省略されるゼロ照応と呼ばれる現象が頻出する.ゼロ照応は照応先が文章中に明示的に出現する文章内ゼロ照応と,明示的に出現しない外界ゼロ照応に分類でき,従来のゼロ照応解析は主に前者を対象としてきた.近年,Web が社会基盤となり,Web上でのテキストによる情報伝達がますます重要性をましている.そこでは,情報の送り手・受け手である著者・読者が重要な役割をはたすため,Web テキストの言語処理においても著者・読者を正確にとらえることが必要となる.しかし,文脈中で明確な表現(人称代名詞など)で言及されていない著者・読者は,従来の文章内ゼロ照応中心のゼロ照応解析では多くの場合対象外であった.このような背景から,本論文では,外界ゼロ照応および文章の著者・読者を扱うゼロ照応解析モデルを提案する.提案手法では外界ゼロ照応を扱うために,ゼロ代名詞の照応先の候補に外界ゼロ照応に対応する仮想的な談話要素を加える.また,語彙統語パターンを利用することで,文章中で著者や読者に言及している表現を自動的に識別する.実験により,我々の提案手法が外界ゼロ照応解析だけでなく,文章内ゼロ照応解析に対しても有効であることを示す.
著者
近藤 佑樹 萩行 正嗣 吉田 光男 梅村 恭司
出版者
Webインテリジェンスとインタラクション研究会
雑誌
Webインテリジェンスとインタラクション研究会 予稿集 第10回研究会 (ISSN:27582922)
巻号頁・発行日
pp.31-36, 2017 (Released:2022-11-07)
参考文献数
8

ソーシャルメディアの投稿を活用する際に,ユーザの居住地と投稿内容とを関連付けることにより,より有用な情報を得ることができる.しかし自身の居住地を登録しているユーザは少なく,ユーザの居住地を推定する研究が広く行われている.本研究では,アメダスによる日本全国の観測データを利用してTwitterユーザの居住地を推定する手法を提案する.本手法ではまず,ツイートの投稿テキストから,投稿ユーザがどのような天気の中で投稿したかを推定する.次に推定した天気および投稿日時を各地のアメダスによる観測データと照合する.最後にどの地域から集中的に投稿しているかを推定し,その地域をユーザの居住地とみなす.単語の地理的局所性を利用する従来の手法と比較し,良好な結果が得られた.
著者
萩行 正嗣 柴田 知秀 黒橋 禎夫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. NL,自然言語処理研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.185, pp.45-52, 2008-05-15
参考文献数
14
被引用文献数
1

近年、インターネット環境の普及とともに数多くの人がブログを通じて情報を発信するようになっている。それに伴い、大量に存在するブログから面白いものを探し出すことが困難になってきている。本研究では表層・語彙的特徴量に基づき、ブログの面白さを分析する手法を提案する。まず、ブログの記事から文字長などの表層的特徴量や評価表現などの語彙的特徴量といった様々な特徴量を抽出する。そして,これらを特徴量として与えてSVRを用いた機械学習を行なうことで、ブログの面白さを推定する。独自に設置したブログを用いて収集した249件のブログ記事とそれを採点したものを用いて実験を行なったところ,ベースラインを上回る精度を達成することができた。また、面白さの個人差の問題についてはドメインアダプテーションを用いることで対処した。最後に、学習されたモデルからブログの面白さの要因について考察を行なった。