著者
大西 真輝 澤井 裕一郎 駒井 雅之 酒井 一樹 進藤 裕之
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

近年,インターネット上での失言をきっかけに,誹謗中傷や非難が殺到する「炎上」と呼ばれる現象が大きな社会問題となっている.そこで,我々はTwitter上の発言を対象に炎上抑制を目的とする包括的なシステムを構築した.システムは,入力文に対し炎上判定を行い,必要に応じて予想される返信文の提示と炎上する表現を訂正した文の提案を行う.利用者は,炎上の危険性と,未然に防ぐ知見を得ることが予想される.
著者
進藤 裕之 松本 裕治 永田 昌明
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2013-MPS-93, no.6, pp.1-6, 2013-05-16

自然言語処理分野における統計的文法獲得では,確率文法モデルの学習にGibbsサンプリング法が広く用いられている.しかしながら,木構造データを扱う場合には,Gibbsサンプリング法のように変数の値を一つずつ順番に更新していく方法では局所解に留まりやすく,十分に尤度の高い解を得られないという問題がある.この問題を解決するために,我々は新たな部分木のブロック化サンプリング法を提案する.本手法は,データ中に現れる共通の部分木まとめてブロック化し,ブロックに含まれる変数の同時分布からサンプリングを行う.そして,その部分木ブロック化サンプラーを従来のマルコフ連鎖モンテカルロ法と組み合わせて交互に実行することにより,目的関数の最適解を効率良く探索することができる.シンボル細分化文脈自由文法を用いて統計的文法獲得の実験を行ったところ,提案手法は既存手法よりも尤度の高い文法規則が獲得できることを確認した.
著者
藤田 早苗 Kevin Duh 藤野 昭典 平 博順 進藤 裕之
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.18, no.3, pp.273-291, 2011 (Released:2011-10-04)
参考文献数
26

本稿では,訓練データの自動拡張による語義曖昧性解消の精度向上方法について述べる.評価対象として,SemEval-2010 日本語語義曖昧性解消タスクを利用した.本稿では,まず,配布された訓練データのみを利用して学習した場合の結果を紹介する.更に,辞書の例文,配布データ以外のセンスバンク,ラベルなしコーパスなど,さまざまなコーパスを利用して,訓練データの自動拡張を試みた結果を紹介する.本稿では,訓練データの自動獲得により 79.5% の精度を得ることができた.更に,対象語の難易度に基づき,追加する訓練データの上限を制御したところ,最高 80.0% の精度を得ることができた.