著者
大西 真輝 澤井 裕一郎 駒井 雅之 酒井 一樹 進藤 裕之
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.29, 2015

近年,インターネット上での失言をきっかけに,誹謗中傷や非難が殺到する「炎上」と呼ばれる現象が大きな社会問題となっている.そこで,我々はTwitter上の発言を対象に炎上抑制を目的とする包括的なシステムを構築した.システムは,入力文に対し炎上判定を行い,必要に応じて予想される返信文の提示と炎上する表現を訂正した文の提案を行う.利用者は,炎上の危険性と,未然に防ぐ知見を得ることが予想される.
著者
井上 剛 進藤 裕之 松本 裕治
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2017-NL-232, no.8, pp.1-9, 2017-07-12

アラビア語などの形態的に豊かな言語の品詞タグ付けは,英語など形態的に乏しい言語の品詞タグ付けに比べ,タグセットが膨大になるため,困難な問題である.これは,言語固有の情報を反映した高粒度な品詞タグが,各形態統語的カテゴリごとに定義されたタグの組み合わせによって構成されるためである.既存のアラビア語品詞タグ付けでは,各形態統語的カテゴリを独立に予測しており,各カテゴリを予測する上で有益な情報をカテゴリ間で共有できていなかった.本研究では,マルチタスク学習の枠組みを用いて,各形態統語的カテゴリを同時に予測する手法を提案する.また,入力語に対して各形態統語的カテゴリが取りうるタグを登録した辞書情報をモデルに組み込むことで,さらなる性能向上が得られることを示す.Penn Arabic Treebank を用いた評価実験の結果,これまでに報告されている最高性能の品詞タガーの正解率を上回ることを確認した.
著者
太田 瑶子 進藤 裕之 松本 裕治
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2018-NL-235, no.1, pp.1-8, 2018-05-06

文学の一つとして詩がある.詩は言葉の表面的な意味だけでなく,言葉が持つ美学的 ・ 喚起的な性質を用いて表現される.詩は短い文字列であっても,詩として表現する事で,言葉の持つ奥深さによってその場の雰囲気を封じ込めることが出来る.しかし,実際にいざ詩を作ろうとすると,どのように始めれば良いのか難しい.そのような場合であっても,手軽に詩を作れるようにしたいと考えた.本研究では,詩の中でも有季定型俳句を選び,言葉を入力することにより俳句の自動生成を行った.本研究ではより柔軟な表現が生成できるように,深層学習を使った.また,韻律や季語のような有季定型俳句の規定を素性や制限として用いた.俳句としての体をなすような生成結果が得られた.
著者
大西 真輝 澤井 裕一郎 駒井 雅之 酒井 一樹 進藤 裕之
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第29回全国大会(2015)
巻号頁・発行日
pp.3O13in, 2015 (Released:2018-07-30)

近年,インターネット上での失言をきっかけに,誹謗中傷や非難が殺到する「炎上」と呼ばれる現象が大きな社会問題となっている.そこで,我々はTwitter上の発言を対象に炎上抑制を目的とする包括的なシステムを構築した.システムは,入力文に対し炎上判定を行い,必要に応じて予想される返信文の提示と炎上する表現を訂正した文の提案を行う.利用者は,炎上の危険性と,未然に防ぐ知見を得ることが予想される.
著者
進藤 裕之 松本 裕治 永田 昌明
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2013-MPS-93, no.6, pp.1-6, 2013-05-16

自然言語処理分野における統計的文法獲得では,確率文法モデルの学習にGibbsサンプリング法が広く用いられている.しかしながら,木構造データを扱う場合には,Gibbsサンプリング法のように変数の値を一つずつ順番に更新していく方法では局所解に留まりやすく,十分に尤度の高い解を得られないという問題がある.この問題を解決するために,我々は新たな部分木のブロック化サンプリング法を提案する.本手法は,データ中に現れる共通の部分木まとめてブロック化し,ブロックに含まれる変数の同時分布からサンプリングを行う.そして,その部分木ブロック化サンプラーを従来のマルコフ連鎖モンテカルロ法と組み合わせて交互に実行することにより,目的関数の最適解を効率良く探索することができる.シンボル細分化文脈自由文法を用いて統計的文法獲得の実験を行ったところ,提案手法は既存手法よりも尤度の高い文法規則が獲得できることを確認した.
著者
藤田 早苗 Kevin Duh 藤野 昭典 平 博順 進藤 裕之
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.18, no.3, pp.273-291, 2011 (Released:2011-10-04)
参考文献数
26
被引用文献数
1

本稿では,訓練データの自動拡張による語義曖昧性解消の精度向上方法について述べる.評価対象として,SemEval-2010 日本語語義曖昧性解消タスクを利用した.本稿では,まず,配布された訓練データのみを利用して学習した場合の結果を紹介する.更に,辞書の例文,配布データ以外のセンスバンク,ラベルなしコーパスなど,さまざまなコーパスを利用して,訓練データの自動拡張を試みた結果を紹介する.本稿では,訓練データの自動獲得により 79.5% の精度を得ることができた.更に,対象語の難易度に基づき,追加する訓練データの上限を制御したところ,最高 80.0% の精度を得ることができた.