著者
谷津 元樹 荒木 健治
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.28, no.5, pp.875-886, 2016-10-15 (Released:2016-11-12)
参考文献数
25

近年,対話システムの普及に伴い,機械が言語的ユーモアを理解する必要性が高まっている.これまでの研究において,駄洒落などの韻文のユーモアを対象に大規模な自然文の集合から検出を試みた例は確認されていない.駄洒落を含む文をブログテキストよりSVMを用いて分類する手法を提案し,有効な素性を調べるため,駄洒落全般の類型別の構成比の標本調査を行った.その結果,文内に音韻的に類似した1形態素およびそれに対応する音素列を有する駄洒落の類型が支配的であることが判明した.このため本論文では,語彙素性に加え,音韻類似度に基づく音韻類似区間の検出ルールを素性としたSupport Vector Machineを用いた分類による検出手法を提案する.検出性能評価実験の結果,提案手法におけるルールベース素性の付加の有効性が確認された.
著者
ヨーナス・シューベルグ 荒木 健治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.35, pp.91-95, 2007-03-29
被引用文献数
1

我々は日本語の謎掛けを自動的に生成するシステムを提案する。本システムは謎掛けスタイルの駄酒落を生成するが、使用する辞書によって、生成される結果は様々でおる。謎掛けのためのヒントを生成するための情報源として Web を用いた。生成された謎掛けの一部を人手による評価を行った。システムが生成した謎掛けは人間が作成したものより評価が低かったが、下品な言葉の辞書を用いた場合の方が、普通の言葉の辞書を用いた場合よりも評価が高いという結果が得られた。生成された謎掛けの約30%は、文法的な誤りや、その他の要因のため意味を理解できないものであった。We present a system for generating wordplay jokes in Japanese, which generates riddle style puns. By using different lexicons, different results can be achieved. Web searches are used to generate hints for the riddles. A subset of the generated riddles is evaluated manually. Using a naughty word lexicon gave funnier riddles than using normal words, though computer generated riddles in general were less funny than human generated riddles. Many computer generated riddles contain broken grammar or in other ways fail to make sense.
著者
木村 泰知 小林 暁雄 坂地 泰紀 内田 ゆず 高丸 圭一 乙武 北斗 吉田 光男 荒木 健治
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

本研究では,地方政治に関する研究の活性化・学際的応用を目指して,「議論の背景」「議論の過程」「議論の結果」を関連づけるコーパスの構築を進めている.本稿では,議論の背景・過程・結果を関連づける地方政治コーパスの構築の試みについて述べる.
著者
荒木 健治 高橋 祐治 桃内 佳雄 栃内 香次
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.3, pp.391-402, 1996-03-25
被引用文献数
19

我々は, 人間の言語および知識獲得能力の解明とその実現を目的として研究を行っている. このような研究はこれまでいくつか存在するが, 工学的に有効なシステムを完成するまでに至っていないのが現状である. また, 心理学の立場からの研究も存在するが, これらの研究は工学的にどう実現するかという問題は対象としていない. そこで, 本論文では, この言語および知識獲得能力を工学的に実現する一つの試みとして, 入力べた書き文とその漢字かな交じり文より帰納的に語の読みと表記を獲得し, その獲得状況および変換精度に基づく確実性の高い語より順に変換するという帰納的学習によるべた書き文のかな漢字変換手法を提案する. 本手法は辞書が空の状態からでも学習機能により語を獲得することができるので, 辞書を個人ごとに自動的に作成することが可能, 個人用辞書とすることにより辞書容量を少なくできる, 未登録語の自動登録が可能, 初期辞書作成の労力を回避できるという利点がある. 本論文では, 更に本手法に基づく実験システムを作成し, 異なる4分野の論文40編を用いて本手法の学習機能による適応性能を確認するための実験を行った. 実験の結果, 4分野すべてにおいて90%以上の精度が得られ, べた書き文のかな漢字変換における本手法の有効性が確認された.
著者
藤原 敬記 伊藤 敏彦 荒木 健治 甲斐 充彦 小西 達裕 伊東 幸宏
出版者
電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) (ISSN:18804535)
巻号頁・発行日
vol.89, no.7, pp.1493-1503, 2006-07-01
参考文献数
24
被引用文献数
9

実環境での音声対話システムの使用において,誤認識を回避することは難しい.誤認識が起きると,システムはユーザの期待する応答とかけ離れた応答を行い,対話がスムーズに進まなくなることも多い.そこで本研究では,音声認識器が誤認識した場合でも,認識信頼度と対話履歴を用いることで正しくユーザの意図を推定することができる音声言語理解手法を提案する.これは,音声認識器が誤認識した場合でも多くの場合,複数候補(N-best)中に正解が含まれていること,システムが誤認識した場合にはユーザは大体訂正反応を示すこと,タスク指向対話には強い一貫性がありユーザは基本的に意味的・文脈的に関係した内容以外を発話しないことを利用する.また,提案手法ではあらかじめすべての認識可能単語を理解候補として保持し,言語理解部の対話戦略において音声認識結果中の単語との意味的関連性などを考慮している.これにより音声認識結果のN-best中に正解の一部が含まれていない場合でも,複数のユーザ発話の認識結果に基づくことで正しい意図を推定することが可能となっている.評価データにおいて,提案手法における対話単位での理解率は72.2%(21,430/29,670対話),単語単位での理解率は87.1%(77,544/89,010単語)であり,従来手法の最新認識結果の上位候補を優先するシステムの57.9% (17,178/29,670対話),75.4%(67,084/89,010単語)と比較しても有効である.
著者
岩崎 礼次郎 荒木 健治
出版者
社団法人 人工知能学会
巻号頁・発行日
pp.65-65, 2005 (Released:2006-10-26)

コールセンターにおいて、毎日の営業日報作成といった作業は非常に手間のかかる作業である。そこで、コールセンターの対話データから自動的に営業日報を生成するために、対話データの特徴を元に営業日報にするべき内容の重要文の抽出を行った
著者
木村 泰知 荒木 健治 桃内 佳雄 栃内 香次
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:09151923)
巻号頁・発行日
vol.J84-D2, no.9, pp.2079-2091, 2001-09-01

本論文では対話例から学習を行う音声対話処理手法について述べる.多くの音声対話システムはあらかじめ生成規則やデータベースを与えて処理を行うタスク指向であり,日常対話における雑談などの様々な話題を処理することは難しい.本手法はシステムとユーザのやりとりを対話例として,遺伝的アルゴリズムを用いた帰納的学習によってシステム応答とユーザ発話を対としたルールの獲得を行う.あらかじめ学習データを必要とせず,実対話例から獲得したルールにより応答を試みる.そのため,動的なデータから学習を行うことができ,データによる偏りを少なくする.本論文では本手法の有効性を明らかにするために,雑談を対象とし,音声対話に拡張したELIZA型システムと本手法によるシステムとの比較実験及び,複数被験者による実験を行った.その結果,比較実験で正応答と準応答の合計の割合が66.3%から76.1%に向上したことと,実対話例から獲得したルールを用いて有効な応答を行うことを確認した.この9.8ポイントの向上という結果は本手法が雑談に対して有効であることを示している.
著者
内田 ゆず 荒木 健治 米山 淳
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.24, no.3, pp.811-820, 2012-06-15 (Released:2012-06-26)
参考文献数
10
被引用文献数
2 3

日本語の語彙には,オノマトペが豊富に存在している.これらの語は生き生きとした表現力をもち,日本語でのコミュニケーションには欠かせないものとなっている.日本語を母語とする人は,ごく自然にオノマトペの用法を身につけ,「感覚的に」使用する.そのため,オノマトペをほかの言葉に置き換えたり,その意味を明確に説明することは困難である.日本語学習者がオノマトペの意味や用法を習得することは難しいとされている.オノマトペを学ぶ方法のひとつとして,オノマトペを用いた様々な表現に触れることが挙げられる.そこで,本論文では,ブログ記事を対象としたオノマトペ用例文の自動抽出手法を提案する.提案手法は,オノマトペの後続要素と係り先を分析した結果に基づくものである.評価実験の結果,41,315件のブログ記事から15,437文の用例文を抽出し,適合率96.2%(481/500)が得られた.
著者
荒木 健治 栃内 香次 永田 邦一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.28, no.4, pp.412-421, 1987-04-15
被引用文献数
6

べた書き文のかな漢字変換方式においては 計算機で文を分割する際に一般に極めて多数の候補が出現し それを一つに決定することが大きな問題となる.本論文は この問題に対して 他の語と重なりあうことなく確実に分離できる部分(キーワード)から順次 段階的に単語のあてはめを行う手法を提案し さらに本方式の前提となるキーワードの存在とその有効性を確認し その上で本方式を用いた実験システムを開発し その性能評価実験を特定専門分野の学術文献を対象に行った結果について述べたものである.本方式では 最初にキーワードを用いてべた書き文を分割し ついでそのキーワードによるあてはめの拡張を行い 以後カタカナ語のあてはめ 文節端の助詞候補の検出 連接情報を用いた単語のあてはめ 助詞候補の評価 接辞の処理 最後に一字漢字語のあてはめを行う.実験により500語程度のキーワードで平均3?4文字程度にべた書き文が分割できることがわかり 本方式によるべた書き文のかな漢字変換システムを開発した.さらに 工学に関する3分野の学術文献を資料として 性能評価実験を行った結果 90%以上の変換精度が得られることがわかり 本方式の有効性を示すことができた.
著者
矢野 純司 荒木 健治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.35, pp.21-28, 2007-03-28
参考文献数
11

本研究では自動要約の対象として、コールセンターにおける音声対話に着目し、営業日報を自動的に生成する手法を提案する。コールセンターにおいて電話内容を営業日報として簡潔に記載する作業は、時間と作業量のどちらの観点からも非常に大きなコストとなっている。そこで、本手法では音声データをテキスト化し重要箇所の抽出、そして文体変換を行うことで、営業日報をシステムによって自動生成することを目的とする。本稿では、過去の対話内容とその営業日報から帰納的学習により再帰的に規則獲得を行い、それらの規則を用いて未知の対話内容に対して重要箇所の決定、文体変換を行うシステムを提案し、その性能評価を行った。In this research, we propose a summarization method for generating business reports from call center speech dialogues. It is costly laborious and time-consuming to write a business report at call centers by hand. Therefore, we propose a method for generating business reports from speech dialogues using text conversion, extraction of important parts and paraphrasing. This method recursively acquires rules from previous dialogues and business reports by using Inductive Learning and applies them to new dialogues to determine important parts and paraphrase them. In this paper, we describe our system and introduce the evaluation of its performance.