著者
谷津 元樹 荒木 健治
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.28, no.5, pp.875-886, 2016-10-15 (Released:2016-11-12)
参考文献数
25
被引用文献数
2

近年,対話システムの普及に伴い,機械が言語的ユーモアを理解する必要性が高まっている.これまでの研究において,駄洒落などの韻文のユーモアを対象に大規模な自然文の集合から検出を試みた例は確認されていない.駄洒落を含む文をブログテキストよりSVMを用いて分類する手法を提案し,有効な素性を調べるため,駄洒落全般の類型別の構成比の標本調査を行った.その結果,文内に音韻的に類似した1形態素およびそれに対応する音素列を有する駄洒落の類型が支配的であることが判明した.このため本論文では,語彙素性に加え,音韻類似度に基づく音韻類似区間の検出ルールを素性としたSupport Vector Machineを用いた分類による検出手法を提案する.検出性能評価実験の結果,提案手法におけるルールベース素性の付加の有効性が確認された.
著者
澤村 勇輝 谷津 元樹 森田 武史 江上 周作 鵜飼 孝典 福田 賢一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2023, no.SWO-059, pp.02, 2023-03-17 (Released:2023-03-23)

自然言語文中のエンティティ名をWikidataなどの大規模知識グラフのリソースと対応づけるタスクであるエンティティリンキング(EL)は,質問応答などの基盤技術として注目されている.最先端のEL研究は英語を対象としており,日本語を対象としたEL研究は少ない.ELモデル構築には言語モデルや知識グラフ埋め込みを利用しており,日本語ELモデルを構築するには言語モデルや知識グラフ埋め込みの日本語対応が必要となる.本研究では,英語ELモデルを日本語対応するための課題の分析を行う.Wikidataを対象とした英語ELモデルPNEL(Pointer Network based Entity Linker)構築において言語依存の埋め込みを変更することにより,日本語ELモデルを構築した.英語データセットであるwebQSP,SimpleQuestions,LC-QuAD2を翻訳し,日本語と英語ELモデルの比較評価から,モデル構築における課題を埋め込み手法の観点から分析した.
著者
森 俊人 谷津 元樹 森田 武史 江上 周作 鵜飼 孝典 福田 賢一郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2023, no.SWO-059, pp.08, 2023-03-17 (Released:2023-03-23)

DBpediaやWikidataなどの大規模知識グラフは集合知により構築されるため,人手で構築するのには限界があり,不完全な知識グラフが構築されることがある.この問題を解決するために,知識グラフ中の欠損したエンティティや関係を補完する知識グラフ補完に関する研究が行われている.最近は,知識グラフの埋め込みに基づく知識グラフ補完の研究が注目されている.知識グラフの埋め込みに基づく手法の多くは,学習時に利用する知識グラフ(既存の知識グラフ)に含まれるエンティティの表現ベクトルを用いて関係予測などを行う.既存の知識グラフに含まれないエンティティ(未知エンティティ)は表現ベクトルを計算することができないため,未知エンティティに関する知識グラフ補完を行うことは困難である.最新の話題に対応した知識グラフに基づく質問応答や対話システムを構築するためには,未知エンティティを対象とした知識グラフの構築や補完が必要だと考えられる.本研究は,Wikipediaの赤リンクをDBpediaにおける未知エンティティとみなし,DBpediaを拡張することを目的とする.赤リンクとはWikipediaにまだ存在しない記事(記事名)への,初期設定では赤色で表示されるリンクであり,DBpedia上には赤リンクに対応するエンティティは基本的には存在しない.赤リンクはその性質上,記事が作られるべきであると判断されて作られているため,今後,赤リンクに対応する記事が作成され,DBpediaにおける新たなエンティティとして追加される可能性が高い.本稿では,Wikipediaの記事から赤リンクを抽出して未知エンティティとみなし,DBpediaにおける既存エンティティとの関係構築を行う方法について検討する.
著者
井上 恵彰 谷津 元樹 森田 武史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会研究会資料 言語・音声理解と対話処理研究会 (ISSN:09185682)
巻号頁・発行日
vol.94, 2022

<p>ユーモアを含む直喩表現生成における課題として直喩表現の質が挙げられる.先行研究より,ユーモアには,意外性,新規性,具体性の3つの要素が含まれると考えられる.本研究では,これら3つの要素を考慮したユーモアを含む直喩表現生成システムの実装を試みる.意外性を実現するために,京大格フレーム及びword2vecを利用し,新規性を実現するために,twitterの最新ツイートを取得し,具体性を実現するために,JUMAN7.0の形態素解析を用いて固有名詞抽出を行った.20~24歳の男女110人の被験者を対象に,直喩表現として成立しているかどうか,最もユーモアのある直喩の選択,直喩に意外性,新規性,具体性が認められるかの3つの評価を行った.結果,意外性,新規性,具体性全てを実現した直喩が最も直喩表現として成立していた.また,最もユーモアがあると評価された直喩は,意外性と具体性のみを実現した直喩であった.</p>
著者
スホルクワイク 亜蘭 谷津 元樹 森田 武史
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会第二種研究会資料 (ISSN:24365556)
巻号頁・発行日
vol.2021, no.SWO-055, pp.02, 2021-11-26 (Released:2022-01-12)

近年,Embodied AIなどの現実世界や3D環境との相互作用を通じて学習を行い,仮想ロボットを用いて3D環境で様々なタスクを行うことができるシステムの研究が行われている.しかし,これらにはユーザに対する質問や要求に答えるだけで対話が途切れてしまう一方向のタスクが多い.本研究では3Dの家庭環境オントロジーと常識推論を用いて,仮想ロボットがユーザと双方向なやりとりしながら案内場所を推論し,家を案内することが可能なタスク指向対話型システムを開発することを目的とする.
著者
小野 祥太郎 谷津 元樹 原田 実
雑誌
第82回全国大会講演論文集
巻号頁・発行日
vol.2020, no.1, pp.471-472, 2020-02-20

本研究では、自由記述回答と選択肢回答の両部分が存在する回答データ(商品アンケートや不具合申告など)において、自由記述部分に存在するオノマトペを検出し、選択肢回答部分との対応関係を分析・表示する機能をテキストマイニングシステムSTMに実装した。このために、「擬音語・擬態語4500 日本語オノマトペ辞典」(編者 小野正弘)の意味分類別索引の分類を基に4つの大カテゴリ、12の小カテゴリを「擬音語・擬態語であらわされる様態」の下位概念としEDR電子化辞書に登録し、さらに2625概念、3750語のオノマトペをこれらの各カテゴリ下に分類配置し、日本語意味解析システムSAGEで抽出できるようにした。これにより、オノマトペと選択属性ごとの頻度を表示できるようになり、それを利用することで自動車の不具合原因の特定などに貢献できると考えられる。
著者
小倉 拓人 谷津 元樹 原田 実
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.60, no.3, pp.967-975, 2019-03-15

本研究では,ユーザが指定した小説中の登場人物との自然言語による雑談対話を実現する対話システムDeep EVEの開発を行った.提案システムでは,青空文庫から取得した小説作品から発話応答の対を抽出しその発話の発話者を意味解析結果に基づきルールベースで推定することで,発話者情報付きの対話データを自動構築した.この対話データを用いて発話者情報を考慮した対話モデルの学習を行い,ユーザの入力に対し指定された小説作品中の登場人物のキャラクタ性を反映した応答文を生成するSeq2Seqモデルを構築した.応答文の自然さや登場らしさについて,主観的評価実験を行った結果,提案システムでは従来システムと比較して,より自然でキャラクタ性を反映した応答を生成できることが示唆された.
著者
西念 星宝 谷津 元樹 原田 実
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.31, no.5, pp.797-807, 2019-10-15 (Released:2019-10-15)
参考文献数
10

照応詞と照応関係にある先行詞を同定することは,ロボット対話や質問応答などの自然言語処理の応用研究において,高精度を達成するために必要な要素技術とされている.そこで意味解析システムSAGEを用いて文を意味解析し,語間の意味的類似度を用いて指示代名詞の先行詞を高精度に同定する照応解析システムAnasysDを開発した.先行詞らしさを数値化するために,先行詞文節と照応詞の受け側文節との共起類似度素性や先行詞文節の上位概念分類と先行詞文節の深層格による2次元の事後確率など12種類の素性を設定した.NAISTテキストコーパスを用いてナイーブベイズ法で正解率の確率分布を学習し,先行詞らしさの確率が最も高い文節を先行詞文節とする.5分割交差検定で評価した結果,63.42%の精度を達成した.