著者
梶原 智之 山本 和英
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.3, pp.983-992, 2015-03-15

小学生の文章読解支援に向けた語彙平易化を目的として,国語辞典の語釈文から平易な語彙的換言を獲得する手法を提案する.国語辞典の語釈文は,見出し語を平易な語を用いて説明しており,見出し語から語釈文中の語への換言によって語彙の平易化が見込まれる.従来は主要部終端型である日本語の特徴を利用した語釈文末の語への換言が行われてきたが,我々は語釈文全体から見出し語と換言可能性のある候補を広く収集して換言する手法を提案する.換言候補から最終的な換言を選択する際には,文脈を考慮するよりもシソーラスに基づく語の類似度を用いた選択の効果が高いことを実験的に示す.
著者
桂井 麻里衣 大向 一輝 梶原 智之
出版者
同志社大学
雑誌
基盤研究(B)
巻号頁・発行日
2020-04-01

本研究の目的は,ビッグデータ化の進む学術情報から研究内容の特徴軸をデータドリブンに発見し,個々の研究者の専門興味を多元的に表現する技術を構築することである.具体的には,大規模論文集合に高度な意味解析を導入し,研究者の多様な活動情報を埋め込める深層潜在空間を構築する.これにより,研究活動情報に対し固定次元ベクトルを出力するモデルScholar2Vecを確立する.
著者
高山 隼矢 梶原 智之 荒瀬 由紀
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.29, no.1, pp.84-111, 2022 (Released:2022-03-15)
参考文献数
45
被引用文献数
1

人間は対話においてしばしば相手の質問や発話に対して間接的な応答をする.例えば,予約サービスにおいてユーザがオペレータに対して「あまり予算がないのですが」と応答した場合,オペレータはその応答には間接的に「もっと安い店を提示してください」という意図が含まれていると解釈できる.大規模な対話コーパスを学習したニューラル対話モデルは流暢な応答を生成する能力を持つが,間接的な応答に焦点を当てたコーパスは存在せず,モデルが人間と同様に間接的な応答を扱うことができるかどうかは明らかではない.本研究では既存の英語対話コーパスである MultiWoZ を拡張し,71,498 件の間接的応答と直接的応答の対からなる対話履歴付きパラレルコーパスを構築した.また,間接的な応答を扱う能力を評価するための 3 つのベンチマークタスクを設計し,最新の事前学習済みモデルの性能を調査した.さらに,ユーザーの間接的な発話を事前に直接的な発話に変換することで対話応答生成の性能が向上することを確認した.
著者
鈴木 陽也 秋山 和輝 梶原 智之 二宮 崇 武村 紀子 中島 悠太 長原 一
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.4D3GS604, 2022 (Released:2022-07-11)

感情分析とは,テキストから人間の感情強度を予測する自然言語処理タスクである.従来の感情分析モデルは,テキストの書き手の感情(主観感情)の推定性能が十分でないことが知られている.そこで本研究では,感情分析モデルの入力として書き手の性格情報を加え,主観感情の推定に特化させる.本研究で使用する書き手の性格情報は,テキストの書き手に対する性格診断の結果である.プルチックの基本8感情の強度推定に関する評価実験の結果,提案手法による主観感情の推定の性能改善を確認した.
著者
井川 朋樹 梶原 智之 二宮 崇
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2B5GS603, 2022 (Released:2022-07-11)

テキスト平易化とは,文の意味を保持しながら,難解な文を平易な文に変換する自然言語処理タスクである.テキスト平易化により,言語障害を持つ人,子ども,言語学習者などが恩恵を受けることができる.これらの読み手の能力には差があり,その能力に応じた難易度調整が必要であるため,難易度制御可能なテキスト平易化手法が提案されている.しかし,従来手法は単語レベルの難易度に基づいており,文レベルの難易度が考慮されていないという問題点がある.そこで本研究では,文の難易度推定モデルを用いた深層強化学習によるテキスト平易化を提案する.実験の結果,提案手法において,テキスト平易化の評価指標SARIが向上することを確認した.
著者
梶原 智之
出版者
大阪大学
雑誌
研究活動スタート支援
巻号頁・発行日
2018-08-24

2020年の東京五輪に向けて、機械翻訳の精度向上が急務である。従来の機械翻訳は、翻訳文と正解文の単語単位の一致率を最大化する訓練を行ってきたが、この正解文は数ある正しい翻訳の表現の一例に過ぎない。本研究では、マルチモーダル品質推定によって正解文の表現に依存しない訓練を行い、機械翻訳を高度化する。本研究の背景には、対訳などの大規模なテキストとテキストの対応データが一部の言語でしか利用できない一方で、SNSの普及により画像とテキストの対応データが多くの言語で大規模に利用できるという利点がある。
著者
梶原 智之 西原 大貴 小平 知範 小町 守
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.27, no.4, pp.801-824, 2020-12-15 (Released:2021-03-15)
参考文献数
50
被引用文献数
1

本研究では,日本語の語彙平易化のために,評価用データセット・辞書・実装や評価を支援するツールキットの 3 種類の言語資源を整備する.我々は既存の小規模な単語難易度辞書をもとに単語難易度の推定器を訓練し,大規模な日本語の単語難易度辞書および難解な単語から平易な単語への言い換え辞書を自動構築する.本研究で構築する評価用データセットを用いた評価実験によって,この辞書に基づく語彙平易化システムが高い性能を達成することを示す.我々のツールキットは,辞書の他,語彙平易化パイプラインにおける主要な手法を実装しており,これらの手法を組み合わせたシステムの構築および構築したシステムの自動評価の機能を提供する.
著者
高山 隼矢 梶原 智之 荒瀬 由紀
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2021-NL-249, no.11, pp.1-8, 2021-07-20

人間は対話においてしばしば相手の質問や発話に対して間接的な応答をする.例えば,予約サービスにおいてユーザがオペレータに対して「あまり予算がないのですが」と応答した場合,オペレータはその応答には間接的に「もっと安い店を提示してください」という意図が含まれていると解釈することができる.大規模な対話コーパスを学習したニューラル対話モデルは流暢な応答を生成する能力を持つが,間接的な応答に焦点を当てたコーパスは存在せず,モデルが人間と同様に間接的な応答を扱うことができるかどうかは明らかではない.本研究では既存の対話コーパスである MultiWoZ を拡張し,間接的な応答と直接的な応答の対からなる 7 万件規模の対話コーパスを構築した.ユーザーからの入力発話を事前により直接的な発話に言い換えることで対話応答生成の性能が向上することを確認した.
著者
吉村 綾馬 金子 正弘 梶原 智之 小町 守
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.2, pp.404-427, 2021 (Released:2021-06-15)
参考文献数
35

信頼できる文法誤り訂正の自動評価手法の構築は,文法誤り訂正の研究および開発の発展に有用である.可能な参照文を網羅することが難しいため,先行研究では参照文を用いない自動評価手法が提案されてきた.そのうちの一つは,文法性・流暢性・意味保存性を評価する 3 つの評価モデルを用いることで,参照文を用いる手法よりも人手評価との高い相関を達成した.しかし,各項目の評価モデルは人手評価には最適化されておらず,改善の余地が残されていた.本研究では,より適切な評価を行える自動評価手法の構築を目的として,各項目の評価モデルを事前学習された文符号化器を用いて人手評価に対して最適化する手法を提案する.また,最適化に理想的である,訂正システムの出力文に対して人手評価が付与されたデータセットの作成を行う.実験の結果,項目ごとの評価モデルおよびそれらを組み合わせた手法の両方で,従来手法と比べて人手評価との相関が向上し,事前学習された文符号化器を用いることおよび訂正文の人手評価に最適化することの両方が貢献していることがわかった.分析の結果,提案手法は従来手法に比べて多くのエラータイプの訂正を正しく評価できていることがわかった.
著者
嶋中 宏希 梶原 智之 小町 守
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.26, no.3, pp.613-634, 2019-09-15 (Released:2019-12-15)
参考文献数
34
被引用文献数
2

本稿では,参照文を用いた文単位での機械翻訳自動評価手法について述べる.現在のデファクトスタンダードである BLEU をはじめとして,多くの従来手法は文字や単語の N-gram に基づく素性に頼っており,文単位での評価にとっては限定的な情報しか扱えていない.そこで本研究では,文全体の大域的な情報を考慮するために,事前学習された文の分散表現を用いる機械翻訳自動評価手法を提案する.提案手法では,大規模コーパスによって事前学習された文の符号化器を用いて,翻訳文と参照文の分散表現を得る.そして,翻訳文と参照文の分散表現を入力とする回帰モデルによって,人手でラベル付けされた翻訳品質を推定する.WMT-2017 Metrics Shared Task における翻訳品質のラベル付きデータセットを用いた実験の結果,我々の提案手法は文単位の全ての to-English 言語対において最高性能を達成した.