著者
赤間 怜奈 渡邉 研斗 横井 祥 小林 颯介 乾 健太郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.1N203, 2018 (Released:2018-07-30)

本研究は,教師なし学習によりスタイル(言葉遣いや文体など)の類似性を捉えるを試みる初めての研究である. 本研究では「スタイル」の類似性を捉えるベクトル空間を構築するに当たり,「同一発話内に含まれる単語は同一のスタイルを持つ」という仮定を置く. この仮定に基づき,同一発話内の単語を予測できるようなベクトルを構成することで,スタイルの類似性を捉えた単語ベクトル空間を獲得する手法を提案する.我々が期待する単語ベクトル空間とは,(「意味」は近くとも)「スタイル」が大きく異なる``俺''と``私''は遠くに配置され,(「意味」は異なっているとしても)「スタイル」が似ている``俺''と``だぜ''が近くに配置されるような空間である. さらに本研究では,スタイルの類似性を包括的に定量評価する手法を提案し,そのための評価データセットを新たに作成する. 提案手法により獲得した単語ベクトルが,スタイルの類似性を捉えていることを定量的および定性的に示す.
著者
赤間 怜奈 渡邉 研斗 横井 祥 小林 颯介 乾 健太郎
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

本研究は,教師なし学習によりスタイル(言葉遣いや文体など)の類似性を捉えるを試みる初めての研究である.本研究では「スタイル」の類似性を捉えるベクトル空間を構築するに当たり,「同一発話内に含まれる単語は同一のスタイルを持つ」という仮定を置く.この仮定に基づき,同一発話内の単語を予測できるようなベクトルを構成することで,スタイルの類似性を捉えた単語ベクトル空間を獲得する手法を提案する.我々が期待する単語ベクトル空間とは,(「意味」は近くとも)「スタイル」が大きく異なる``俺''と``私''は遠くに配置され,(「意味」は異なっているとしても)「スタイル」が似ている``俺''と``だぜ''が近くに配置されるような空間である.さらに本研究では,スタイルの類似性を包括的に定量評価する手法を提案し,そのための評価データセットを新たに作成する.提案手法により獲得した単語ベクトルが,スタイルの類似性を捉えていることを定量的および定性的に示す.
著者
石井 雄隆 菊地 正弥 舟山 弘晃 松林 優一郎 乾 健太郎
出版者
一般社団法人 日本教育工学会
雑誌
日本教育工学会研究報告集 (ISSN:24363286)
巻号頁・発行日
vol.2022, no.4, pp.1-7, 2022-11-28 (Released:2022-11-28)

AIの判断結果の理由の説明や,品質を評価できる説明可能なAIについて近年盛んに議論されている.本研究では,説明可能なAIを指向した和文英訳自動採点システムの開発と評価を行った.このシステムでは,複数の評価観点を採点項目として反映したモデルにより自動採点を行い,学習者に診断的なフィードバックを行うことが可能となる.日本人大学生を対象とした刺激再生法を用いた実験の結果,システムを用いた修正の傾向やシステムの利点と改善点が明らかとなった.
著者
渡邉 研斗 松林 優一郎 深山 覚 中野 倫靖 後藤 真孝 乾 健太郎
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2017-SLP-116, no.16, pp.1-12, 2017-05-08

本研究では楽曲のメロディを考慮した歌詞の自動生成手法を提案する.人間の作詞現場においては,予め作曲されたメロディに対して歌いやすい歌詞を創作する 「曲先」 と呼ばれる方法が広く行われている.しかしながら,自動歌詞生成の既存手法の多くは,韻やシラブルに基づく生成手法を提案しているものの,メロディと歌詞の関係を考慮しておらず,メロディの区切りと単語の区切りが一致しないような不自然な歌詞を生成してしまう問題がある.本研究では,メロディの音符と歌詞の読みが対応づいたデータを用いて,メロディの音の長さ ・ 休符の位置 ・ 繰り返し構造などの特徴と歌詞の相関を詳しく分析し,その結果をもとにした自動歌詞生成モデルを構築する.結果として作成されたモデルにより,休符や長い音符付近で行や段落 (連) が区切れている自然な歌詞が自動生成された.
著者
水野 淳太 渡邉 陽太郎 エリックニコルズ 村上 浩司 乾 健太郎 松本 裕治
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.52, no.12, pp.3408-3422, 2011-12-15

情報検索技術の発展により,あるトピックに関連する多様な情報を容易に入手できるようになった.しかしながら,これらの文書に記述されている情報には,不正確な記述,偏りのある意見などが多数混在している.そのため,個々の情報や意見の信憑性を判断するためには,多様な情報源からの意見との整合性を調べる必要がある.しかし,限られた時間で数多くの情報源を調べることは難しいため,ユーザが持っている先入観が正常な判断を妨げてしまう場合がある.我々は,そのような状態を避けるために,言論マップ生成課題に取り組んでいる.これは,検索された文について,まず,トピックに対する賛成意見であるのか,それとも反対意見であるのかを分類し,次に,賛成および反対する根拠を含むかどうかを認識し,それらを俯瞰的に示すというものである.本課題において最も重要な問題は,1組の文対が与えられたときに,その間の意味的関係を分類する文間関係認識である.これは近年さかんに研究されている含意関係認識と重なる部分が多い.しかしながら,ウェブ上の実文に対して既存の含意関係認識を適用しても,その分類性能は限定的であるという報告がある.そこで,我々は,評価用データセットとその分析に基づく文間関係認識モデルを構築した.本論文では,検索された文において,クエリの内容に対応する部分を正しく同定することが,最も重要な技術的課題であること,また,いくつかの制約を変化させることで,関係分類の精度と再現率を制御できることを示す.
著者
飯田 龍 小町 守 乾 健太郎 松本 裕治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.7, pp.71-78, 2007-01-26
被引用文献数
12

本稿では,日本語書き言葉を対象とした述語項構造と共参照のタグ付与について議論する.述語項構造や共参照解析は形態素・構文解析などの基盤技術と自然言語処理の応用分野とを繋ぐ重要な技術であり,これらの問題の主要な解析手法はタグ付与コーパスに基づく学習ベースの手法である.この手法で利用するための大規模な訓練データが必要となるが,これまでに日本語を対象にした大規模なタグ付きコーパスは存在しなかった.また,既存のコーパス作成に関する研究で採用されているタグ付与の基準は,言語の違いや我々が対象としたい解析と異なるために,そのまま採用することができない.そこで,既存のいくつかのタグ付与の仕様を比較し,我々のタグ付与作業で採用する基準について吟味する.また,実際に京都コーパス第3.0版の文章を対象にタグ付与の仕様について検討した結果とタグ付与の際に問題となった点や今後検討すべき点について報告する.In this paper, we discuss how to annotate predicate-argument and coreference relations in Japanese written text. Predicate argument analysis and coreference resolution are particularly important as they often provide a crucial bridge between basic NLP techniques such as morpho-syntactic analysis and end-level applications, and they have been mainly developed with corpus-based empirical approaches. In order to train a classification model in such approaches, a large scale corpus annotated with predicate-argument and coreference information is needed. To our best knowledge, however, there is no corpus including plenty of such tags in Japanese. In addition, we have difficulty adopting the traditional specifications for annotating tags due to the problem setting of each task and the difference between Japanese and English. So, we develop a new criteria for our annotating processes by examining the previous work on annotating tasks. This paper explains our annotating specification cultivated through actual annotating processes for the texts in Kyoto Text Corpus version 3.0, and discusses the future directions.
著者
船木 洋晃 佐々木 彬 岡崎 直観 乾 健太郎 深田 陽介 竹下 隆一郎 田森 秀明 野澤 博
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集
巻号頁・発行日
vol.2014, pp.1K32, 2014

<p>本研究では2013年の参議院議員選挙より解禁されたインターネット選挙を受け、 ツイッター上での選挙運動を分析し、実際の選挙結果との相関を考察する。さら に,特定の候補者に対する当選・落選を期待する言語表現から当選運動・落選運 動を予測する分類器を生成し、各候補者に関する運動の盛り上がりを分析する。</p>
著者
山本 風人 井之上 直也 渡邊 陽太郎 岡崎 直観 乾 健太郎
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2012-SLP-91, no.9, pp.1-8, 2012-05-03

本稿では、重み付き仮説推論のパラメタを教師あり学習によって自動調整する手法を提案する。仮説推論は、与えられた観測に対して評価関数を最大化する最良の説明を求める推論であり、自然言語処理において文章に明示されていない情報の顕在化を行うことに対して有用な枠組みとして注目を浴びている。しかしその一方で、仮説推論の評価関数の学習手法が未だ提案されておらず、評価関数のパラメタの調整は、人手による調整やヒューリスティックな手法に頼らざるを得ないという問題があった。そこで我々は、仮説推論の拡張のひとつである重み付き仮説推論を対象として、仮説の証明木におけるリテラル間のコストの関係をフィードフォワードニューラルネットワークの形で表現することで、誤差に対する各パラメタの勾配を求め、評価関数のパラメタの識別学習を実現する。また、提案手法によって評価関数を学習できていることを確かめるために、既存のデータセットを用いて実験した結果についても報告する。
著者
三田 雅人 水本 智也 金子 正弘 永田 亮 乾 健太郎
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.1, pp.160-182, 2021 (Released:2021-03-15)
参考文献数
42
被引用文献数
1

文法誤り訂正の既存研究の多くはこれまで主に CoNLL-2014 評価データセットを用いた単一コーパス上で文法誤り訂正モデルを評価してきた.しかし,書き手の習熟度やエッセイのトピックなど様々なバリエーションのある入力文が想定される文法誤り訂正タスクにおいて,タスクの難易度は各条件下によって異なるため,単一コーパスによる評価では不十分であると考えられる.そこで本研究では,文法誤り訂正の評価の方法論として,単一コーパス評価は不十分であるという仮説に基づきコーパス横断評価の必要性について調査を行う.具体的には,4 種類の手法 (LSTM, CNN, Transformer, SMT) を 6 種類のコーパス (CoNLL-2014, CoNLL-2013, FCE, JFLEG, KJ, BEA-2019) で評価し,各コーパス間でモデル順位にばらつきが生じるかについて検証を行った.評価実験の結果,モデル順位は各コーパスによって大きく変動したため,既存の単一コーパス評価では不十分であることがわかった.また,横断評価はメタ評価方法としてだけではなく,実応用を見据えた場合においても有用であると考えられる.そこで,横断評価の有用性のケーススタディとして,文法誤り訂正の入力に想定される代表的な条件の一つである,書き手の習熟度を評価セグメントとした場合の横断評価について調査を行った.その結果,書き手の習熟度が初中級レベルと上級レベル間ではモデルの性能評価に関して大きな乖離があることがわかった.
著者
乾 健太郎 藤田 篤
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.11, no.5, pp.151-198, 2004-10-10 (Released:2011-03-01)
参考文献数
183
被引用文献数
4 7

意味が近似的に等価な言語表現の異形を言い換えと言う. 言い換え技術とは, 所与の言語表現からその言い換えを生成する言い換え生成技術, および所与の言語表現対が言い換え関係にあるか否かを判定する言い換え認識技術の総称である. これらの技術は, 機械翻訳の前編集や読解支援のための文章簡単化, 質問応答や複数文書要約など, 様々な応用に貢献する応用横断的なミドルウェア技術になると期待されており, 近年研究者の関心を集めてきた.本論文では, こうした言い換え技術について, 工学的研究を中心に近年の動向を紹介する. 具体的には, 言い換えの定義や言い換え技術の応用可能性について論じた後, 構造変換による言い換え生成, 質問応答・複数文書要約のための言い換え認識に関する研究を概観し, 最後に言い換え知識の自動獲得に関する最新の研究動向を紹介する.
著者
栗原 理聡 佐々木 彬 松田 耕史 岡崎 直観 乾 健太郎
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第29回全国大会(2015)
巻号頁・発行日
pp.1H33, 2015 (Released:2018-07-30)

地域のまちづくりには住民の声を反映したものが求められるが,意見交換会などの参加者の多くは高齢者であり,特に若い年齢層からの声を聞く機会は限られている.そこで本研究では若者の利用率が高く,匿名性により本音が多く書き込まれていると思われるTwitterを用いて,自治体による解決が可能と思われる地域毎の特徴的な要望を抽出する手法を提案する.
著者
松本 佳也 杉岡 優子 多田 昌弘 岡野 匡志 真本 建司 乾 健太郎 羽生 大記 小池 達也
出版者
一般社団法人 日本静脈経腸栄養学会
雑誌
日本静脈経腸栄養学会雑誌 (ISSN:21890161)
巻号頁・発行日
vol.30, no.3, pp.793-797, 2015 (Released:2015-06-20)
参考文献数
15

【目的】関節リウマチ(以下、RA)患者における、サルコペニア該当者の生活習慣の特徴を抽出する。【対象及び方法】外来通院中の RA患者208名を対象とした。骨格筋量は二重エネルギー X線吸収測定法(DXA法)により測定した。四肢の骨格筋量の合計を身長で除した骨格筋指数が男性6.87 kg/m2、女性5.46 kg/m2以下である者をサルコペニアと判定した。栄養素・食事摂取量は簡易型食事歴質問票(BDHQ)を用いて調査した。【結果】RA患者においてサルコペニア該当群は非該当群と比較し疾患活動性が高く、運動制限を指導されている者が多く、日常生活動作 (ADL)が低かった。栄養面では、カルシウム摂取量が少なく、乳製品の摂取量が有意に少なかった。【結論】RA患者におけるサルコペニア該当者では、運動制限、ADLの低下、乳製品摂取量が少ないことが特徴であった。