著者
山肩 洋子 今堀 慎治 森 信介
出版者
東京大学
雑誌
基盤研究(B)
巻号頁・発行日
2014-04-01

本研究の目的は,Webにある膨大な数のレシピの集合が本質的にどの程度の多様性を持っているのか,足りないのか十分なのか,何が足りないのかを明らかにすることである.そこで本研究では,(i)自然言語処理技術によりレシピ記述から手順構造を抽出し,(ii)手順と記述の観点からレシピ間の関係を解析するとともに,(iii)全体の知識を使って補完可能な欠損を補完することで,レシピ集合が持つ本質的な多様性を解析する機構を構築する.今年度は以下の2点を行った.(1) 国際化に向けた英語対応:Webレシピの急増は日本だけでなく世界で起こっている現象である.米国最大手のAllrecipesの月間ページビューは推定2,000万件で,クックパッドの実に3倍以上である.さらに料理レシピが世界の情報処理の研究対象として国際的に認知されつつある.そこで,平成28年度,英文係り受け解析器RASPの開発で著名なJohn Carroll氏の協力を得て,英文レシピのフローグラフコーパスを開発した.今年度はこれを我々が開発した手法で実装することで,固有表現認識精度が84.8%,固有表現が正しく認識されているときの依存関係推定精度74.1%を達成した.また,和文と英文のレシピの構造的な相違を統計分析により明らかにした.(2) レシピテキストの記述粒度の自動変換:肉じゃがやハンバーグのような代表的な和食は数千からときに数万のレシピが見つかる.同じ料理名をもつレシピのうち,その主たる調理方法が似通っているとき,それらは似た調理手順を説明した異なる記述であると考える.ここで,片方のレシピがもち,もう片方のレシピが持っていない説明は,その手順の詳細説明であると考えられることから,この関係を用いて詳細記述を生成した.また,双方が持つノードはその手法の主幹であることから,それらを取り出したフローを簡略な表現と位置付けた.
著者
美濃 導彦 椋木 雅之 森 信介 山肩 洋子 舩冨 卓哉 中村 和晃 橋本 敦史 飯山 将晃 中村 和晃 舩冨 卓哉
出版者
京都大学
雑誌
基盤研究(A)
巻号頁・発行日
2012-04-01

一般の動物とヒトを隔てる「知能」として,本研 究では道具の使用,および論理や推論による問題解決能力を利用して行う「知的行動」の認識を目指し,題材として「キッチンでの調理」を取り上げ,道具,食材,調理動作の認識,および言語的に記述された行動の理解に取り組んだ.観測データから認識できる「表出動作」のうち,特に物体の把持・解放を中心として,レシピ中に言語的に記述された「概念的行動」の完了認識や次の行動の予測をする手法を構築した.また,テキストから扱われる食材の種類やそれに対する行動,目標状態などを概念的行動」として自動で獲得し,レシピ内でのそれらの依存関係をワークフローとして抽出する技術を構築した.
著者
森 信介 山地 治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.38, no.11, pp.2191-2199, 1997-11-15
被引用文献数
19

本論文では,形態素単位のn?gramモデル(1〓n〓16)による日本語の情報量の上限の推定方法とその結果を示す.各n?gramモデルは,データスパースネスの問題に対応するため,低次のn?gramモデルとの補間を行ってある.補間係数は,最も有効であると考えられている削除補間法により求める.実験ではEDRコーパスの約9割からモデルのパラメータを推定し,残りの1割に対して情報量を計算した.その結果,n=16のときに1文字あたりの情報量は最小の4.30330ビットであった.また,学習コーパスの大きさとモデルの次数による情報量の変化を調べた結果,モデルの次数を上げることによる情報量の減少量は微小であるが,学習コーパスを大きくすることによる情報量の減少量はかなりあるということが分かった.さらに,パラメータ数とエントロピーの関係についても議論する.これは,実際の日本語処理にn?gramモデルを応用する際に,適切にnの値を選ぶ指標となる.In this paper we present an estimate of an upper bound for the entropy of Japanese by morpheme n-gram model(1〓n〓16).Each n-gram model is interpolated with lower order n-gram models.The deleted interpolation method is applied for estimating interpolation coefficients.We estimated the parameters from 90% of the EDR corpus and calculated the entropy on the rest 10%.As the result,the minimum entropy was 4.30330[bit]a character with n=16.The relation between the size of learning corpus or the order of model and entropy showed that incresing the order decreases entropy slightly and increasing the size of learning corpus decreases it noteworthily.In addition,we discuss the relation between the number of parameters and entropy.This is usefull to select the value of n to apply n-gram model to the practical Japanese processing.
著者
森 信介 鶴岡 慶雅
出版者
京都大学
雑誌
挑戦的萌芽研究
巻号頁・発行日
2014-04-01

与えられた盤面およびそこから先読みを行った結果得られる盤面に対して解説を生成方法を提案し自動解説を実現した。この過程で得られる用語と局面の自動対応(シンボルグラウンディング)モジュールを用いて言語のキーワードによる局面検索が実現できることを示し、情報検索のトップ会議(ACM SIGIR 2017)に採択された。また、本研究テーマを通して作成した将棋の固有表現コーパスを LREC 2016 にて発表し、これを用いて、局面を参照する固有表現認識器を提案し、言語処理のトップ会議である ACL 2016 にて発表を行った。
著者
森 信介 山地 治
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.38, no.11, pp.2191-2199, 1997-11-15

本論文では,形態素単位のn?gramモデル(1〓n〓16)による日本語の情報量の上限の推定方法とその結果を示す.各n?gramモデルは,データスパースネスの問題に対応するため,低次のn?gramモデルとの補間を行ってある.補間係数は,最も有効であると考えられている削除補間法により求める.実験ではEDRコーパスの約9割からモデルのパラメータを推定し,残りの1割に対して情報量を計算した.その結果,n=16のときに1文字あたりの情報量は最小の4.30330ビットであった.また,学習コーパスの大きさとモデルの次数による情報量の変化を調べた結果,モデルの次数を上げることによる情報量の減少量は微小であるが,学習コーパスを大きくすることによる情報量の減少量はかなりあるということが分かった.さらに,パラメータ数とエントロピーの関係についても議論する.これは,実際の日本語処理にn?gramモデルを応用する際に,適切にnの値を選ぶ指標となる.
著者
亀甲 博貴 松吉 俊 John Richardson 牛久 敦 笹田 鉄郎 村脇 有吾 鶴岡 慶雅 森 信介
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.3, pp.847-873, 2021 (Released:2021-09-15)
参考文献数
40

近年,シンボルグラウンディングや言語生成,自然言語による非言語データの検索など,実世界に紐づいた自然言語処理への注目が高まっている.我々は,将棋のゲーム局面に付随する解説文がこれらの課題の興味深いテストベッドになると考えている.解説者は現在の局面だけでなく過去や未来の指し手に言及しており,これらはゲーム木にグラウンディングされることから,ゲーム木探索アルゴリズムを活用した実世界対応の研究が期待できる.本論文では,我々が構築した,人手による単語分割・固有表現・モダリティ表現・事象の事実性のアノテーションを行った将棋解説文コーパスを説明する.
著者
笹田 鉄郎 森 信介 山肩 洋子 前田 浩邦 河原 達也
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.22, no.2, pp.107-131, 2015-06-16 (Released:2015-09-16)
参考文献数
32
被引用文献数
2 5

自然言語処理において,単語認識(形態素解析や品詞推定など)の次に実用化可能な課題は,ある課題において重要な用語の認識であろう.この際の重要な用語は,一般に単語列であり,多くの応用においてそれらに種別がある.一般的な例は,新聞記事における情報抽出を主たる目的とした固有表現であり,人名や組織名,金額などの 7 つか 8 つの種別(固有表現クラス)が定義されている.この重要な用語の定義は,自然言語処理の課題に大きく依存する.我々はこの課題をレシピ(調理手順の文章)に対する用語抽出として,レシピ中に出現する重要な用語を定義し,実際にコーパスに対してアノテーションし,実用的な精度の自動認識器を構築する過程について述べる.その応用として,単純なキーワード照合を超える知的な検索や,映像と言語表現のマッチングによるシンボルグラウンディングを想定している.このような背景の下,本論文では,レシピ用語タグセットの定義と,実際に行ったアノテーションについて議論する.また,レシピ用語の自動認識の結果を提示し,必要となるアノテーション量の見通しを示す.
著者
田中 健斗 西村 太一 白井 圭佑 亀甲 博貴 森 信介
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第35回全国大会(2021)
巻号頁・発行日
pp.4J2GS6e03, 2021 (Released:2021-06-14)

語学学習において,「話す」,「書く」といった言語の産出能力の訓練は学習した知識を定着させる上で重視されている.しかし,記述式問題の人手による採点には多大なコストを要するため,機械による自動採点技術が注目を集めている.本研究では,写真描画問題を対象として,自動採点技術の実現を試みる.具体的には,(i)まず学習者の誤り傾向を調査・分析し,(ii)次にそれを基に疑似誤りデータを生成し, (iii)最後に写真と解答文の関連性を評価する正誤判定モデルを考案する.実験は疑似誤りデータを用いて学習し,実際の学習者の解答を用いて評価した.実験結果から,ランダムに出力を行う判別器と比較して,提案モデルは高い識別性能を実現することがわかった.
著者
平山 直樹 森 信介 奥乃 博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.112, no.369, pp.7-12, 2012-12-13

本稿では,日本語方言音声認識のための言語モデルの統計的構築法を開発する.方言言語モデル構築においては,その方言の言語コーパスの不足が大きな課題である.その解決のため,大規模共通語言語コーパスの単語単位での方言への変換を行う.共通語・方言間の対訳コーパスを用いて統計的に変換ルールを学習し,重み付き有限状態トランスデューサ(WFST)で変換器を実装する.このWFSTに共通語文章を入力することで,対応する方言文章が自動的に出力される.本手法で構築した方言言語モデルを用いて方言音声認識を行うことで,共通語言語コーパスで学習した言語モデルより高い認識精度が得られた.
著者
前田 浩邦 山肩 洋子 森 信介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.113, no.214, pp.37-42, 2013-09-12

料理は複数の材料に対しそれぞれ加工を加えたり,混ぜ合わせたりしながら,一つの料理を作り出していく流れ作業である.よってこれまでも,レシピの表現形式のひとつとして,作業フローグラフが用いられてきた.従来も,レシピテキストを半自動でフローグラフに変換する研究が行われていたが,これらの研究で対象としていたレシピは,プロの料理人や編集者により製作されたものであり,すでに規格がある程度統一されているため,ルールを適応することが比較的容易であったと考えられる.一方,Web上で最も多いのはCOOKPADや楽天レシピに掲載されているようなユーザ投稿型のレシピであるが,これらのレシピは表現の自由度が高く,従来型のルールにあてはめることが困難である.そこで本研究では,投稿型のレシピテキストをフローグラフに変換する際のデータフォーマットを提案する.さらに,特徴的であった事例を複数紹介する.
著者
森 信介 長尾 眞
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.7, pp.2093-2100, 1998-07-15

自然言語処理において,辞書は単語の文法的機能や意味の情報源として必要不可欠であり,辞書に登録されていない単語を減少させるため,辞書の語彙を増強する努力がなされている.新語や専門用語は絶えず増え続けているため,辞書作成の作業は多大な労力を要するのみならず,各解析段階での未知語との遭遇は避けらず,大きな問題の1つとなっている.この問題を解決するため,本論文では,nグラム統計を用いて,コーパスからの単語の抽出とその単語が属する品詞の推定を同時に行う方法を提案する.この方法は,同一品詞に属する単語の前後に位置する文字列の分布は類似するという仮定に基づく.実験の結果,本手法が未知語の品詞推定や辞書構築に有効であることが確認された.
著者
吉野 幸一郎 森 信介 河原 達也
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.52, no.12, pp.3386-3397, 2011-12-15

日々更新されるWebニュースなどのテキストに対して,述語項構造に着目した情報抽出を行い,それに基づいて情報検索・推薦を行う音声対話システムについて述べる.まず,ドメインごとに有用な述語項構造パターンの抽出を行う指標を検討し,Naive Bayes法に基づく抽出が有効であることを示した.また,抽出された述語項構造に完全に一致するものがない場合でも情報推薦ができるように,前述の指標に基づいて述語項の優先度を決定し,さらに,要素・用言に関して関連度を定義することによって述語項どうしの類似度を計算する.評価実験において,音声情報検索における典型的な従来手法であるBag-Of-Words(BOW)モデルと比較して,本手法がより的確に応答生成を行えることが示された.上記に加えて,ユーザからの情報要求・発話がなくなった場合に,対話履歴中の述語項との類似度を利用してプロアクティブに情報提示を行う手法を提案する.本研究で提案する対話システムの枠組みは,述語項構造という普遍的な情報構造と,コーパスから獲得される類似度を利用しているので,高いドメイン移植性を有している.
著者
森 信介 飯山 将晃 橋本 敦史 舩冨 卓哉
出版者
京都大学
雑誌
基盤研究(B)
巻号頁・発行日
2014-04-01

前年度までに構築したレシピフローグラフコーパスと収録した調理映像を用いて調理映像からのレシピ生成の手法を提案し、実験結果とともに国際学会にて発表した。手法は十分一般的であり、調理映像とレシピに限定されない。これにより、本研究課題「作業実施映像からの手順書の生成」が国際学会採択論文とともに完了したといえる。課題終了後も、写真付きの手順書などのような、マルチメディア教材の自動生成などの発展的研究に取り組んでいる。
著者
勝丸徳浩 秋田 祐哉 森 信介 河原 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.68, pp.25-30, 2008-07-11
被引用文献数
5

我々は,大学の講義におけるノートテイク支援を目標とした音声認識システムの研究開発を行っている.本研究では,専門性の高い講義に対して,言語モデルを効率的に適応する方法を検討する.大学の講義では,同一の講師が同一科目を一定期間担当することが通例であるので,以前の講義のデータを活用することを考える.ノートテイクが音声認識結果を評価・選別する応用場面を想定して,認識結果を教師ありで言語モデル適応に用いる方法と,音声認識結果の信頼度に基づいて教師なしで適応する方法を検討する.さらに,講義スライドを用いて, PLSA や Web テキスト収集に基づいて適応する手法との統合も行い,効果を確認した.We are developing an automatic speech recognition (ASR) system to assist note-taking in the classroom. In this work, we focus on an efficient method to adapt the language model (LM) for ASR to university lectures, in which a number of technical terms are used. We assume that one lecturer teaches a specific course subject through a certain period (a semester), and exploit the data of the lectures previously given by the same lecturer. Specifically, we propose an LM adaptation scheme supervised by the note-takers, who verify the ASR results and filter the well-recognized hypotheses. We also investigate an unsupervised adaptation method based on the confidence score of ASR. The methods are combined with other LM adaptation methods based on PLSA and Web text collection using the lecture slides.
著者
森 信介 山地 治 長尾 眞
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.120, pp.87-94, 1997-12-11
被引用文献数
8

本論文では、文字 n?gramモデルや形態素 n?gramモデルの予測単位を文字列や形態素列に拡張した連文字 n?gramモデルや連語 n?gramモデルを定義し、予測力という観点でモデルを改善する方法を提案する。モデルの探索における目的関数は、形態素クラスタリングで有効性が示されている平均クロスエントロピーである。これは、削除補間のように、評価用のコーパスとモデルの推定用のコーパスとを別に用意するというアイデアに基づいている。日本語コーパスを用いた実験の結果、クロスエントロピーを計算すると、連文字 n?gramモデルは4.3791であり文字 n?gramモデルの5.4105より低く、連語 n?gramモデルは4.4555であり形態素 n?gramモデルの4.6053より低く、モデルの改善が観測された。In this paper, we define a string-based n-gram model and a phrase-based n-gram mode as expansions of character n-gram model and word-based n-gram model, and we propose a method to improve an n-gram model in terms of prediction. The objective function in model search is the average cross entropy, which is proven to be effective for word clustering. This criterion is, like deleted interpolation, based on the idea of separation of the corpus for evaluation and the corpus for model estimation. As an experimental result on a Japanese corpus, we obtained the entorpeis as follows: the string-based n-gram model had 4.3791, which is less than the character n-gram model's 5.4105, and the phrase-based n-gram mode had 4.4555, which is less than the word-based n-gram model's 4.6053.
著者
長野 徹森信介西村雅史 森 信介 西村 雅史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.69, pp.81-86, 2005-07-16
被引用文献数
1

本論文では、規則音声合成における読みとアクセントを、確率モデルに基づき同時に推定する手法を提案し、その実験結果を報告する。規則音声合成において、任意の入力テキストに対し、正しい音韻情報と韻律情報を生成することは、自然な合成音声を得るために重要な要件である。本研究では、入力テキストに対し、最も基本的な音韻情報と韻律情報である読みとアクセントを付与する問題を取り扱う。日本語の場合、入力テキストは一般的に漢字仮名交じり文であり、複数の読み候補から正しい読みを推定する必要があるとともに、その読みに対して正しいアクセントを推定する必要がある。従来、日本語テキストに対して、形態素解析・読み付与・アクセント句決定・アクセント核決定、という手順を段階的に行うことで、読みとアクセントを決定することが多かったが、本研究では、表記(単語境界)・品詞・読み・アクセントを1つの単位とみなし、n-gram モデルを用いて同時に推定する。実験では、ルールに基づきアクセント句およびアクセント核を決定する逐次的な手法との比較を行った。その結果、確率モデルに基づく手法の精度がルールに基づく手法の精度を上回ることを確認した。We present a new stochastic approach to estimate accurately phonemes and accents for Japanese TTS (Text-to-Speech) systems. Front-end process of TTS system assigns phonemes and accents to an input plain text, which is critical for creating intelligible and natural speech. Rule-based approaches that build hierarchical structures are widely used for this purpose. However, considering scalability and the ease of domain adaptation, rule-based approaches have well-known limitations. In this paper, we present a stochastic method based on an n-gram model for phonemes and accents estimation. The proposed method estimates not only phonemes and accents but word segmentation and part-of-speech (POS) simultaneously. We implemented a system for Japanese which solves tokenization, linguistic annotation, text-to-phonemes conversion, homograph disambiguation, and accents generation at the same time, and observed promising results.
著者
森 信介
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1997, no.29, pp.27-32, 1997-03-21

本論文では,日本語にンける単語bi?gramモデルと品詞bi?gramモデルの補間を提案する.テストコーパスの解析に必要な未知語モデルも,文字bi?gramと文字種bi?gramの補間により得られるモデルで実現する.このモデルの有効性を確かめるため,形態素解析済みのコーパスを用いて単語bi?gramモデルと品詞bi?gramモデルとこれらを補間したモデルのテストセットバープレキシティを計算した.その結果,単語bi?gramモデルでは151.00であり,品詞bi?gramモデルでは383.61であり,これらを補間したモデルでは,143.49であった.単語bi?gramモデルと品詞bi?gramを補間したモデルは,単語bi?gramと同程度の記憶領域で実現できるので,このモデルは単語bi?gramモデルよりも良いモデルであると結論できる.In this paper, we present an interpolated model between a word bi-gram mode and a part-of-speech bi-gram model. We also present, as an unknown word model, an interpolated model between character bi-gram mode and character type bi-gram model. In order to attest an effectiveness experimentally, we calculated perplexities of the word bi-gram model and the part-of-speech bi-gram model and the interpolated model between them. The results of the word bi-gram was 151.00, the part-of-speech bi-gram model, 383.61 and the interpolated model, 143.49. Since the interpolated model needs as large memory space as the word bi-gram model, it follows that the interpolated model is better than the word bi-gram model.
著者
森 信介 伊東 伸泰
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.101, no.189, pp.47-54, 2001-07-09

確率的言語モデルを基礎とする自然言語処理において、タグが付与された学習コーパスは重要であり、これを増量することが精度向上につながることがわかっている。しかしながら有意な精度向上のためには、学習コーパスを指数関数的以上に増加させる必要があり、このために必要なコーパスにタグを付与するコストは無視できない程度になっている。このような背景のもと、本論文ではタグなしコーパスの利用による形態素解析と仮名漢字変換の精度向上について述べる。実験では、タグなしコーパスの利用により、確率的言語モデルの予測力やそれに基づく仮名漢字変換の精度は有意に向上し、タグなしコーパスは0.87倍の量のタグつきコーパスに匹敵したが、形態素解析の精度向上は微小であった。