著者
打浪 文子 岩田 一成 熊野 正 後藤 功雄 田中 英輝 大塚 裕子
出版者
社会言語科学会
雑誌
社会言語科学 (ISSN:13443909)
巻号頁・発行日
vol.20, no.1, pp.29-41, 2017-09-30 (Released:2018-02-07)
参考文献数
30
被引用文献数
1

本研究では,知的障害者に対する「わかりやすい」情報提供を実践する媒体である「ステージ」と,外国人向けの「やさしい日本語」で時事情報の配信を行うNHKの「NEWSWEB EASY」(以下NWE),およびNWE記事の書き換え元であるNHKの一般向けニュース原稿の3つのメディアのテキストを,文長や記事長,難易度や使用語彙の観点から計量的および質的に分析し,その共通点および相違点を明らかにした.分析の結果から,ステージとNWEの共通点として形態素数や和語の率が近いことや,「外来語」や「人の属性を表す語」などの名詞や動詞を中心とした難解語彙の群があることが示された.また相違点として,ステージには副詞や接辞等に「やさしい日本語」の基準に照らせば書きかえ可能なものがあること,さらにステージのみの特徴として同じ動詞をさまざまな形で重ねて使っていることが示された.条件を統制した上で上記3つのメディアの共通・相違性に関する比較研究を深めること,知的障害者向けの情報提供のさらなる分析と知見の収集を行うこと,従来の研究領域を超える「言語的な困難を有する人」すべてを対象とした「わかりやすい」日本語による情報保障の具体的な方法を提示することの3点が本研究の今後の課題である.
著者
田中 英輝 熊野 正 後藤 功雄 美野 秀弥
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.1, pp.81-117, 2018-02-15 (Released:2018-05-15)
参考文献数
40
被引用文献数
1

NHK はインターネットサイト NEWS WEB EASY で外国人を対象としたやさしい日本語のニュースを提供している.やさしい日本語のニュースは日本語教師と記者の 2 名が通常のニュースを共同でやさしく書き換えて制作し,本文にはふりがな,難しい語への辞書といった読解補助情報が付与されている.本稿では NEWS WEB EASY のやさしい日本語の書き換え原則,および制作の体制とプロセスの概要と課題を説明した後,課題に対処するために開発した 2 つのエディタを説明する.1 つは書き換えを支援する「書き換えエディタ」である.書き換えエディタは先行のシステムと同様に難しい語を指摘し,書き換え候補を提示する機能を持つが,2 名以上の共同作業を支援する点,難しい語の指摘機能に学習機能を持つ点,また,候補の提示に書き換え事例を蓄積して利用する点に特徴がある.他の 1 つは「読解補助情報エディタ」である.読解補助情報エディタは,ふりがなや辞書情報を自動推定する機能,さらに推定誤りの修正結果を学習する機能を持つ.以上のように 2 つのエディタは,自動学習と用例の利用により,読解補助情報の推定の誤り,やさしい日本語の書き方の方針変更などに日々の運用の中で自律的に対応できるようになっている.本稿では 2 つのエディタの詳細説明の後,日本語教師および記者を対象に実施したアンケート調査,およびログ解析によりエディタの有効性を示す.
著者
木下 明徳 後藤 功雄 熊野 正 加藤 直人 田中 英輝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.113, pp.81-86, 2007-11-20
参考文献数
8

NHK の国際放送では 18 ケ国語が使われており,それらの放送用原稿は,日本語の原稿やその英訳原稿が翻訳され作成されている.このような翻訳作業を支援するために,我々は過去の翻訳用例を検索する「多言語用例提示システム」の開発を行っている.精度の良い検索を実現するためには,検索キーワードとなりうる単語,すなわち,内容語の認定が重要である.しかしながら,内容語 (あるいは機能語) を認定するには辞書が必要となるが,様々な言語に対して辞書を用意することは困難である.そこで,本稿では,言語が持つ統計的特徴を利用し辞書を使わない手法について述べる.また,8つの言語 (日本語,英語,フランス語,スペイン語,ロシア語,イタリア語,インドネシア語,マレー語) に対して行った,機能語認定の実験結果について報告する.NHK provides news services in 18 languages, translating Japanese news articles into English and those ones into other languages. To aid such translation work, we have been developing a translation example browser that retrieves examples similar to inputs from multi-lingual news corpora. The browser has to identify function words(or content words) in inputs by using machine-readable dictionaries to retrieve appropriate examples. However those dictionaries are difficult to be prepared for the browser in various languages. This paper proposes automatic identification methods of function words using statistic features common to many languages. We conduct a series of experiments in 8 languages, such as Japanese, English, French, Spanish, Russian, Italian, Indonesian language and Murray language.
著者
丸山 岳彦 柏岡 秀紀 熊野 正 田中 英輝
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.11, no.3, pp.39-68, 2004-07-10 (Released:2011-03-01)
参考文献数
35
被引用文献数
6 11

従来の文分割研究において, 文の分割点として利用されてきたのは, 「節」の境界である. しかしながら, 実際に文の分割点として用いられる節境界はごく一部の種類のものに限られており, 文に含まれる節境界を網羅的に検出する手法は考えられてこなかった. 我々は, 日本語の文に含まれる節境界の位置を網羅的に検出し, その種類を特定するプログラム“CBAP (Clause Boundaries Annotation Program)”を開発した. CBAPは, 形態素解析の結果を入力とし, 局所的な形態素の連接を対象としたパタンマッチによって, 147種類の節境界を検出する. CBAPを性質の異なる5種のコーパスに適用したところ, いずれのコーパスでも97%以上の検出性能が確認された. この検出結果を利用することにより, 言語学的に意味のある文の分割点を特定することができ, 従来の手法よりも柔軟に文分割を行なうことができる. また, 1~3形態素という非常に局所的な範囲のみから節境界を検出できるため, 発話に追従して処理を進めていく漸進的構文解析や同時通訳システム, また, 句点を含まない音声コーパスを対象とした発話分割処理などに有用である. 本稿では, CBAPによる節境界の検出手法を示し, 節境界を用いて文分割・発話分割処理を行なった事例をもとに, 節境界検出の有用性を述べる.