著者
今村 賢治 越前谷 博 江原 暉将 後藤 功雄 須藤 克仁 園尾 聡 綱川 隆司 中澤 敏明 二宮 崇 王 向莉
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.29, no.3, pp.925-985, 2022 (Released:2022-09-15)
参考文献数
203

本解説論文では,特許を対象とした機械翻訳における種々の課題に対する関連技術の解説を行う.特許に対する機械翻訳は実用的にも学術的にも長い歴史を持つが,ニューラル機械翻訳の登場で新たな段階に進んできたと言える.そうした動向を踏まえ,訳抜け・過剰訳への対策,用語訳の統一,長文対策,低リソース言語対対策,評価,翻訳の高速化・省メモリ化,の6項目に分けて近年の関連技術を紹介し,今後の方向性を論じる.
著者
金 淵培 江原 暉将 相沢 輝昭
雑誌
全国大会講演論文集
巻号頁・発行日
vol.44, pp.179-180, 1992-02-24

我々は日本語テレビニュース文を英語に機械翻訳する研究を行っている。日本語ニュース文は約80%が60文字(約30単語)以上で書かれている。このニュース文は、ほとんど引用、並列構造を持っている。このような長文を構文分析する場合、その成功率を高めるには、長文をいくつかの単文に分割することが有効である。人手による分割実験によると分割される前の状態での構文分析の成功率は約60%で、文分割後の構文分析の成功率は82%に増加する。ここでは、形態素解析情報、特に、格助詞「が」、係助詞「は」と用言の活用情報によって接続構造と分割点を把握できることに注目して、適切な分割点の検出と主語の補完を含む分割の生成を行う方法を提案し、その有効性を述べる。
著者
相沢 輝昭 江原 暉将 浦谷 則好 田中 英輝 加藤 直人 中瀬 純夫 有賀 憲和 松田 健生
雑誌
全国大会講演論文集
巻号頁・発行日
vol.40, pp.419-420, 1990-03-14

NHKでは、現在、2チャンネルの24時間衛星放送を実施している。第1チャンネルの中心になっているのは、英、仏、独、伊、露、韓、中の各国語による「ワールドニュース」で、通常は、元のニュースに日本語テロップ(字幕)を重畳して放送している。具体的には、数十人のバイリンガルが、ニュースの聴取、翻訳、要約、原稿の作成までの全てを、限られた時間内で処理している。しかし、これが衛星放送運用上の大きなネックになっており、その省力化のためMT(機械翻訳)システムが導入された。第1段階として、英語ニュースに対するテロップ作成の実用化を目指す。このため、現在ほぼ毎日5分間、MTシステム作成のテロップを用いた放送が行われている。
著者
江原 暉将 安藤 彰男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会誌 (ISSN:09135693)
巻号頁・発行日
vol.84, no.5, pp.316-319, 2001-05-01
参考文献数
4

聴覚障害者向け字幕放送の拡充を目指した研究開発の状況を紹介する.通信・放送機構では,オフラインでの字幕制作を対象に,字幕原稿の自動要約技術,音声と字幕との自動同期技術,字幕表示を適切に行う自動字幕画面制作技術,これらを統合化するシステム技術について研究している.NHKでは,ニュース番組に対する字幕放送を実現するため,音声認識技術を利用した字幕制作システムを開発し,平成12年3月27日から,このシステムを利用して,「ニュース7」の字幕放送を開始した.本稿では,これらの研究内容について解説する.
著者
金 淵培 柴田 正啓 江原 暉将 榎並 和雅
出版者
一般社団法人映像情報メディア学会
雑誌
テレビジョン学会誌 (ISSN:03866831)
巻号頁・発行日
vol.50, no.10, pp.1585-1592, 1996-10-20
参考文献数
13
被引用文献数
5

本論文では, 素材映像の内容を普通の日本語文で記述したスクリプトを用いて, 必要な素材映像を検索し, それらを時間軸上のどこへ配置するかを粗く決める編集=粗編集を行う映像シーケンサについて述べる.制作者は, 所望の素材映像の内容を日本語文で記述し, 個々の記述文を時間順に並べたリスト形式のスクリプトにより, 番組の構成を映像シーケンサに入力する.映像シーケンサは, 日本語を使ってインデキシングされた素材映像のデータベースを検索し, 適合する部分映像(カット)を切り出し, 順に再生することにより, 番組の概略を提示することができる.このスクリプトは, 普通の日本語で素材映像を指し示すため, スクリプトの可読性は極めて高くなる.この結果, 映像シーケンサを用いて, スクリプト上での番組の構成の概念的な検討と, 実際の映像を見ての具体的な検討を同時に効率的に行うことができる.
著者
江原 暉将 金 淵培
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.3, no.4, pp.67-86, 1996

主語のない日本語文に対し, 確率モデルを用いて自動的にゼロ主語を補完する手法について述べる. これは, 日英機械翻訳の前処理としての自動短文分割の後で適用されるものである. 確率モデルを用いる方法として, 従来 (1) 多次元正規分布に基づくモデルを利用するものがあった. 本稿では, 新たに3種類のゼロ主語補完のためのモデルを提案する. それらは, 連続分布に対して, (2) 正規分布に基づくGram-Charlier展開を多次元に拡張した分布 (疑似正規分布) に基づくモデル, 離散分布に対しては, (3) 1次対数線形分布, (4) 2次対数線形分布に基づくモデルである. これら4種の確率モデルについて, 補完精度を比較する実験を行った. その結果, (1)~(4) の精度は, 順に, 7 3%, 7 8%, 7 8%, 8 1%であり, 2次対数線形分布を用いる方法が最も精度が高かった. また, 補完を誤った事例について考察を加えた結果, 主語と述語の意味的整合性をより正確に計算する必要があることなどがわかった.
著者
後藤 功雄 加藤 直人 田中 英輝 江原暉将 浦谷則好
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.3, pp.968-979, 2006-03-15
参考文献数
22

カタカナで表記された外国人名の英訳語を,関連語をキーワードとする言語横断情報検索と,発音類似性を利用した訳語推定により,World Wide Web(WWW)文書から獲得する手法を提案する.ニュース記事に出現する人名は新出語であることが多く,対訳辞書に登録されていない場合も多い.提案手法は,カタカナの外国人名が文書中に存在した場合,はじめにその周辺の単語を対訳辞書によって英訳し,これらをキーワードとして英語のWWW 文書検索を行う.次に,検索されたWWW 文書中から人名候補となる英単語列を翻字により変換し,発音が類似した英単語列を訳語とする.ニュース記事に出現した外国人名を対象として本手法による実験を行い,有効性を確認した.This paper proposes a method of acquiring English equivalents of foreign personal names written in katakana characters from the World Wide Web (WWW). In news articles, new foreign personal names appear frequently and are rarely registered in bilingual dictionaries. Our method can automatically obtain the English equivalents of personal names by using two phases: cross-language information retrieval using related words and acquisition of translation based on phonetic similarity. In the first phase, given a katakana foreign personal name appearing in a news article, the method extracts words related to the foreign personal name, translates these words into English using bilingual dictionaries, and retrieves WWW documents in English using the translated words as keywords. In the second phase, our method extracts candidates of English equivalents from the retrievedWWWdocuments, transliterates the candidates to phonetic expressions, compares them with the phonetic expression of the personal name written in katakana, and obtains the most similar one as the English equivalent. We confirmed the effectiveness of our method with a series of experiments using foreign personal names appearing in news articles.
著者
沢村 栄治 棚橋 大介 江原 暉将 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎
巻号頁・発行日
vol.98, no.284, pp.23-30, 1998-09-19
被引用文献数
1

通信・放送機構のプロジェクトとして、「字幕制作システム」の研究を進めている。この研究の中で、字幕放送利用者が求める最適な字幕表示方法を追求するために、種々の字幕提示方法による実験用字幕番組を制作するとともに、聴覚障害者も含む評価者の協力を得て、制作した実験用字幕番組の予備評価を行った。パソコンを利用した多様な表示方法による実験字幕番組制作システムと、制作した実験字幕番組例、字幕パラメータ・評価者群別などの主観評価実験結果などについて述べる。
著者
丸山 一郎 阿部 芳春 江原 暉将 白井 克彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.2, pp.184-192, 2002-02-01
被引用文献数
9

本論文では,事前収録されたテレビ番組に対して番組VTRと事前電子化原稿から聴覚障害者向けの字幕を自動的に付与する技術の中で,音声と字幕の同期タイミングを検出する字幕提示タイミング検出手法について述べている.背景音が重畳している放送音声に対しては,音素HMMワードスポッターだけに基づいたタイミング検出手法では十分な検出精度が得られない.番組の原稿中の各文に対してワードスポッティングにより複数のタイミング候補を検出し,音響的なゆう度に加え三つのスコア(原稿の時間順序,原稿から推定される発声時間との比,音声らしさ)を用いた動的計画法を行い,番組全体として最適なタイミングを選択する手法を提案した.ドキュメンタリー番組10回分を対象とした評価実験において,許容検出誤差を1秒とした場合に検出率99.0%,3秒とした場合に99.7%の検出精度が得られ,実用的な方式であることが示された.
著者
江原暉将 沢村 英治 福島 孝博 丸山 一郎 和田 裕二 門馬 隆雄 白井 克彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.69, pp.121-126, 2001-07-16
被引用文献数
2

通信・放送機構で平成8年度から12年度まで実施した「視聴覚障害者向け放送ソフト制作技術の研究開発プロジェクト」の研究成果と残された課題について報告する。本プロジェクトの目的は、聴覚障害者のための字幕付きテレビ放送番組を効率的に制作するための技術基盤を確立することである。具体的な研究項目として、自動要約、自動同期、統合化システム技術がある。自動要約については、ニュース記事を対象に文字数にして70%にすることを目標にして研究を進め、「重要文抽出法」と「形態素単位文字数圧縮法」を併用して目標を達成した。自動同期については、ニュースおよびナレーション主体のドキュメンタリー番組を対象に研究し、ナレーションと背景音の比が20dB 以上の番組に対しては自動同期が可能であることを示した。統合化システム技術では、適切な点で字幕の改行・改ページを加える自動字幕画面制作技術を研究し、自動要約、自動同期とあわせて自動字幕制作システム実証モデルを構築した。本実証モデルを用いて評価実験を行い、性能評価を行うと共に実用化のための課題を明らかにした。Telecommunication Advancement Organization of Japan proceeds "Research Project for TV Production for the Seeing and Hearing Impaired" from 1995 to 2001. The purpose of the project is to establish the technologies of producing closed captions for hearing impaired people on TV programs efficiently. We have three research issues in the project: automatic text summarization, automatic synchronization with speech and captions and system engineering. Automatic text summarization summarizes Japanese news text to 70% volume. Important sentence extraction, morphem-based text shortening and bunsetsu-based text shortening are used. Automatic synchronization uses HMM-based word spotter and DP-based synchronizing point search. The method can be applicable to news and narration programs in which signal strength ratio between speech and background sound is more than 20dB. System engineering research results automatic changing method of new page and new line at a point easy to read. We integrate these elementary technologies to the automatic captioning system and evaluate it by caption creators and end users. From this evaluation experiments, we can know the system performance and future research issues.
著者
大田 健紘 江原 暉将
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.338, pp.261-266, 2008-12-02

本研究では,条件付き確率場を用いて音声認識結果の重要語に対するタグ付および,発話の分類を行い,その結果から,音声認識誤りなどに起因するユーザ発話の曖昧さを解消するための対話戦略について検討を行っている.音声対話システムにおいて,音声認識誤りによりシステムが発話を受理できない場合,毎回確認対話を生成していては利用者にとって非常にわずらわしい.そこで,想定発話を用意しておき,それらを同じような内容を表す発話群に分類し,音声認識結果の各発話群への分類結果をもとに,発話の曖昧な箇所の同定を行っている.その結果から,発話の一部分のみの再認識により音声認識誤りの修正を行う,もしくは確認対話の生成を行い利用者に音声認識誤りの修正行わせるかを決定している.システムが得ることのできる情報をもとに,利用者の発話の推定を行い,自動的に修正をすることによって,利用者側の負担を軽減することが可能になっている.評価の結果,音声認識誤りに対して頑健に発話内容の分類を行うことが可能であり,その結果から音声認識誤り箇所およびタグ付けの誤り箇所を同定し修正することも可能であることを確認している.
著者
金 淵培 江原暉将
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.35, no.6, pp.1018-1028, 1994-06-15
被引用文献数
16

日英機械翻訳の精度を低下させる要因の一つとして、文が長すぎるということがある。文が長くなると係り受け構造が複雑となり、構文解析ができず、翻訳に矢敗することが多くなる。この問題を解決するため、われわれは日本語の長文を複数の短文に自動的に分割する研究を行った。われわれの手法は、形態素、品詞、文節カテゴリのようなさまざまな情報をフレキシブルに組み合わせて分割点の認定が行えるという特徴をもつ。さらに、分割を行うと、分割後の文に主語がなくなることがあり、この現象も機械翻訳の精度を悪くする。そこで、主語のなくなった文に対して、自動的に主語を補完する研究を行った。主語補割こは、学習データを用いて、主語になる名詞の特徴ベクトルの確率分布を推定した後、各主語候補に対して主語になれる確率値を算出して主語補完を行う統計的方法を用いている。約400文のニュース文を対象に分割と主語補完の実験を行った。分割点の認定には、分割点が記述されているパターン約100個を用いてパターン・マッチングを行い、約88%の分割点認定率を得た。 また、主語補完の補完率は76%であった。本論文では、短文分割の有効性と方法括よび主語楠完について述ぺる。