著者
金 淵培 江原 暉将 相沢 輝昭
雑誌
全国大会講演論文集
巻号頁・発行日
vol.44, pp.179-180, 1992-02-24

我々は日本語テレビニュース文を英語に機械翻訳する研究を行っている。日本語ニュース文は約80%が60文字(約30単語)以上で書かれている。このニュース文は、ほとんど引用、並列構造を持っている。このような長文を構文分析する場合、その成功率を高めるには、長文をいくつかの単文に分割することが有効である。人手による分割実験によると分割される前の状態での構文分析の成功率は約60%で、文分割後の構文分析の成功率は82%に増加する。ここでは、形態素解析情報、特に、格助詞「が」、係助詞「は」と用言の活用情報によって接続構造と分割点を把握できることに注目して、適切な分割点の検出と主語の補完を含む分割の生成を行う方法を提案し、その有効性を述べる。
著者
金 淵培 柴田 正啓 江原 暉将 榎並 和雅
出版者
一般社団法人映像情報メディア学会
雑誌
テレビジョン学会誌 (ISSN:03866831)
巻号頁・発行日
vol.50, no.10, pp.1585-1592, 1996-10-20
参考文献数
13
被引用文献数
5

本論文では, 素材映像の内容を普通の日本語文で記述したスクリプトを用いて, 必要な素材映像を検索し, それらを時間軸上のどこへ配置するかを粗く決める編集=粗編集を行う映像シーケンサについて述べる.制作者は, 所望の素材映像の内容を日本語文で記述し, 個々の記述文を時間順に並べたリスト形式のスクリプトにより, 番組の構成を映像シーケンサに入力する.映像シーケンサは, 日本語を使ってインデキシングされた素材映像のデータベースを検索し, 適合する部分映像(カット)を切り出し, 順に再生することにより, 番組の概略を提示することができる.このスクリプトは, 普通の日本語で素材映像を指し示すため, スクリプトの可読性は極めて高くなる.この結果, 映像シーケンサを用いて, スクリプト上での番組の構成の概念的な検討と, 実際の映像を見ての具体的な検討を同時に効率的に行うことができる.
著者
江原 暉将 金 淵培
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.3, no.4, pp.67-86, 1996

主語のない日本語文に対し, 確率モデルを用いて自動的にゼロ主語を補完する手法について述べる. これは, 日英機械翻訳の前処理としての自動短文分割の後で適用されるものである. 確率モデルを用いる方法として, 従来 (1) 多次元正規分布に基づくモデルを利用するものがあった. 本稿では, 新たに3種類のゼロ主語補完のためのモデルを提案する. それらは, 連続分布に対して, (2) 正規分布に基づくGram-Charlier展開を多次元に拡張した分布 (疑似正規分布) に基づくモデル, 離散分布に対しては, (3) 1次対数線形分布, (4) 2次対数線形分布に基づくモデルである. これら4種の確率モデルについて, 補完精度を比較する実験を行った. その結果, (1)~(4) の精度は, 順に, 7 3%, 7 8%, 7 8%, 8 1%であり, 2次対数線形分布を用いる方法が最も精度が高かった. また, 補完を誤った事例について考察を加えた結果, 主語と述語の意味的整合性をより正確に計算する必要があることなどがわかった.
著者
金 淵培 江原暉将
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.35, no.6, pp.1018-1028, 1994-06-15
被引用文献数
16

日英機械翻訳の精度を低下させる要因の一つとして、文が長すぎるということがある。文が長くなると係り受け構造が複雑となり、構文解析ができず、翻訳に矢敗することが多くなる。この問題を解決するため、われわれは日本語の長文を複数の短文に自動的に分割する研究を行った。われわれの手法は、形態素、品詞、文節カテゴリのようなさまざまな情報をフレキシブルに組み合わせて分割点の認定が行えるという特徴をもつ。さらに、分割を行うと、分割後の文に主語がなくなることがあり、この現象も機械翻訳の精度を悪くする。そこで、主語のなくなった文に対して、自動的に主語を補完する研究を行った。主語補割こは、学習データを用いて、主語になる名詞の特徴ベクトルの確率分布を推定した後、各主語候補に対して主語になれる確率値を算出して主語補完を行う統計的方法を用いている。約400文のニュース文を対象に分割と主語補完の実験を行った。分割点の認定には、分割点が記述されているパターン約100個を用いてパターン・マッチングを行い、約88%の分割点認定率を得た。 また、主語補完の補完率は76%であった。本論文では、短文分割の有効性と方法括よび主語楠完について述ぺる。