著者
亀井 真一郎 平井 徳行 斎藤 由香梨 伊藤 悦雄 赤羽 美樹子 檜山 努 村木 一至
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.7-8, 1997-03-12

翻訳に使用される辞書データの流通・相互利用を促進するため、アジア太平洋機械翻訳協会(AAMT)に加盟する機械翻訳(MT)メーカが中心となり、各社のMTシステムのユーザ辞書と相互変換可能なユーザ辞書共通フォーマット (Universal PlatForm; UPF) の設計を開始した。本稿では活動の目的と方針概要を述べる。商用のMTシステムが製品化されて10年余が経過した。当初、MTシステムは翻訳の専門家向けに設計・開発され、主に技術翻訳に用いられてきたが、近年のインターネットの発達とパソコンの普及により、MTシステムは一般ユーザにも急速に浸透し始めている。MTシステムを有効活用するためには、各ユーザ毎に、頻繁に使用する語彙を「ユーザ辞書」として蓄積し、システムの基本辞書と合わせて使う必要がある。しかし辞書作成は一般に時間と労力がかかる仕事であり、個人ユーザー人一人が辞書を個々に充実させるのには限界がある。この問題の具体的解決方法として、個人が個別に蓄えている辞書データを流通させ、相互利用するための環境の整備が挙げられる。現在は国内の20数社が機械翻訳システムを商品化しているが、それらの機種の違いを越えて、共通にユーザ辞書を交換できる仕組みがあれば、各人がユーザ辞書を作成するコストが大幅に削滅できる。このことによりMTの利用が促進され、ひいては日本人の外国語文書受発信が促進される。このような環境整備の具体的活動として、AAMTでは、今年度 (平成8年度) から来年度にかけ情報処理振興事業協会 (IPA) の創造的ソフトウエア育成事業の予算補助を受け、各社のMTシステムに共通のユーザ辞書記述フォーマットUPFの開発と、ホームページによる仕様公開の活動を開始した。仕様は検討段階においても適宜一般に公開する方針である。
著者
赤峯 享 奥村 明俊 村木 一至
雑誌
全国大会講演論文集
巻号頁・発行日
vol.44, pp.261-262, 1992-02-24

日本人が英文を作成する場合、どの単語を使えば適切か、綴はどうだったか、活用形は正しいか等、その過程で発生する疑問点を和英辞典を引くなどして、日本語の知識を利用しながら解決していく。従って、日本語を入力して適切な英語を簡単に得ることができれば、英文を作成する場合の大きな支援となる。筆者らは、これまで、日本人が英文を作成する場合の疑問点や、英文を作成する場合に計算機で支援できる機能を考えてきた。しかしながら、これらの機能をユーザに提供するためのインタフェースが適切でなければ、実際に効率的に英文を作成することはできない。本論文では、英文を作成する場合に、文章作成の流れを妨げることなしに、日本語入力によって英文の作成を支援するためのユーザ・インタフェースについて提案を行う。
著者
安藤 真一 土井 伸一 村木 一至
雑誌
全国大会講演論文集
巻号頁・発行日
vol.47, pp.83-84, 1993-09-27
被引用文献数
2

近年、大量の電子化テキストが利用できるようになり、これらから有用な情報を得るための支援技術として要約や情報抽出が研究されている。要約技術には頻出するキーワード、文末表現、接続表現などを利用する手法がある。通常要約すべき主題はユーザの視点によって異なり、ユーザがこれを選べることが必要である。しかし、現在の要約技術では固定した視点からの情報しか提示することができない。一方、情報抽出技術は取り出すべき情報を予め詳細に定義し、これを正確に取り出す技術である。ここでは文章内容に対する視点を明確に定めているため、限られた空間内で情報を扱うことができる。このため情報抽出技術は一般的な意味解析やモデル化を必要とする要約技術に比べて実現性が高い。さらに、抽出すべき情報の種類を複数用意することにより、複数の明確な視点を提供できる要約技術として考えることができる。以上の観点から、我々は要約の基礎技術として、ある1つの視点からの情報を新聞記事から抽出する情報抽出システムVENIEXを試作した。本システムは抽出すべき分野に依存した語彙(以後、キーワードと呼ぶ)の知識を構文構造に応じて組み合わせることによって情報を抽出している。