著者
長谷川 隆明 林 良彦 山崎 毅文
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.7, pp.1745-1754, 2004-07-15
被引用文献数
1

インターネットに接続可能な携帯電話の普及により、携帯電話に電子メールを転送するユーザが増えている。外出先からでも携帯電話に電子メールの着信が通知されるので、日々大量に電子メールを受信するユーザにとって、携帯電話を通して即時に電子メールを読むことは有効である。しかしながら、画面の大きさや送信可能文字数の制約により、転送される電子メールの本文すべてを読むことは難しい。本論文では、この問題を解決するために、電子メールの特徴を利用した重要文抽出手法と携帯電話向け要約システムへの適用を提案する。本手法の特徴は、電子メールに特有な表現とスタイルの特徴を利用したルールにより重要文を抽出することである。本手法により、人手により作成された重要文の正解との比較において、特に複数の評価者間で正解に対するコンセンサスの得られる電子メールに対して、高い精度で正解と一致する重要文を抽出できた。また、携帯電話向け要約システムへの適用を考慮した評価においても、電子メールの取捨選択に十分利用できる高い精度が得られた。With the spread of mobile phones that can access the Internet, most people are forwarding their incoming email to their mobile phones. Mobile phones enable heavy users of emails to access them anywhere. The restricted capacities (display size and message limits) of mobile phones, however, prohibit whole messages from being read as is. We propose a new rulebased method of sentence extraction which takes the features of emails into consideration and describe its application to an email summarizer for mobile phones. Our method uses the expression and style specific to emails. The sentences extracted by the proposed method are virtually the same as those selected manually by majority voting. A task-oriented evaluation of the proposed method reveals its high precision and recall in screening for emails through mobile phones given a practical message size limit.
著者
山崎 毅文 パッザーニマイク
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1995, no.87, pp.49-56, 1995-09-14
被引用文献数
4

概念シソーラスの構築は、機械翻訳、テキスト検索等自然言語処理システムにおいて重要なタスクである。本稿では、与えられた事例集合から、機械翻訳システム向け翻訳ルールの学習と概念シソーラスの構築とを同時に行なう手法を提案する。概念シソーラスの構築では、既存のシソーラスを利用しない場合/更新する場合の2つの手法を提案する。利用しない場合は、まず、帰納学習アルゴリズムの適用により翻訳ルールの学習を行なう。次に学習されたルールからカテゴリー間類似度行列を作成し、クラスタリング手法の適用により、シソーラスを構築する。シソーラスを更新する場合は、既存シソーラスを一旦カテゴリー間類似度行列に変換することにより、シソーラスを利用しない場合と同様の手法が適用できる。実験結果により、本手法で構築されたシソーラスが、機械翻訳タスクにおいて有用であることが確認された。This paper addresses the problem of constructing a semantic hierarchy for Japanese-English translation systems. The creation of a comprehensive hierarchy is one important step in this system because it is used to bias the learning of rules that indicate the English translation of Japanese verbs. We propose two methods of constructing a hierarchy: acquiring a hierarchy from scratch and updating a hierarchy. When acquiring a hierarchy from scratch, translation rules are learned by an inductive learning algorithm in the first step. A new hierarchy is then generated by applying a clustering method to internal disjunctions of the learned rules and new rules are learned under the bias of this hierarchy. When updating an existing manually-constructed hierarchy, we take advantage of its node structure. We report experimental results showing that the semantic hierarchies generated by our method yield learned translation rules with higher average accuracy.