著者
長谷川 隆明 高木 伸一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.10, pp.3694-3705, 1999-10-15
被引用文献数
7 10

インターネットの普及にともない,電子メールはコミュニケーションの主要な手段となった.一方,Personal Information Manager (PIM)ソフトウェアの普及にともない,個人情報を計算機で管理するユーザが増えている.ユーザの個人情報として,アポイントメントの日時や場所等のスケジュールや,期限をともなう電子メールの返信等のToDoがあげられる.しかしながら,電子メールにより伝達されるスケジュールやToDoに関する情報の管理は,これらの情報を含む文書の整理やPIMソフトウェアとの連携の際に,電子メールを受信するユーザの人手を必要としていた.本稿では,ユーザが受信した電子メール文書からユーザに伝達されるスケジュールとToDoの情報を抽出する手法を提案する.電子メール文書は,任意の目的への使用と自由な形式による情報伝達のため,文書構造や言語表現が一様ではない.本手法の特徴は,スケジュールやToDoを含む電子メール文書の構造と言語の特徴に着目したレイアウト情報とパターンマッチングを用いた,文書構造の認識と情報抽出および情報の関連付けである.電子メールの実文書を対象とした抽出実験により,電子メールのフィルタリングやPIMソフトウェアへの入力等の実用に耐えうる高い精度で,スケジュールとToDoを抽出できることを示す.As the Internet has become popular,e-mail is now an important means of communication.On the other hand,as the Personal Information Managers (PIM) applications have come into wide use recently,many users manage their schedules,such as event date and event location,and to-do items,such as answers to e-mail messages from someone by the appointed time,with their computers.However,a problem is that e-mail receivers cannot easily sort out messages with these information from many incoming messages and build up a close connection with the receivers'PIMs.Therefore,our goal is extracting these information from the e-mail messages users receive.E-mail is open to any purpose and any format.So these information is not formalized,and message structure and language expression are not uniform.We reveal the characteristics of the structure and language used in e-mail messages and propose a way to identify the structure and extract information by using layout information and pattern matching and relate matched partial information with components of these information.Extraction evaluations demonstrate high recall and precision.Our proposal can be put to practical use,such as filtering messages and inputting the information to PIMs.
著者
長谷川 隆明 西川 仁 今村 賢治 菊井 玄一郎 奥村 学
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.25, no.1, pp.133-143, 2010 (Released:2010-01-06)
参考文献数
16
被引用文献数
2

Recently, web pages for mobile devices are widely spread on the Internet and a lot of people can access web pages through search engines by mobile devices as well as personal computers. A summary of a retrieved web page is important because the people judge whether or not the page would be relevant to their information need according to the summary. In particular, the summary must be not only compact but also grammatical and meaningful when the users retrieve information using a mobile phone with a small screen. Most search engines seem to produce a snippet based on the keyword-in-context (KWIC) method. However, this simple method could not generate a refined summary suitable for mobile phones because of low grammaticality and content overlap with the page title. We propose a more suitable method to generate a snippet for mobile devices using sentence extraction and sentence compression methods. First, sentences are biased based on whether they include the query terms from the users or words that are relevant to the queries, as well as whether they do not overlap with the page title based on maximal marginal relevance (MMR). Second, the selected sentences are compressed based on their phrase coverage, which is measured by the scores of words, and their phrase connection probability measured based on the language model, according to the dependency structure converted from the sentence. The experimental results reveal the proposed method outperformed the KWIC method in terms of relevance judgment, grammaticality, non-redundancy and content coverage.
著者
長谷川 隆明 高木 伸一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1998, no.1, pp.73-80, 1998-01-19
被引用文献数
15

一度に多数の人に情報を伝達できる電子メールは、送信する側にとって都合が良い。しかし受信する側では、人手を介さずに情報を抽出して再利用することができないという問題がある。本稿では、電子メールを介したコミュニケーションにおいて用いられる言語の特徴を分析し、それに基いて構成したパターンを用いたパターンマッチングによって、電子メールからイベントの開催日時や開催場所、期限付きの返信依頼等のスケジュール情報を抽出する方法を提案する。任意の電子メールを対象として、スケジュール情報の抽出を行った実験の結果、十分に実用に耐え得る程度の高い精度が得られたことを報告する。E-mail is convenient because senders can communicate information to many people at one time. A problem is that receivers cannot extract and process the information within the e-mail automatically. We analyze the characteristics of the language used in e-mails and propose a way to extract schedule information, such as event date, event location, and RSVP date, from the text of e-mails by using pattern matching. Experiments using actual e-mails confirm the accuracy of our proposal; schedule information can be extracted from any e-mail with practical levels of performance.
著者
柳本 清 田中 千景 長谷川 隆明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TM, テレコミュニケーションマネジメント (ISSN:09135685)
巻号頁・発行日
vol.107, no.135, pp.67-72, 2007-07-05

Webアプリケーションシステムにおいて強固なセキュリティを確保するためには,ネットワーク通信及びデータベースに対する盗聴などに対して暗号化対策を実施することが不可欠である.本稿では,クライアントとWebアプリケーションサーバ間の通信及びデータベースに保存する情報に対して,クライアントで暗号化が必要な個人情報等に該当する項目に絞り込んで暗号処理を行うことにより,セキュリティレベルを維持しながら暗号処理パフォーマンスを向上させる方法を提案する.既存の暗号化方式と比較して暗号処理パフォーマンスが向上することを証明しその提案方式の有効性を示す.
著者
長谷川 隆明 林 良彦 山崎 毅文
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.7, pp.1745-1754, 2004-07-15
被引用文献数
1

インターネットに接続可能な携帯電話の普及により、携帯電話に電子メールを転送するユーザが増えている。外出先からでも携帯電話に電子メールの着信が通知されるので、日々大量に電子メールを受信するユーザにとって、携帯電話を通して即時に電子メールを読むことは有効である。しかしながら、画面の大きさや送信可能文字数の制約により、転送される電子メールの本文すべてを読むことは難しい。本論文では、この問題を解決するために、電子メールの特徴を利用した重要文抽出手法と携帯電話向け要約システムへの適用を提案する。本手法の特徴は、電子メールに特有な表現とスタイルの特徴を利用したルールにより重要文を抽出することである。本手法により、人手により作成された重要文の正解との比較において、特に複数の評価者間で正解に対するコンセンサスの得られる電子メールに対して、高い精度で正解と一致する重要文を抽出できた。また、携帯電話向け要約システムへの適用を考慮した評価においても、電子メールの取捨選択に十分利用できる高い精度が得られた。With the spread of mobile phones that can access the Internet, most people are forwarding their incoming email to their mobile phones. Mobile phones enable heavy users of emails to access them anywhere. The restricted capacities (display size and message limits) of mobile phones, however, prohibit whole messages from being read as is. We propose a new rulebased method of sentence extraction which takes the features of emails into consideration and describe its application to an email summarizer for mobile phones. Our method uses the expression and style specific to emails. The sentences extracted by the proposed method are virtually the same as those selected manually by majority voting. A task-oriented evaluation of the proposed method reveals its high precision and recall in screening for emails through mobile phones given a practical message size limit.