- 著者
-
相薗 敏子
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
- 巻号頁・発行日
- vol.2006, no.82, pp.1-6, 2006-07-27
- 参考文献数
- 8
人名文字列とそれに対応する実体としての「人」には同姓同名による暖昧性がある。本研究ではまず,テキストに出現する人名の暖昧性ついて営業日報データ7 600件を対象に調査を行った。その結果,営業日報データには延べ5 778件の人名が出現しており,そのうち55%に同姓同名による暖昧性が存在し,文字列だけで「人」を同定すると最大52人の「人」を同一人物としてしまう可能性があることが分かった。これに対して,本研究では人名と同じ文に出現する組織名を利用した暖昧性解消アルゴリズムを提案する。先の営業日報データを用いた実験では,暖昧性のある人名に対して89%の精度で正しく「人」に同定できるという結果を得た。In this paper, I discribe the identification issue of parson name which appeared in text. I explore 5,778person names which are extractde from 7,600 sales reports, 55% of them are ambiguous due to multiple candidates in identifiable person list. Also this result shows 52 people with people with the same surname at the maximum may be treated as one person. In order to resolve this problem, I propose an algorithm using organization name which co-occur with person name in the same sentence. In an experiment using the sales reports, 89% of the ambiguous person names are identified correctly.