著者
野呂 太一 乾 孝司 高村 大也 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.10, pp.3405-3414, 2007-10-15
参考文献数
14
被引用文献数
2

本論文では,ブログテキスト中に記述されたイベントが,実世界において朝,昼,夕,夜のどの時間帯で生起したかを自動判定するアルゴリズムを提案する.生起時間帯を判定する直接的な情報として,「午後3 時に~した」等の明示的な時間表現が考えられるが,ブログテキストでは,明示的な時間表現が現れにくい.そこで,本研究では,明示的な時間表現の代わりに,イベントの生起時間帯を連想させる語(「出勤」,「花火」等)の情報を利用する.イベントの生起時間帯を連想させる語集合を人手のみで収集することは表現の多さから現実的にほぼ不可能な作業である.そのため,提案手法では,ブートストラップ的に,イベントの生起時間帯の学習と並行して同時に,イベントの生起時間帯を連想させる語を自動獲得する.We propose a machine learning-based method for identifying when each event in weblog texts occurs: morning, daytime, evening, or night. Earlier study analyzed only explicit temporal expressions for events and mapped them on time-line in newswire texts. However, other texts such as weblogs contain few explicit temporal expressions. We therefore use various implicit temporal expressions extracted automatically. Specifically, we adopt naive bayes classifiers backed up with the EM algorithm, and support vector machines.