著者
似内勇太 奥野拓
雑誌
第76回全国大会講演論文集
巻号頁・発行日
vol.2014, no.1, pp.561-562, 2014-03-11

現在,Web上には人名,地名,住所など様々なデータが文章中に含まれ公開されている.文章をLinked Data化する場合,文章中のリソースの特定作業とプロパティの選定作業が課題となる.本研究では,Linked Data化する対象を観光情報サイト内の文章と定め,固有表現抽出を用いて文章に含まれるリソースの抽出とプロパティの推薦を行う.機械学習の手法の一つであるCRFを用いて固有表現抽出を行うために,観光情報サイト内に含まれる店名やメニューなどの観光属性情報を定義し,観光情報サイト内の文章から教師データを作成する.また,抽出結果に付与される属性情報とプロパティを関連付け,プロパティの推薦を行う.