著者
津々見 誠 村上 浩司 梅田 卓志
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

データの構造化は自然言語処理における重要なテーマの1つである.我々はeコマースにおけるデータ構造化の一環として,楽天市場の商品のメーカー名と,知識ベース上の企業との自動マッピングのタスクに取り組んだ.テキスト中で何らかの実体を指示する用語を知識ベースに対応付けるエンティティリンキングにおいて,語の多義性やエンティティの曖昧性,リンクの存在の不確定性等,解決すべき課題は多い.我々は役割の異なるDoc2Vecモデルを多段に重ねて複数の観点からリンキングの正当性を検証する手法を提案する.評価実験において本手法はテキストマッチングによる手法を31.0ポイント上回る83.5%のマッピング精度を達成した.本手法は用語の多義性をはじめとする課題の解決に対して有効である他,辞書や教師データの作成等人手を要する工程を必要とせず,コスト面での優位性が高いことを示した.
著者
小野 智司 津々見 誠 中山 茂
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J94-D, no.12, pp.1971-1974, 2011-12-01

航空機の搭乗券のように金銭的価値をもつ二次元コードの利用が拡大している昨今,二次元コードの複製を検知する技術の実現は急務である.本論文は,複写機による複製を検出できるよう,二次元コードに電子透かしを埋め込む方式を提案する.