著者
田中 裕隆 新納 浩幸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.3Rin455, 2020 (Released:2020-06-19)

物体検出は、教師あり学習によって解決できる画像認識のタスクの一つである。物体検出の教師データにはBounding Boxとクラスラベルがある。これらの教師データの作成は一般的に人手で行われるためコストが高い。本研究は、教師データに用いる正確なBounding Boxの作成を目的とする。人手による正確なBounding Boxの作成は高コストであるが、正確性を要求しないBounding Boxであれば、人手であっても比較的低コストに作成できる。そこで、物体に対して余裕のある低コストなBounding Boxから、正確なBounding Boxを作成する手法を提案する。提案手法では、人手で作成したBounding Boxを用いて、その内側の領域に対するセマンティックセグメンテーションによって得られた推定領域全体を、正確なBounding Boxとした。この手法によって、物体に対して余裕のあるBounding Boxから、より正確なBounding Boxを作成することができた。
著者
田中 裕隆 曹 鋭 白 静 馬 ブン 新納 浩幸
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2019-NL-243, no.8, pp.1-6, 2019-11-27

近年,BERT のような事前学習モデルを利用することで,自然言語処理システムの性能が大きく向上している.BERT は,Transformer の Multi-head Attention を用いることで文脈に応じた単語の埋め込み表現列を得ることのできるモデルである.文書分類のタスクの場合,文書を BERT に入力し,その出力から文書の特徴ベクトルを構築する方法によって処理できる.しかし,BERTに入力できるシーケンスの長さには上限がある.この制限によって,長い文書を扱う場合,標準的な手法では文書分類に必要な情報を十分に得られないと考えられる.そこで,BERT から長い文書内の全ての単語に対応する埋め込み表現を得て,そこから文書の特徴ベクトルを作成する手法を提案する.