著者
永野 雄大 菊田 遥平
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

SRGANは超解像手法の中でも特に人間の見た目に美しい高解像度画像を生成することができる. しかし, このモデルは一定度の解像度の画像を更に超解像をする目的で考案されたもので, 過去に撮影されたノイズを含むような低解像度画像を超解像することは困難である. 過去に撮影された低解像度画像から画像の細部情報を失うことなく自然な高解像度画像を生成できることは, 我々のサービスにとって有用である. そのため, 本稿では対象を料理画像に絞る. 超解像モデルの学習はある画像とその画像を低解像度化したもののペアから情報を復元するように実施されるという構造に注目し, 我々の目的に資する2つのアプローチを提案する. 一つ目は, 低解像度化をする際に人為的にノイズを加えるという手法である. 二つ目は, ドメイン毎にデータを分けてそれぞれでモデルを学習するという手法である. 本稿で使用したのは, {牛肉, 鶏肉, 食パン, パウンドケーキ}の4種類である. これにより, 既存手法と比べ本稿の手法では定量的・定性的に自然な高解像度画像の生成結果が得られた.
著者
菊田 遥平 染谷 悠一郎 Rybicki Leszek
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

Deep Learningを用いた画像判別は解決したタスクとして認識されているが、サービス化に際しては実用に足る性能を発揮するために数多くの困難が存在する。 クックパッドにおける料理きろくサービスを題材として、料理画像判別におけるアーキテクチャの工夫と出力クラス数の調整や物体検出との組み合わせなどによる総合的な判別性能向上に関して解析した結果とその効果を報告する。