著者
小松 里奈
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

オフライン手書き文字認識は、AIによる技術・アルゴリズムにとって未だに残る難しい課題となっている。これは手書きのドキュメントにて、スキャン処理を行う間に、画像内で頻繁にノイズがいくつか生じてしまうためである。スキャンされた画像にあるノイズの存在は、画像を濁らせたりぼやけさせたりし、読みにくくなってしまう。本研究では、3,036種類の日本語を含んだ607,200枚のサンプル画像の分析に、U-Netと呼ばれるCNNアーキテクチャの一つを用いて試みた。結果を通じて、U-Netには多種多様な手書きのスタイルに対しても、文字からノイズを除去し、ストローク部分を強調できるという十分な能力を持つことを示すことができた。