著者
福島 俊一 下村 秀樹 森 義和
雑誌
全国大会講演論文集
巻号頁・発行日
vol.第50回, no.人工知能及び認知科学, pp.65-66, 1995-03-15

郵便物の宛名住所のようにフリーピッチで書かれた手書き文字列は、字形が多様で、文字サイズにばらつきがあり、文字の接触・入組みなどもよく起きる。したがって、その読取りでは、誤切出し/誤認識によって欠落した正解文字を補完可能な知識処理が不可欠である。現在主流となっている知識処理の枠組みは、まず、各文字位置(セグメント)に複数通りの可能性(候補文字)を許した認識結果文字列と単語辞書とを照合し、さらに、単語の並びとしての妥当性を判定して読取り結果を決定する2段構成である。正解文字の欠落には、1段目の単語照合で虫食い照合を行うことで対処する。しかし、このような従来の枠組みは、フリーピッチ手書き文字列の読取りを正確かつ効率よく行うのに、まだ十分なものとは言えない。第一に、例えば「川崎市宮前区」の「市宮」が接触して1セグメントとされてしまったときなど、単語の境界位置を確定できないようなケースがうまく扱えない。第二に、2段目の単語列探索で最良解が保証されるように、1段目の虫食い照合で正解文字欠落のあらゆる可能性を求めておこうとすると、最悪の場合、単語辞書の全探索あるいは候補文字の組合せ爆発が起きる。そうでなければ、虫食い照合に1文字不一致のみのような制限を付けて、可能性を切り捨てることになる。1段目の単語照合に限ってみれば、各文字位置から単語へのインデックスをもつ松本らの手法が効率よい虫食い照合を可能にしているが、そのままではフリーピッチの単語列読取りには適用できない。本稿では、上記のような問題を解決するたの、従来の2段構成とはまったく異なる知識処理の枠組みとして、「文字タグ法」と名付けた新しいアルゴリズムを提案する。手書き宛名住所から都道府県名・市区郡名・町名の並びを読み取る応用を例に概要を紹介する。
著者
下村 秀樹 並木 美太郎 中川 正樹 高橋 延匡
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.33, no.4, pp.457-464, 1992-04-15
被引用文献数
15

本論文は 形態素解析処理に基づいて 日本文の誤りを検出する新しい手法(コスト比較法)と その誤り検出能力を提示するわれわれはまず 形態素解析処理を考察し 形態素解析が 単語をノードとする木の最小コストパス探索問題にモデル化できることに着目したこのモデルでは 単語のもっともらしくなさの程度がコストの大きさで示され 文節数最小法や最長一致法などの従来の代表的な手法は このモデルでのコスト設定と探索制御の一例として表現できる次に その形態素解析モデルを 文中の誤り検出という観点から検討したその結果 誤りを含む文を解析した場合には解析結果のコストが大きくなることを利用して 解析結果の各単語のコストをしきい値と比較することによって誤りを検出するという 従来にはない新しい手法(コスト比較法)を考案した本研究では コスト比較法の誤り検出能力を確認するために 単語接続確率モデルに従ってコストを設定した形態素解析を実現し 誤りを含む文を解析して 実験を行ったその結果 コスト比較法によって 多種類の誤り(誤字 脱字 仮名漢字変換誤りなど)を指摘できることがわかった本論文では コスト比較法の誤り検出能力の定量的 定性的実験結果を述べるとともに 誤りの正確な位置や原因の特定 誤りを判断するしきい値の設定 などの残された課題にも言及する
著者
福島 俊一 下村 秀樹 森 義和
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.37, no.4, pp.500-510, 1996-04-15
被引用文献数
19

本論文では フリーピッチ手書き文字列の読み取りのために 新しい知識処理アルゴリズムである「文字タグ法」を提案する. 字形が多様で 文字サイズ・文字ピッチにばらつきがあり 文字の接触・入り組みなどもよく起きる手書き文字列の読み取りでは 誤切り出しや誤認識によって欠落した正解文字を補完する知識処理が不可欠である. 従来の知識処理方式は 単語辞書と候補文字列とを照合して単語候補を抽出したうえで その並びの妥当性を判定する2段構成である. このような従来法では 単語境界が不確定なケースをうまく扱えないことや 候補文字列と単語辞書との虫食い照合における組合せ爆発を避けると 強引に候補を切り捨てることになって最良解を保証できないことなどが大きな問題になっている. これに対して 本論文で提案する文字タグ法は 文字を基本単位としてタグを付与し その位置関係をチェックしながら連結していく戦略をとる. 単語内の文字の連結と単語間の文字の連結とを同等に扱って動的計画法を適用することで 最良解を保証し かつ 入力文字列の長さLと候補多重度Mに対してO(L^2・M^2)またはO(L・M^2)の時間計算量を達成している. さらに 手書き宛名住所の地名領域の読み取りに文字タグ法を応用し 文字切り出しや個別文字認識のあらゆる組合せと正解文字欠落の可能性の中から最良解を高速に探索する文字タグ法の能力を確認した.This paper proposes a new algorithm for post-processing in a hand-written character reader. Hand-written characters have such characteristics as various styles, irregularity in size and pitch, frequency of character overlapping, and so on. These characteristics bring difficulty into hand-written character reading systems. Post-processing to correct mis-segmentation and mis-recognition by linguistic information is an important approach to accurate reading. Conventional post-processing methods consist of two steps. In the first step, word candidates are extracted by word dictionary looking-up. In the second step, combinations of words are evaluated. These conventional methods have the following problems. The first problem is that they don't work well when word boundary segmentation is missed. The second one is combinational time complexity, required for examinations of all combinations of character segmentation candidates and character recognition candidates by approximate matching. In the algorithm proposed in this paper, character candidates are tagged with position-in-word information, and the position-in-word tags are connected by a dynamic programming method. This algorithm has the advantage of time complexity O(L^2・M^2) or O(L・M^2) for optimum path search, where L is input length, and M is average number of segmentation and recognition candidates per character. This paper also describes its implementation and evaluation results in hand-written Japanese address reading.
著者
青山 一美 南野 活樹 下村 秀樹
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.22, no.4, pp.375-388, 2007 (Released:2007-04-18)
参考文献数
11
被引用文献数
1 3 2

An autonomous agent in the real world should learn its own sensor-motor coordination through interactions with the environment; otherwise the behaviors can not be grounded and they can easily be inappropriate in the variety of the environment. The sensor-motor signals are usually complex time sequence, therefore the cognitive action system of the agent has to handle them.In this paper, we propose a computational model of the cognitive action system that consists of a sensor space HMM-SOM, a motor space HMM-SOM and connection mapping between the two HMM-SOMs. A HMM-SOM can be recognized as a set of HMMs that are placed in a SOM space. It can model a set of complex time series signal in a self-organizing manner.We apply this HMM-SOM based cognitive action system on vision-motion and auditory-articulation signals. The experimental results show that this system is basically capable of constructing sensor-motor coordination structure in a self-organizing manner, handling complex time series signals.