著者
菅原 一秀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会誌 (ISSN:09135693)
巻号頁・発行日
vol.84, no.5, pp.337-340, 2001-05-01
参考文献数
5

視覚障害者が独力で印刷文書を読むことができるシステムを紹介する.従来のこのようなシステムは印刷された文章の音声への置換え機能を提供するだけなので,先頭から順に音声を聞くことしかできず,ユーザが読みたいところに素早くアクセスすることができなかった.この問題は見出しや段落など文書の論理的な構造を利用することにより解決できる.ユーザインタフェースとしては論理構造-この場合はツリー構造-を渡り歩くためのコマンドが必要となる.我々はこの方式を雑誌を読む課題に適用した.表紙による雑誌の判別や,目次構造の利用,ページ番号の取得,構造化された文書の管理などの機能も含め,雑誌からの総合的な情報取得のためのシステムを作り上げた.
著者
菅原 一秀
雑誌
全国大会講演論文集
巻号頁・発行日
vol.51, pp.371-372, 1995-09-20

視覚障害者が日常的な印刷情報に簡単にアクセスできるためのシステムの研究開発を行なっている。出力は音声又は点字によるので不要な情報は飛ばして、必要な情報に効率的にアクセスできることが特に重要である。そのためにスキャナから入力された文書画像のレイアウト解析を行ない、論理構造を抽出して利用する。本稿では雑誌を読む場合及び請求書を読む場合の手順を想定し、効率的なアクセスのために必要な技術を検討する。また、レイアウト解析から得られる情報と、文字認識の内容から得られる情報を組み合わせて文字列をグループ化し、文書の論理構造を抽出する手法を提案する。文書画像から論理構造を抽出する研究は文書処理の効率化を目指して行なわれてきた。これらの論文ではいずれも対象を技術論文や、特許公報などの専門的文書に限っており日常的な、雑誌、請求書などの文書についてはこれまで対象外であった。
著者
菅原 一秀
雑誌
全国大会講演論文集
巻号頁・発行日
vol.53, pp.137-138, 1996-09-04
被引用文献数
1

視覚障害者が簡単に操作でき、日常的な印刷情報にアクセスすることのできる文字認識システムの開発を行なっている。出力は合成音声によるので、文書の内容に素早くアクセスするには文書の論理構造に基づいた構造化が必要となる。また、表題や、ページ番号などは本文と独立にヘッダ、フッタなどに記載されているのでこれらの主に物理的配置に基づいた構造の抽出及びそれへのアクセスが問題となる。本稿では再帰的X-Yカットを用いた文字列の物理的配置の解析手法によるヘッダ、フッタなどの物理的情報の抽出、及び行の端点の並びからのパラグラフ、見出しなどの論理構造の抽出について報告する。
著者
菅原 一秀
雑誌
全国大会講演論文集
巻号頁・発行日
vol.33, pp.1531-1532, 1986-10-01

テンプレートを用いる音声認識ではその良否が直接認識結果に反映される。テンプレートの最も簡単な作成法は、ある一つの発声をもってテンプレートとする方法である。しかしこの方法は一つの発声のみに頼るので偏りが避けられないし、発声の変動が大きくなったり、テンプレートを適応化させようとした時にはうまくいかない。これらの問題点を解決するためにテンプレートを複数個使う方式(マルチ・テンプレート法)があるが、与えられた学習用発声全部をそのままテンプレートとして持つのでは記憶域及び計算量が大きくなってしまい、得策ではない。そこで、与えられたテンプレートから一つあるいは少数のテンプレートを作りだす方法が要求される。本稿ではその方法の一つとして、「重み付きDPマッチング」を利用した新しいテンプレート作成法(AWDP法:Average by Weighted DP)を示す。
著者
菅原 一秀
雑誌
全国大会講演論文集
巻号頁・発行日
vol.57, pp.284-285, 1998-10-05
被引用文献数
1
著者
菅原 一秀 野崎 広志
雑誌
全国大会講演論文集
巻号頁・発行日
vol.49, pp.211-212, 1994-09-20

オンライン文字認識装置において、単語の部分的な文字の入力からいくつかの候補単語を推定、表示し、それらの中からユーザーが選択できるようにしたい。本稿ではこの候補単語の推定のことを予備選択と呼ぶ。この予備選択により、高速に候補を部分的入力からも推定できるようになるので、ユーザーが速くペン入力を使用できるようになる。予備選択のためには、頻度情報を持った語い集と、一文字ずつの文字認識のスコア付の認識結果を使う。認識装置には誤認識はつきものであるが、選択すべきリスト中に正解単語が無いのは非常に不都合である。そこでこの予備選択時にはたとえ認識結果からの組み合わせからは出てこない単語でも、それが一文字の置換程度で得られ、かつ、頻度の高いあるいは語い集に載っているものならば、結果のリスト中に残るような、認識の耐雑音性とでもいうべき仕組みが必要である。また、予備選択は軽い処理である必要がある。これに時間がかかるようでは次の文字を入力した方が早いことになり意味がなくなる。本稿では、この2つの点、認識の耐雑音性と、処理の軽さを実現する手法として、単語ごとの文字の出現行列を使い、認識装置からの一文字ごとの認識結果に対しその文字が各単語に含まれているかどうかを調べるものを提案する。さらにインプリメンテーション、予備実験の結果を示す。