- 著者
-
山口 雄仁
渡辺 哲也
岡田 伸一
鈴木 昌和
川根 深
- 出版者
- 日本大学短期大学部
- 雑誌
- 基盤研究(B)
- 巻号頁・発行日
- 1998
本課題研究は大きく分けて,1.数式を含む文書の光学的文字認識(OCR)システムの開発と2.OCRされた文書の日本語による自動読み上げシステムの開発から構成される。それぞれについて,研究成果の概要は以下の通りである。1.については,(1)日本語・英語両方の文章から数式領域を正確に切り出す技術の確立,(2)数学記号認識の精度を大きく向上させる新たな特徴抽出法の研究や数学記号用認識辞書の整備,(3)認識結果をLa TeXを含む様々なファイル形式で出力する技術の開発などを行い,高度な理数系専門書でも精度よくOCR出来るようになった。また視覚障害学生でも,音声操作でOCRが出来るような環境を用意した。2.については,(1)La TeXで書かれた文章を汎用エディターに読み込み,それを文章解析して数式部分を日本語できちんと理解出来るように音声出力する,Windows汎用画面読み上げソフトウェアに対応した音声マクロを開発し,(2)評価実験を通してその音声マクロの読み上げ法や操作環境の改良を行った。その結果,ある程度理数系の専門知識がある学生であれば,容易に音声で理数系文書の内容が理解出来るようになった。以上の2つを組み合わせれば,墨字で印刷された理数系専門書に音声で十分アクセスすることが出来,理数系視覚障害学生が自立的に墨字文書を読む道が開けたと言える。これは,今後1と2が一体化したより汎用な「数式自動読み上げシステム」を開発する上で,重要な指針を与えるものである。