著者
鈴木 昌和 池田 秀人 飯高 茂 玉利 文和 大友 正英 菅沼 明
出版者
九州大学
雑誌
基盤研究(B)
巻号頁・発行日
1995

1.本研究では、数式を含む日本語のLaTeX文書の自動点訳システムの構築した。(1)Extraによる日本語のひらがな変換と分かち書き処理(2)平仮名化されたLaTeX文書の点字への変換と、点字文書としてのレイアウト整形(3)点訳結果の校正(ビューアとエディタ)これらの作業を統合された環境で行えるWindows95上のアプリケーションとして構築した。更に、約7000語の数学用語の点字による読みと分かち書きの位置及び品詞コードを記した辞書を作成した。これにより、2.の処理が数学の専門書に対しても高精度で行えるよになった。2.自動点訳における数式入力の負担を軽減する為に、数式を含む文書の光学読取りシステムの研究を行った。Texで印刷した文書については非常に高い精度認識が出来ることを実験で示した。但し、現時点では行列には対応できていない。3.Texのバ-ジョンによる差や複雑なユーザーマクロによる記述などの根本的解決の為、Texが出力するDviファイルから標準的なTexコマンドのみを用いたTEX形式のソースファイルを再構成する研究を行った。章節や定理、箇条書きなどの構造への対応も可能なアルゴリズムを求めた。数式記述部分については上記2.の数式認識アルゴリズムを適用して、非常に高い精度で再現が可能であること確認した。
著者
鈴木 昌和 内田 誠一 岡本 正行 玉利 文和 藤本 光史 金堀 利洋 山口 雄仁 藤芳 明生
出版者
九州大学
雑誌
基盤研究(B)
巻号頁・発行日
2006

科学技術文書のスキャン画像を検索や音声や点字などのアクセシブルなデータに変換可能な電子データに変換するシステム構築に不可欠な数式認識と、数式を含んだ文書のレイアウト解析の高精度化に関する研究を行った。特に大量の頁の文書の電子化に有効な適合型認識システムのアルゴリズムを文字認識、数式構造解析、レイアウト解析の各レベルで開発し実装を行った。また、類似記号が多い数式の文字認識精度向上のため、サポートベクターマシンを用いた類似数学記号識別の評価テストも行った。