著者
渡部 孝幸 宮崎 佳典
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.5, pp.1417-1427, 2015-05-15

数式は多くの科学分野において広く用いられているものであり,電子的な文書中に記述されることも多い.電子的な文書の特長として,検索を行うことができるという点があげられる.しかし,数式の検索を行うことは容易ではない.なぜなら数式では,通常の言語とは異なり,文字が二次元的に配置されるためである.そこで本研究では,二次元的な文字の構造に対して文字列のパターンマッチング(文字列探索)に基づく検索を行うことで,文書から特定の数式が記述された箇所を見つけ出す,文書内検索の機能を実現する手法を提案する.また,本研究で提案する手法は,数式のパターンマッチングにおいて正規表現を利用することも可能である.正規表現を用いることで,複雑なパターンを処理することが可能となり,検索の利便性が飛躍的に向上する.さらに,パターンにマッチした数式のハイライト表示および数式の置換の実装についても述べる.