著者
森畑 明昌
出版者
日本ソフトウェア科学会
雑誌
コンピュータ ソフトウェア (ISSN:02896540)
巻号頁・発行日
vol.29, no.1, pp.1_147-1_158, 2012-01-26 (Released:2012-02-26)
被引用文献数
1

正規表現はスクリプト言語などで広く使われているが,既存の処理系の多くはバックトラックを用いてこのマッチング処理を実装しており,最悪時の効率が悪い.実用的な様々な拡張を加えた正規表現に対するマッチングアルゴリズム,特に,文字列置換等の用途で用いられる「部分マッチの取り出し」を行えるアルゴリズムが望まれる.本論文では多くの処理系で利用可能な「先読み・否定先読み」をもつ正規表現の有限状態オートマトンへの変換を示す.まず,先読み・否定先読みを持つ大きさmの正規表現を状態数O(22m)の決定的有限オートマトンに変換する手法を示す.次に,部分マッチの取り出しを扱うため,重み付き正規表現を議論する.そして先読み・否定先読みを持つ大きさmの重み付き正規表現を状態数O(22m)の重み付き非決定的有限オートマトンに変換する手法を示す.これらのオートマトンにより効率の良いマッチングを達成できる.

言及状況

外部データベース (DOI)

はてなブックマーク (1 users, 1 posts)

(否定先読みは有用なのに「それを正規表現と読んでいいのか」と調べていた)

Twitter (9 users, 12 posts, 0 favorites)

> この否定先読みですが、肯定先読みと合わせて DFA への変換が提示されており、言語クラスとしては等価なようです 等価であって当たり前だと思っていたのにそんなこともなかったかあ。 論文の議論は読んでないけど状態数が爆発してる。状態数最小化が期待できるらしいなあ。 https://t.co/MqNoBZr1yE https://t.co/tJynaBKDoH
理解したいなぁ。 「先読み付き正規表現の有限状態オートマトンへの変換」 https://t.co/cbPuCQDiFH
「先読み付き正規表現の有限状態オートマトンへの変換」 https://t.co/cbPuCQmfDH
probabilistic automataとかはよく知らない。weighted automata は森畑さんの論文とかで扱ってたやつ? https://t.co/OaGLPj59sV #regexfesta
昔作った小さい正規表現マッチャ、よく見ると(肯定/否定)先読み付き正規表現が未実装になってる。 https://t.co/pApjOLmM4d 森畑さんの https://t.co/uvWKOjLhMV とか参考にして、実装してみようかな
先読み付き正規表現の有限状態オートマトンへの変換 https://t.co/8kXXjKJYOL なるほど、分からん。
先読み付き正規表現の有限状態オートマトンへの変換 https://t.co/scUU1wDYUt
@tanaka_akr @sinya8282 [33] は https://t.co/cGG3lnksL6 です。
(否定先読みは有用なのに「それを正規表現と読んでいいのか」と調べていた) / “先読み付き正規表現の有限状態オートマトンへの変換” https://t.co/YegnYrU887

収集済み URL リスト