著者
新屋 良磨 光成 滋生 佐々 政孝
出版者
日本ソフトウェア科学会
雑誌
コンピュータ ソフトウェア (ISSN:02896540)
巻号頁・発行日
vol.30, no.2, pp.2_191-2_206, 2013-04-25 (Released:2013-08-25)

正規表現によるパターンマッチングは広く用いられており,これまで様々なマッチング手法が研究されてきた.正規表現をDFAに変換してマッチングを行う手法もその1つである.本論文では2つの高速化手法を提案する.1つ目の手法は,マッチングの並列化である.マッチング対象となる文字列を複数に分割してデータ並列にマッチング可能な,同時状態有限オートマトン(Simultaneous Finite Automata, SFA)をオートマトン理論の自然な拡張によって定義した.2つ目は,DFA・SFAから,ネイティブコードを実行時に最適化して生成する手法である.コード生成によって,既存実装に比べてマッチング時のスループットの向上が見込め,また特定の正規表現における最適化も可能となる.最終的に,これらの手法を実装し,マルチコアマシン上での評価を基にその有用性を確認した.

言及状況

外部データベース (DOI)

Twitter (1 users, 2 posts, 0 favorites)

Excelデータ(事実上はCSVの列)のパーザーを作っていて、昔ちょっとだけ読んだ同時状態オートマトンの記事を読んでいるけど、なるほどようやく具体的に分かってきたような気がする……。 https://t.co/uuu98TGB87
新屋さんの並列実行できる正規表現エンジンをGoに移植すれば、なにかの成果が得られるかもしれない。 https://t.co/uuu98TYcwH

収集済み URL リスト