[TOC]

正则表达式

前言

正则表达式是对文本进行处理的工具。它很酷，不过不好理解。它能够用极其精简的语言来描述我们对文本的处理任务。但是不好阅读。

不管怎么说，它几乎是所有编程语言，和相关文本工具，所采用的标准文本处理方法。因此有必要学习它。

linux 中的正则表达式，一般有两种：

基本正则表达式
扩展正则表达式

很多工具默认支持基本的正则表达式，但是可以通过选项开启扩展正则表达式。

常见工具支持情况

grep：默认支持基本，-E 支持扩展，-P 支持预查和回顾
sed：支持基本，-r 或 -E 支持扩展
awk：支持扩展
perl：全功能
ruby:全功能
js:全功能

规则

基本正则表达式

匹配字符

.：单个字符
[]: 括号范围内的单个字符
[^]：不再括号范围内的单个字符
[:name:]：预定义的字符集合
1. [:alnum:]：数字和字母
2. [:alplha:]：字母
3. [:upper:]：大写字母
4. [:lower:]：小写字母
5. [:blank:]：空格和制表符
6. [:space:]：空白符
7. [:cntrl:]：非打印字符
8. [:digit:]：数字
9. [:xdigit:]：十六进制数字
10. [:graph:]: 可打印字符的非空白符
11. [:print:]:可打印字符
12. [:pkunct:]:标点符号

次数

*：匹配 0 到 n 次，贪婪模式，即接下来的字符匹配，会被归为一次匹配
\?：0 次到 1 次
\+：1 次到 n 次
\{x\}: x 次
\{x,y\}：至少 m 次，最多 y 次

位置

^：行首
$：行尾，例子：^$ 空行
\<：单词词首
\>：单词词尾

分组和引用

$str$：(和)之间是一个正则分组，它也是一个正常的匹配
\1：引用第一个分组的结果
\&：前面所有分组的结果

# 123 转变为 numnumnum
# s/.../num/g 内匹配目标，即1，2，3，匹配三次
# s/[[:digit:]]/.../g 是替换的内容，num
# 注意要将预定义集合放在 [] 内
# 输出 numnumnum
echo 123 | sed 's/[[:digit:]]/num/g'

# 贪婪匹配，输出 num
echo 123 | sed 's/[[:digit:]]*/num/g'

# 指定匹配次数，输出 numnum
echo 123 | sed 's/[[:digit:]]\{1,2\}/num/g'

# 匹配 1，2，3 三个分组
# \2 引用第二个分组的结果
# 输出 2
echo 123 | sed 's/\(1\)\(2\)\(3\)/\2/g'

扩展正则表达式

?、+、{x}、() 不用转义，即由 ? 变为 ?
|：或

正向预查(lookahead)和回顾查找(lookbehind)

这是一个扩展功能，很多工具未必会支持。

(str)：匹配str，后面可用 \1 索引获得结果
(?:str)：匹配str，但不支持索引
msg(?=str)：正向预查，msg 之后是 str，才能匹配 msg，且接下来从 str 开始下次正式查找。
msg(?!str)：正向预查否定式，msg 之后不是 str，才能匹配 msg
(?<=str)msg：回顾查找，msg 之前是 str，才能匹配 msg
(?<!str)msg：回顾查找否定式，msg 之前不是 str，才能匹配 msg

# 正向预查，2 之后为 3，即匹配第二个 2 
echo 1223 | grep -P '2(?=3)'

# 回顾查找，2 之前为 1，即匹配第一个 2
echo 1223 | grep -P '(?<=1)2'

参考

Linux文本三剑客超详细教程---grep、sed、awk：https://www.cnblogs.com/along21/p/10366886.html
贪婪与懒惰：https://deerchao.cn/tutorials/regex/regex.htm#greedyandlazy

coder_lw / wiki

正则表达式

前言

常见工具支持情况

规则

基本正则表达式

匹配字符

次数

位置

分组和引用

扩展正则表达式

正向预查(lookahead)和回顾查找(lookbehind)

参考

简介

发行版

贡献者

近期动态

coder_lw / wiki .gitee-modal { width: 500px !important; }

正则表达式

前言

常见工具支持情况

规则

基本正则表达式

匹配字符

次数

位置

分组和引用

扩展正则表达式

正向预查(lookahead)和回顾查找(lookbehind)

参考

简介

发行版

贡献者

近期动态

搜索帮助

coder_lw / wiki