grep及正则表达式详解

·grep

    即Global Research,根据模式(pattern->文本字符和正则表达式的元字符组成的匹配条件),搜索文本,并将符合模式的文本行显示出来的工具,相应的还有egrep和fgrep,使用格式:grep [options] pattern [file...],pattern要用单引号引起来:

    -i(ignore-case)选项表示忽略大小写

    --color选项表示显示颜色

    -v选项表示显示没有被模式匹配到的行,即反向过滤

    -o选项表示只显示被模式匹配到的字符串,而不是显示整行内容

    grep做部分匹配显示整行:

            \{m,n\}->表示匹配其前的字符至少m次,至多n次,反斜线是为了转译,防止花括号被bash解释

·位置锚定

    ->^表示锚定行首

        该字符后面的任意内容必须出现在行首

    ->$表示锚定行尾

        该字符后面的任意内容必须出现在行尾

    ->^$表示空白行

    ->[]表示匹配指定范围内的任意单个字符

    ->[^...]表示匹配指定范围外的任意单个字符

    ->\<表示锚定单词首部

        该字符后面的任意字符必须是单词的首部,还可以用\b表示

    ->\>表示锚定单词尾部

        该字符后面的任意字符必须是单词的尾部,还可以用\b表示

·字符集合

    ->[[:digit:]]表示数字

    ->[[:lower:]]表示小写字母

    ->[[:upper:]]表示大写字母

    ->[[:punct:]]表示标点符号

    ->[[:space:]]表示空白字符

    ->[[:alpha:]]表示字母

    ->[[:alnum:]]表示字母和数字

·正则表达式

    Regular Expression->REGEXP

    ->元字符

        .:匹配次数,在贪婪模式下

        *:匹配其前的字符任意次

            

        .*:表示任意长度的任意字符

        \?:表示匹配其前的字符一次或者0次

·分组

    \(\)->表示将内容分组,即后向引用