• 正则表达式提取网页中的表格

    正则表达式派上用场 工作需要,需要将一HTML网页中里面的表格单独提取出来。 于是有了下面的正则表达式。 供参考,只要是需要从HTML网页代码中提取特定的内容均可以套用。 当前是表格,但如果是要提取段落 标记之间的内容,则可以将table替换成p,再结合你具体的情况进行提取。 1sed -n '/<table id="iplaylinux" */,/<\/table>/p' /home/iplaylinux.com/test.html 阅读全文
    作者:admin | 分类:Linux系统 | 阅读:10,342 人次 | 标签:, , , , ,
  • 让正则表达式忽略大小写

    正则表达式学习笔记:如何让正则表达式忽略大小写 有的时候想匹配一些单词,但希望匹配出的结果忽略大小写问题。 就是不管是大写小写,通通要找出来。 解决办法 一般说来,比如要匹配 From 让它忽略大小写问题。需要使用[Ff][Rr][Oo][Mm] 这样相当不方便。 但使用egrep -i 参数却很方便实现忽略大小写问题。 1egrep -i '^from' yourfile 这样的话,行首以字母f开头,并紧跟r,紧跟o,还有m的...阅读全文
    作者:admin | 分类:Linux系统 | 阅读:9,066 人次 | 标签:, ,
  • 正则表达式匹配行首与行尾

    正则表达式学习笔记 最近准备开始系统学习下正则表达式. 以前都是直接拿现成的改呀改的. 一有需要阅读的就麻烦不断. 好了. 这次是行首与行尾. 比如 ^cat 匹配的是以字母c开头并且紧接一个字符a,再紧接一个字符t,因此vocation 也会被匹配到. 而 $ 是配置结尾的. 阅读全文
    作者:admin | 分类:Linux系统 | 阅读:22,867 人次 | 标签:,