正则表达式提取网页中的表格

正则表达式派上用场

工作需要,需要将一HTML网页中里面的表格单独提取出来。
于是有了下面的正则表达式。
供参考,只要是需要从HTML网页代码中提取特定的内容均可以套用。
当前是表格,但如果是要提取段落

标记之间的内容,则可以将table替换成p,再结合你具体的情况进行提取。

1
sed -n '/<table id="iplaylinux" */,/<\/table>/p' /home/iplaylinux.com/test.html

本文固定链接: http://iplaylinux.com/regex-html-table.html | Linux玩家

该日志由 admin 于2013年01月18日发表在 Linux系统 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: 正则表达式提取网页中的表格 | Linux玩家
关键字: , , , , ,

正则表达式提取网页中的表格:等您坐沙发呢!

发表评论

快捷键:Ctrl+Enter