正则表达式提取网页中的表格 | Linux玩家

Jan182013

正则表达式提取网页中的表格

作者：admin 发布：2013-01-18 14:45 分类：Linux系统阅读：66,965 人次抢沙发

正则表达式派上用场

工作需要，需要将一HTML网页中里面的表格单独提取出来。
于是有了下面的正则表达式。
供参考，只要是需要从HTML网页代码中提取特定的内容均可以套用。
当前是表格，但如果是要提取段落

标记之间的内容，则可以将table替换成p,再结合你具体的情况进行提取。

1
sed -n '/<table id="iplaylinux" */,/<\/table>/p' /home/iplaylinux.com/test.html

本文固定链接: http://iplaylinux.com/regex-html-table.html | Linux玩家

该日志由 admin 于2013年01月18日发表在 Linux系统分类下，你可以发表评论，并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: 正则表达式提取网页中的表格 | Linux玩家
关键字: html, Linux, regex, sed, Shell, 正则表达式

【上一篇】.co域名godaddy注册最便宜方案
【下一篇】lnmp一键安装包MySQL默认root密码

您可能还会对这些文章感兴趣！

正则表达式提取网页中的表格：等您坐沙发呢！

发表评论