• 正则表达式提取网页中的表格

    正则表达式派上用场 工作需要,需要将一HTML网页中里面的表格单独提取出来。 于是有了下面的正则表达式。 供参考,只要是需要从HTML网页代码中提取特定的内容均可以套用。 当前是表格,但如果是要提取段落 标记之间的内容,则可以将table替换成p,再结合你具体的情况进行提取。 1sed -n '/<table id="iplaylinux" */,/<\/table>/p' /home/iplaylinux.com/test.html 阅读全文
    作者:admin | 分类:Linux系统 | 阅读:10,706 人次 | 标签:, , , , ,