位置: IT常识 - 正文

织梦采集中用到的一些过滤规则(织梦如何采集文章)

编辑:rootadmin

推荐整理分享织梦采集中用到的一些过滤规则(织梦如何采集文章),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:织梦下载站源码带采集,织梦如何采集文章,织梦自动采集发布,织梦下载站源码带采集,织梦怎么用,织梦自动采集教程,织梦自动采集教程,织梦采集器图片本地化,内容如对您有帮助,希望把文章链接给更多的朋友!

织梦dedecms的过滤规则写起来不是很难,规则如下:

代码示例:

{dede:trim}要过滤的内容{/dede:trim}

如果要过滤的内容很简单,完全可以把过滤规则直接写在“{dede:trim}”和“{/dede:trim}”之间。

对于比较复杂的情况,请考虑使用正则,你懂的,正则表达式,那是相当强劲的。

以下是一些过滤规则的例子,供大家参考。

1、采集中去除内容里的超链接:

代码示例:

{dede:trim}<a([^>]*)>{/dede:trim}

{dede:trim}</a>{/dede:trim}

假如要将所有超链接内容都去除,规则是:

代码示例:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

这两个规则的不同通过下面代码来解释

织梦采集中用到的一些过滤规则(织梦如何采集文章)

例如文章代码中包含着如下内容:

<a href="#">超链接</a>

通过第一个规则,采集结果是:超链接

2、过滤广告

对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如

代码示例:

<script src=’/plus/ad_js.php?aid=4′language=’javascript’></script>

这样的规则只需

代码示例:

{dede:trim}<script(.*)>{/dede:trim}

{dede:trim}</script>{/dede:trim}

如果某些广告的内容是JS代码写在<script></script>区间里的,例如GG的广告,那么过滤规则应该是:

代码示例:

{dede:trim}<script>(.*)</script>{/dede:trim}

3、一些测试过的过滤规则

代码示例:

{dede:trim}<!–(.*)–>{/dede:trim}{dede:trim}<select([^>]*)>([^>]*)</select>{/dede:trim}{dede:trim}<option([^>]*)>([^>]*)</option>{/dede:trim}{dede:trim}<select([^>]*)>{/dede:trim}{dede:trim}</select>{/dede:trim}{dede:trim}<param([^>]*)>{/dede:trim}{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}{dede:trim}<embed([^>]*)>{/dede:trim}{dede:trim}</embed>{/dede:trim}{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}{dede:trim}<object([^>]*)>{/dede:trim}{dede:trim}</object>{/dede:trim}{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}{dede:trim}<OBJECT([^>]*)>{/dede:trim}{dede:trim}</OBJECT>{/dede:trim}{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}{dede:trim}<iframe([^>]*)>{/dede:trim}//by www.dede58.com//{dede:trim}</iframe>{/dede:trim}{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}{dede:trim}<IFRAME([^>]*)>{/dede:trim}{dede:trim}</IFRAME>{/dede:trim}{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}{dede:trim}<font([^>]*)>{/dede:trim}{dede:trim}</font>{/dede:trim}{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}{dede:trim}<a([^>]*)>{/dede:trim}{dede:trim}</a>{/dede:trim}{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}{dede:trim}<td([^>]*)>{/dede:trim}{dede:trim}</td>{/dede:trim}{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}{dede:trim}<tr([^>]*)>{/dede:trim}{dede:trim}</tr>{/dede:trim}{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}{dede:trim}<tbody>{/dede:trim}{dede:trim}</tbody>{/dede:trim} // 内容来自www.dede58.com//{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}{dede:trim}<table([^>]*)>{/dede:trim}{dede:trim}</table>{/dede:trim}{dede:trim}<span([^>]*)>{/dede:trim}{dede:trim}</span>{/dede:trim}{dede:trim}</IFRAME>{/dede:trim}{dede:trim}<script>(.*)</script>{/dede:trim}{dede:trim}<script(.*)>{/dede:trim}{dede:trim}</script>{/dede:trim}

免责

本文链接地址:https://www.jiuchutong.com/zhishi/310894.html 转载请保留说明!

上一篇:帝国CMS如何实现会员登陆赠送积分(帝国cms如何使用)

下一篇:<四>2:掌握Const 与一二级指针结合应用

  • 当月出口的货物,可以过几个月申报吗
  • 延期交税的情况有哪些
  • 其他应收款审计说明怎么写
  • 什么是调账的依据
  • 转让金融资产需要交税吗
  • 怎么用一证通报税
  • 其他综合收益和综合收益的关系
  • 居民企业核定征收企业所得税的项目有哪些
  • 国资委无偿划拨资产不上税吗
  • 进口原材料关税税率是多少
  • 退休工资的个人账户怎么算
  • 金税盘付费
  • 其他综合收益包含哪些科目
  • 自产产品赠送确认收入吗
  • 扶持资金属于政府补助吗
  • 离退休人员再任职的规定
  • 雇主责任险发票的项目名称怎么写
  • 停车场增加收入
  • 开具红字发票退税准备什么资料?
  • 城镇退役士兵安置条例
  • 企业无形资产包括
  • 产品检测步骤
  • 未担保余值什么意思
  • 净资产有哪些科目
  • 测速网在线测速
  • 退税有啥影响
  • 购买电子承兑差额怎么算
  • win10 dev版本
  • 成品油消费税怎么抵扣
  • 转售股票会计分录
  • 预计负债的概念是什么
  • uniapp如何使用
  • wordpress建网站详细教程
  • 没有发票怎么做研发费用
  • command对象可以执行sql语句吗
  • vue大型项目撑得住吗
  • 附加税减免申报表怎么填
  • 零申报的公司有财务报表吗
  • 金税服务费必须交吗
  • 研发支出可以计提吗
  • 国家为什么要征收各种税
  • 一次性用品可以做什么东西
  • 建筑企业预缴所得税税率是多少
  • 电梯折旧费计算方法
  • 利润分配贷方余额怎么处理
  • 会计库存商品属于什么科目
  • 母子公司之间的借款
  • 长期挂账其他应付款处理
  • 燃油费如何做账会计分录
  • 工程结算收入是否缴纳增值税
  • 持有至到期投资在资产负债表怎么填
  • 未分配利润高怎么解释
  • 开红字发票购买方和销货方有哪些操作不同?
  • 新手公司内帐怎么做
  • mysql配置文件优化详解
  • securedownload是什么意思
  • win10重置登录
  • solaris ssh offline
  • 电脑无法检测到麦克风怎么办
  • 电脑出现系统状态
  • win7系统硬盘分区类型
  • securecrt keymap
  • 怎么使用mac打电话
  • windowxp音量图标没了
  • win8应用商店无法连接网络
  • node modules干嘛的
  • 帝国cms列表页隐藏部分文章
  • <Unity UGUI>使用c#反射实现UGUI文本显示的国际化
  • opengl用法
  • js数组洗牌
  • linux定时执行任务
  • unity3d添加组件
  • javascript数据转换
  • 手游炫酷
  • 海关免税金额现在是多少金额
  • 湖北税务网上登录
  • 医保断交一年怎么续交
  • 手工税票
  • 税纳税申报表
  • 何为标兵称号
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设