1. 采集超市是国内最专业的火车头采集发布方案开发平台!

    专注于火车头规则、插件、模块、接口定制!为企业和个人提供全方位的采集发布方案!

    业务咨询请点击这里

  2. 最新火车头php发布接口定制业务上线

    支持采集zencart、opencart、x-cart、magento、SV-CART、 osCommerce、TomatoCart、PrestaShop、shopex、ecshop、ecmall、dedecms、phpweb、 KeeShop、TinyShop、 iWebShop、Easycart等等商城,支持自建商城!

  3. 采集超市建站、服务器租用服务

    专业从事于网站采集、网站建设、模板仿制、服务器租用、图像处理、淘宝周边产品或业务!需要更多业务请和我们联系!

    QQ:389311875

切换到精简模式

『采集超市』设置采集内容不得为空,必须包含,不得包含

作者:采集超市 / 栏目:火车头基础 /发布于:2014年10月22日
如需咨询,请联系,或加官方微信账号:locoymallcom

1,设置标签采集结果不得为空
SBHIOCJIZD%P4S58BIKBH[P.jpg
编辑标签状态下 数据处理 最下面有个内容过滤 选择下
就看到右侧很多选项了“内容不得重复”“内容不得为空”“内容必须包含”“内容不得包含”
还有当内容长度不符合要求的时候时候过滤
这些都是很能看明白的东西吧
5J3FBAR]O%T`EPONU_2U.jpg
上图 不得包含和必须包含那里的“|”“↑” 解释说明 注意下
2,设置好了 你希望采集器如何处理这些不符合你要求的数据呢 看下图
G$~QCNL@SR_$WHQ3R0[U5J5.jpg
在第四步“文件保存及部分高级设置” 右下角 ,看到了吧 2个选项
一个是删除 删除的话就是把这条信息删除掉,
一个是标记为未采集  是把这数据标记为未采集  下次运行任务的时候这条数据会被从新采集

这个的好处就是,当你是因为网速,或者别的原因采集不到数据的时候,
多运行又可以采集到,你就可以设置
为 未采集 等任务运行完了,你只要勾选采集内容 不要勾选采集网址  
采集器就会把这些没有采集到的信息又从新采集一遍的
这样就保证数据的完整性


如需网站采集相关服务,请联系我们:


QQ常年24h在线:389311875      网址:『采集超市』www.locoymall.com



|||||||

如需咨询,请联系,或加官方微信账号:locoymallcom
如果喜欢这篇文章,欢迎订阅采集超市 以获得最新内容。

本文由“采集超市 > 采集超市 ”收集并整理编辑后发布,若未注明内容为原创,则不用对其真实性负责!

页面标题:[ 『采集超市』设置采集内容不得为空,必须包含,不得包含 - 采集超市 ]
本文网址:

网站内容禁止用于非法用途!不得用于商业用途!转载者须保证文章的内容完整性和添加本站版权说明!如我们发布的内容侵害了您的合法权益,请及时联系我们删除!

已经有 0 条评论

我要发表评论


sitemap