1. 采集超市是国内最专业的火车头采集发布方案开发平台!

    专注于火车头规则、插件、模块、接口定制!为企业和个人提供全方位的采集发布方案!

    业务咨询请点击这里

  2. 最新火车头php发布接口定制业务上线

    支持采集zencart、opencart、x-cart、magento、SV-CART、 osCommerce、TomatoCart、PrestaShop、shopex、ecshop、ecmall、dedecms、phpweb、 KeeShop、TinyShop、 iWebShop、Easycart等等商城,支持自建商城!

  3. 采集超市建站、服务器租用服务

    专业从事于网站采集、网站建设、模板仿制、服务器租用、图像处理、淘宝周边产品或业务!需要更多业务请和我们联系!

    QQ:389311875

切换到精简模式

『采集超市』ORC识别图片文字

作者:采集超市 / 栏目:火车头基础 /发布于:2014年10月22日
如需咨询,请联系,或加官方微信账号:locoymallcom

Orc识别功能,是可以把一些简单的图片信息识别成文字信息的,网站上面的电话号码是图片格式的可以识别成纯文字。我们通过这个功能来识别下面的图片文字。

http://bj.ganji.com/tel/52650234566157315535536b513f006051650f3e5231_4.png

 

第一步:配置Ocr信息

clip_image002

 

按照上图点击Ocr识别图标,打开识别界面。把要识别的图片地址或者通过浏览把本地的图片地址加载到OCR工具里:

1, 加载图片

clip_image004

通过从本地或者直接输入图片的网络地址,然后点击“加载”按钮

2, 预处理

这个点击“添加”按钮,自己看下这些操作,其实这里一般是没有用的,没有什么方法就随便点点,走运也许就把图片识别了

3, 图片预览

通过操作预处理后的图片和原来图片的变化。

4, 字符过滤

白名单字符:要识别的字符,数字字母汉字都可以;黑名单字符:不需要识别的字符。

设置好了以后,点击“识别测试” 会弹出识别的结果,对照下如果识别是正确的点击右下角“保存配置”。如果识别不了,亲,你就放弃吧 找我们技术部开发插件识别。

clip_image006

这样就把识别的配置信息保存成文件了,就可以在采集器里面使用了

第二步,采集规则使用识别配置

clip_image008

打开需要进行ocr识别的标签,在数据处理那里,添加===》OCR图片识别,然后右侧 “点击这里选择配置文件”,就是选择在第一步那里生成的识别文件,设置好了点击“保存”按

钮。绿色字体那里注意看下,标签是采集到单个图片地址,这里注意下。也是说需要识别的标签采集到的值必须是图片的地址,但不需要勾选图片下载。

很遗憾这个功能可能对很多网站的识别都不行,如果你遇到识别不了,但又必须要识别的就联系我们官方定制插件吧 。。。。。。。。。。。。。。。。


如需网站采集相关服务,请联系我们:


QQ常年24h在线:389311875      网址:『采集超市』www.locoymall.com



|||||||

如需咨询,请联系,或加官方微信账号:locoymallcom
如果喜欢这篇文章,欢迎订阅采集超市 以获得最新内容。

本文由“采集超市 > 采集超市 ”收集并整理编辑后发布,若未注明内容为原创,则不用对其真实性负责!

页面标题:[ 『采集超市』ORC识别图片文字 - 采集超市 ]
本文网址:

网站内容禁止用于非法用途!不得用于商业用途!转载者须保证文章的内容完整性和添加本站版权说明!如我们发布的内容侵害了您的合法权益,请及时联系我们删除!

已经有 0 条评论

我要发表评论


sitemap