大厂图片文字识别测评PK哪家强 百度识图

【大厂图片文字识别测评PK哪家强 百度识图】平日工作和生活中,我们看似使用识别图片文字的场合不多,但真到用时方知其强大 。比如,内容审核时自动识别出图片中的文字便可及时发现不合规内容,规避业务风险;比如,在发票、收据归档时有自动识别能减少大量人工录入成本;比如,证件上一长串数字自动识别出来便大大增加了结果的精准性 。固然,现在有各式垂直场景的小程序和应用可以满足我们的小需求,但我们更多时候是知其表,不知其背后效果到底几何 。
打开百度搜索图片文字识别,排在前面的有科大讯飞、百度、腾讯云(不分先后),均是技术实力相当雄厚的大厂,那么单论图片文字识别,到底有什么区别呢?笔者分别体验之后,有了以下总结记录:

直接试用
照片效果
脑图效果
响应速度
多语言效果
百度
×
需技术调用
×
需技术调用
×
需技术调用
×
需技术调用
×
需技术调用
科大讯飞

全面、准确
全面、准确、正序
0.5秒-1秒
支持
腾讯云

全面、准确
不全、乱码、乱序
1秒-2秒
支持
个人的上手体验,是科大讯飞的功能体验最为流畅,操作极简,效果快速且覆盖全面、准确 。具体展开的话,对每个体验平台的操作过程做了如下更为详细的描述 。
首先,让我们看看百度 。百度的图片识别是在百度智能云的平台上,目前不对用户端开放测试,如图1 。如果想看效果,只能请技术通过文档搭建在系统上实现效果使用 。


图1 百度智能云文字识别首页
就这个API而言,百度提供了开发调用方面的应用说明和统计数据,便于技术人员使用查看,但是不得不说,要想测试识别效果,确实要耗费一定的人员成本,而且必须要有专业技术人员的支持及搭建环境才能进行,如图2 。对于非技术人员的你我他而言,加高了体验了解的门槛 。
图2 百度智能云文字识别开发页面
接下来,看看腾讯的文字识别功能 。在腾讯云的官方平台上,通过站内搜索文字识别即可找到整个模块的说明 。腾讯云给了一个官方案例,用户也可以随时上传,见下图3 。
图3 腾讯云文字识别首页
考虑到官方案例的效果更多是准备充分的展示,所以为了测试产品效果,在这个平台上传了一份自己的文字零散的脑图图片进行测试 。出结果的响应速度在2秒,等待时间不长,不过整体的效果不太理想,识别成功的内容低于5% 。基于参数设置中有个语言识别的选择,对语言的参数选择从中英文混合到中文进行了切换识别,结果上没有任何影响 。
图4 腾讯云文字识别首页(测试结果)
最后,体验下科大讯飞的文字识别,它的功能展示页和腾讯云一样,通过官方入口搜索很快可以找到 。整体介绍非常简洁,视觉上没有腾讯云的页面色彩多元,但是在实际使用的时候会发现两者的识别结果差距显而易见 。如下图4,默认体验界面,也可以看出,说明非常清晰,对于用户操作指导性很强 。
图5 科大讯飞文字识别首页
出于便于效果对比的目的,拿和腾讯云测试中使用的同一张脑图进行上传,发现结果出乎意料地好 。这个好体现在两方面,一是准确率 。内容的匹配度和错别字几乎是没有的,连双引号都完美读出来 。另一方面,是有序性 。识别结果按照从上到下依次读出,标题的位置和细节呈现几近完美,图下图6 。反应速度上,1到1.5秒的样子,转圈圈的标识刚出现右侧出浮现结果了 。
图6 科大讯飞文字识别首页(测试结果1)
除了文字细碎、排布不规则的脑图,又拿了一个手机拍摄的照片进行进行识别测试,发现仍然非常精准,连照片中电子显示屏上的文字都很清晰被识别了出来,如下图7 。
图7 科大讯飞文字识别首页(测试结果2)
试了一圈下来,科大讯飞的图片文字识别功能体验真的算极度优秀 。诚然,百度云的效果因为需要技术加持无法从前端测试,很难形成直观的对比,不过就和腾讯云的图片文字识别比较而言,对于用户选择意愿度真的是No.1了 。
-- 展开阅读全文 --

    推荐阅读