Gmail现在每天可以拦截1亿封垃圾邮件


你知道吗,员工平均只花5%的时间进行创造性的头脑风暴?根据谷歌的研究,这是真的 。像跟踪、研究和分析、最后的润色、格式化和整合反馈——大部分是通过电子邮件完成的——这样的任务会挤掉创意 。事实上,平均每个人每周要花11个小时来筛选工作信息,每天大约有1450万封垃圾邮件发送(或接收),这只会让人更加分心 。
【Gmail现在每天可以拦截1亿封垃圾邮件】幸运的是,对于每月使用Gmail的15亿人以及Gmail到G套件的500万家企业的员工来说,好消息是:谷歌正在关注着你 。早在2015年,声称块99.9%的垃圾邮件,网络钓鱼,和恶意软件的帮助下从到达账户人工神经网络(数学函数层松散模仿大脑神经元),同时确保分享oflegitimate邮件,无意中最终在垃圾邮件文件夹保持在0.05%以下 。(2012年,垃圾邮件的比例是99% 。)现在谷歌说,部分由于它的开源机器学习框架TensorFlow提供的“新保护”,它每天可以阻止大约1亿条额外的垃圾邮件 。
该公司此前表示,它保护用户免受每分钟1000万封垃圾邮件和恶意邮件的攻击 。
Gogole反滥用技术部门的产品经理Neil Kumaran在电话采访中告诉VentureBeat:“我们过去利用过(机器学习),(而且)我们也[有]许多规则和基于规则的保护措施 。”“TensorFlow的有趣之处在于,它能够很好地检测剩余的垃圾邮件 。”
这并不是说Gmail工程师没有利用TensorFlow来改进垃圾邮件检测——远非如此 。谷歌在2017年5月的一篇博文中提到了团队向框架的迁移 。相反,据库马兰说,这一最新的里程碑是通过广泛采用TensorFlow和一组更大的“大规模”垃圾邮件分类实现的 。
“Gmail已经保护用户免受垃圾邮件、网络钓鱼和恶意软件的攻击有一段时间了,我们已经利用了各种各样的技术,”他补充说 。
那么,什么样的增量式垃圾邮件能让Gmail更好地转向呢?主要是基于图像垃圾邮件 。图片垃圾邮件在2011年的垃圾邮件流量中占到了8%,文本信息被嵌入到电子邮件所附的照片中——这类照片是电子邮件客户端直接显示给用户的 。它试图绕过文本分析垃圾邮件过滤器和光学字符识别(OCR)工具,其中一些方案相当复杂 。骗子使用模糊处理来阻止OCR工具读取嵌入的文本,或者试图用无意义的单词来误导基于签名的检测算法 。
Kumaransaid TensorFlow在实验中为Gmail团队提供了灵活性,从而允许更快地部署新方法来对抗图像垃圾邮件和其他新消息类型 。
“(垃圾邮件发送者不断使用)新域名——例如,(发送)一些合法的电子邮件,然后开始发送垃圾邮件 。……从历史上看,我们的工作人员一直在利用TensorFlow来捕捉这些信息,”库马兰说 。“它为我们提供了更好的工具,让我们能够更快地进行实验 。”
谷歌长期以来一直依靠用户来判断哪些邮件消息是真实的,哪些不是 。它用这些数据来训练它的人工智能系统 。
Gmail中的“报告垃圾邮件”和“非垃圾邮件”按钮不仅仅是为了显示——它们通知邮件过滤机器学习算法,提高它们检测不需要的邮件和反映个人偏好的能力 。(后一点是为什么有些用户会在收件箱里看到每周的时事通讯,而有些用户则不会 。)它们补充了谷歌的钓鱼检测模型,在某些情况下,当它的算法实时更新时,会延迟消息执行详细的分析 。
库马兰说:“每个人对垃圾邮件的定义可能不一样——对一个人来说可能是好的,对另一个人来说可能不是好的 。”“通过(机器学习)个性化是可能的——(它)在考虑用户的特定偏好方面做得非常好 。”
有些人可能会马上指责谷歌用大刷子给大量电子邮件涂色,但它偶尔也会伸出橄榄枝 。例如,在2015年,它发布了Postmaster Tools,这是一个诊断套件,可以向向Gmail用户发送大量电子邮件的公司暴露发送错误、垃圾邮件报告和其他可能有用的分析 。
山景城公司声称,最终,它将努力保护用户和组织免受网络的侵害 。2015年McAfee的一项调查发现,97%的人不能正确识别网络钓鱼诈骗邮件——如果成功,中等规模的公司平均损失约160万美元的邮件 。
如果一切按计划进行,垃圾邮件检测算法将不会是TensorFlow正在推进的唯一事情 。库马兰说,该小组已经在测试改进的钓鱼和恶意软件过滤模型,希望在未来详细说明 。库马兰说:“希望今后我们也能发表类似的博文 。”
在消息过滤领域之外,AI正悄悄进入Gmail新老版本的各个方面 。2016年,谷歌推出了智能回复(Smart Reply)功能,该功能使用机器学习来建议回复电子邮件,随着谷歌将智能回复引入hangouts聊天等平台,智能回复功能还在不断完善和改进 。(根据谷歌的数据,智能回复每天处理数亿条信息,超过10%的电子邮件回复是通过手机完成的 。)最近,谷歌推出了Smart Compose,它使用人工智能来自动完成单词和短语,以及“轻推”(nudge),这是一个由机器学习驱动的功能,可以提供后续电子邮件提醒 。这些都是除了高优先级通知之外的,高优先级通知是一种将电子邮件通知限制为“重要消息”的设置,而时事通讯则是退订建议 。

    推荐阅读