李开复和马云 到底谁坑了谁

祸从口出。9月12日,HICOOL全球创业者峰会上,李开复的这句“无心之谈”像是一颗雷,炸开了AI隐私安全的马蜂窝。

牵连进来的两家公司,一个是国内最大的人脸识别技术服务商,一个是国民级金融数据平台,坐拥10亿用户,掌握着你“从襁褓到坟墓”的几乎全部人生信息。

我猜,李开复本意是想以旷视为例,介绍创新工场对创业公司的扶植,但无心插柳,这番关于用户隐私的“梦幻联动”一出口,浓重的火药味立刻惊动了各方公关。

随后,各方出面“否认三连”。蚂蚁集团:未与李开复先生有过接触;旷视:我们不掌握个人信息;李开复:口误,深感歉意。

在蚂蚁集团的声明中,有这样一句话值得注意:双方过往合作仅限旷视科技授权其图像识别算法能力给蚂蚁单独部署和使用,不涉及任何数据的共享和传输。

有专业人士指出,所谓“单独部署”在技术上可行,也是行业实践中的常规操作。

一般而言,算法公司会提供一个接口,只要调用接口就能训练算法模型。在这个例子中,旷视有可能就是将接口给到蚂蚁,蚂蚁在自己的服务器上训练模型,这样一来,旷视无法接触到用户的直接隐私,身份信息被泄露的可能性相对较小。

但显然,这个解释很难让广大网友信服。毕竟蚂蚁和旷视深厚的渊源之下,“共享数据”这件事看起来理所当然。

资本上,阿里是旷视科技的最大股东。根据旷视科技此前计划在港股上市时的招股书,蚂蚁金服直接持股15.08%,此外,通过淘宝中国间接持股14.33%,两者相加,阿里系合计占有旷视近30%的股份。

业务上,双方捆绑也非常紧密,目前支付宝刷脸支付的技术方案正是由旷视科技提供。

不买账的网友们在旷视的声明下评论道:“懂的都懂”。

四个字,意味深长。

有多少种方法“卖”掉你的脸?

不管这场“人脸数据罗生门”中谁是谁非,也不管你愿不愿意接受,我们都在加速进入一个“生物特征识别”的年代。

指纹解锁、刷脸支付、声纹密码、虹膜识别……这些人工智能算法的工具,正在逐步替代传统密码,成为我们在现代社会中的通行证。

而基于机器学习的生物识别技术,有一个特性:它需要数据来“喂”。“喂”得越多,“喂”得质量越高,算法才能跑得越精准。机器学习界有一句很出名的话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

近年来,在人工智能公司数量大爆发,各家对数据的争夺自然愈演愈烈,人脸数据价格也水涨船高。曾有人脸识别算法工程师透露,收集3D人脸数据的成本,一天就会花掉几十万。

为了获取数据,数据标注公司可谓花样频出。

比如,《财经》就曾报道,一些公司会打着“台灯测试”幌子,要求兼职人员配合摆出各种姿势,用隐藏的摄像头拍下来。兼职人员在完全不知情的情况下,就将自己的脸完整交给了摄像头。

成本压力之下,一些AI初创公司也不得不迈向灰色地带。

你发在微博上的美照,逃不过爬虫的抓取;各类APP打着“变脸”、“算命”的旗号,疯狂收集人脸信息,这些数据存在后台或者云端,最终的去处往往都是各类“数据黑市”;即便公共场所的人脸识别也不见得100%安全,这些相对“粗糙”的数据,虽然不能用来训练算法,但却能拿来验证算法。

即便不主动“出卖”,你也很难保证自己交给APP的信息,不会因安全漏洞而被动泄露。

去年2月,一家深圳AI公司被爆发发生数据泄露事件,超过250万人的核心数据可被获取,680万条记录泄露,其中包括身份证信息,人脸识别图像及GPS位置记录等。

关于“隐私安全”的讨论早就是老生常谈。如果说几年前,我们还在为个人隐私流失而感到担忧,那么现在,似乎绝大部分人都已经接受自己在大数据时代的新属性——“工具人”。底线一降再降,保护隐私什么的,那是奢望。只要别把潜规则翻到明面上,大数据的“吃相别太难看”,大家就能相安无事。

一个最明显的例子,是互联网上对“隐私交换便利”这一论调的态度变化。从一开始的出离愤怒,逐渐变得麻木。在没有其他选择之下,一些声音开始呼吁大家“理性讨论”。

可问题在于,我们拥有不用隐私交换便利的权利吗?

我们还有选择吗?
几年前,李开复预言中国将在AI时代超越美国,当时他给出的理由中,除了基础设施、人才培养之外,还有一个重要原因——他认为中国人对隐私的「开放态度」,将驱动中国AI技术快速发展。

用李开复的话说,如果数据是新时代的石油,那么中国就是新时代的沙特阿拉伯。

听起来颇为讽刺,但这的确是AI产业的现实矛盾——公开数据库永远“喂不饱”一个完美的算法,来自“阳光”下的数据又相当有限。

这也不是哪一国的问题。

在隐私意识相对更强的美国,我们看到的是IBM、Google等公司,它们迫于抗议和舆论压力,相继宣布停止人脸识别业务。而在不被关注的角落,也有诸如Palantir等一类数据分析公司,通过强大的数据挖掘能力,让你在算法面前“一丝不挂”。

针对刷脸支付,监管部门也在加快顶层设计。去年,中国人民银行印发《金融科技(FinTech)发展规划》,对隐私计算、数据标签、模式识别等技术做出规定。

但法律相对技术的滞后性,决定了我们还要在灰色地带摸索相当一段时间。

我们之所以焦虑,是因为在大数据时代,人脸、指纹、声纹等不再是个人识别信息这么简单,它们与我们的银行账户、通讯邮箱、社会身份挂钩,成为一种价值更加多元的特殊“资产”。

在这场产业变革的滚滚大潮中,相对于巨头公司,个人永远是弱势的一方,我们卸不掉支付宝,也躲不过那些没必要的人脸识别,唯一能拿起来的只有“信任”这张选票。

前不久,“国内人脸识别第一案”开庭。一位大学教授因拒绝刷脸入院,被取消了年卡会员资格,此后教授将动物园告上法庭。

在法律落地、产业洗牌之前,这一桩诉讼可能改变不了什么,但至少这是一个开始,我们期待一个“隐私与便利可兼得”的时代。