不要披着算法的高科技外衣侵犯个人隐私
我要纠错【字体: 默认 】【打印【关闭】
来源:法制网发布时间:2019-02-01 11:54:38

张有义

算法这个词汇,已被越来越多的人知道。

但算法究竟是什么,怎么来的?不要说互联网上的小白用户,就是资深的非技术流的研究人员也很难说得清楚。不是吗?人们感知算法的最初表现,就是当一款APP获知了你的地理位置、你的购物习惯、你经常输入的关键词等等之后,它们便会拼命给你推送一些你根本不关心的信息和广告。当大家习惯成了自然,并被舆论裹挟着认为这就是技术进步的时候,悄然间,你个人隐私的数据被他们作为了牟利利器。

技术无罪,这句话本该没什么歧义,譬如算法,其技术本身是中立的。但问题就出现在过度和粗糙两个关键词上,也就是过度收集用户信息,粗糙推送新闻和广告信息。

“大数据时代,没人知道哪些数据会成为未来商业发展的重点,所以,拥有足够多的数据才是重点。搜集的数据越多,营销价值就越大。”这是新华社记者在采访中听到来自大数据产业中最多的一句话。由此也揭示了一些APP过度收集用户信息的动力所在。

我们并不支持用户过度自我保护,因为在如今的互联网时代,用户已经无法避开大数据且自身就有对大数据的需求。创新是网络产业进步的不二法门,过度强调保护,会抑制创新,从而降低大数据为用户带来的整体福利。但我们一定反对利用算法等技术毫无底线地过度收集用户个人隐私数据。

近日,中央网信办、工信部、公安部、市场监管总局四部门宣布,将从今年1月至12月在全国范围组织开展APP违法违规收集使用个人信息专项治理。四部门联合发布的公告明确表示,APP运营者收集使用个人信息时,不得收集与所提供服务无关的个人信息;收集个人信息时要以通俗易懂、简单明了的方式展示个人信息收集使用规则,并经个人信息主体自主选择同意;不以默认、捆绑、停止安装使用等手段变相强迫用户授权,不得违反法律法规和与用户的约定收集使用个人信息。

在此,笔者特别想强调,在整治APP收集个人隐私数据的行动中,有关部门应当着力研究对算法的规制。因为算法在带给用户便利的同时,已经超出一般APP所使用技术来收集用户隐私信息数据,并呈现了算法技术越成熟,侵权行为越隐蔽的趋势。

提到算法,我们不得不提今日头条,有人戏称这款产品为算法的开山鼻祖。今日头条这么描述自己,它是北京字节跳动科技有限公司开发的一款基于数据挖掘的推荐引擎产品,为用户推荐信息,提供连接人与信息的服务的产品。

分析今日头条的产品特色,百度百科上是这么描述的,它基于个性化推荐引擎技术,根据每个用户的兴趣、位置等多个维度进行个性化推荐;根据其社交行为、阅读行为、地理位置、职业、年龄等挖掘出兴趣。通过社交行为分析,5秒钟计算出用户兴趣;通过用户行为分析,用户每次动作后,10秒内更新用户模型。根据人的特征、环境特征、文章特征三者的匹配程度进行推荐。

或许这就是算法。在这里我们特别申明,我们只是借今日头条对算法的描述来印证算法的含义,而无指责之意。问题是,当算法成为风口之后,已经有越来越多的公司在应用算法或者打着算法的高科技幌子,行侵犯个人隐私之实。

法律法规的规制作用在大数据保护中都已滞后,在算法时代,就更显苍白了。

第一,传统上,保护用户个人信息遵循“告知和许可”原则遭遇到挑战。有专家指出,用户个人信息不再只用于收集时的用途,其潜在价值更多地源于二次开发以及在此基础上的创新利用。信息的转移和再开发、再利用更加频繁,同时也构成风险的主要来源。“告知和许可”原则关注用户在收集前的一揽子许可,对信息转移后实际使用者的责任关注不够。在算法场景下,更有狭隘之嫌。

第二,应重点推进用户隐私采集的“最小够用”原则。

所谓“最少够用原则”,是根据《信息安全技术个人信息安全规范》规定,即除与个人信息主体另有约定外,只处理满足个人信息主体授权同意的目的所需的最少个人信息类型和数量。在算法场景下,这个原则已经形同虚设。因为算法更强调,通过收集、汇聚、分析个人信息,对某特定自然人个人特征,如其职业、经济、健康、教育、个人喜好、信用、行为等方面做出分析或预测,形成其个人特征模型。这种对用户画像的行为,有时候会造成对用户的实质性伤害。只有特别和重点推进“最少够用”原则在算法场景下的应用,或许才能起到一定制约之作用。

第三,尽早确立数据接口分享安全评估规则。

在最近抖音与微信的数据接口争议中,一个显著的问题是,微信怀疑,微信在抖音APP授权登录后,帐号被无感知地推荐给大量微信及QQ好友,甚至二度好友,“这给用户带来极大的隐私安全困扰。”在大数据时代,在算法盛行的环境里,对于类似微信这样的庞大数据体,如果不能鼓励他们确立和实施数据接口的分享安全评估规定,后果可能难以想象。

第四,尽早确立优秀的行业通用准则。

2018年12月27日,腾讯公司发布《腾讯隐私保护白皮书》。

第五届世界互联网大会上,马化腾表示,“腾讯不能套用很多其它公司的做法,把数据直接去任意打通。因为在我们的平台里面,大量全部都是人和人之间的通信、社交行为数据,如果说数据可以任意打通,给公司业务部门或者给外部的客户用,那是会带来灾难性的后果。”

腾讯大数据法务合规总经理王小夏介绍,腾讯搭建跨部门、跨业务、跨系统的数据和隐私保护团队,希望通过科学规范的安全管理流程和健全的安全技术体系,充分保障用户的知情权,实现用户对个人信息的控制,为用户创造一个安全可靠的在线环境。

从腾讯的表态可以看出,他们没有按照“数据和算法决定论”的思路行事,而是反其道。从长远来看,从目前对用户个人隐私数据侵权形势来看,腾讯的做法应当值得推广。

除了腾讯,2018年8月,蚂蚁金服也发布了自己的隐私白皮书。

通过腾讯和阿里的上述报告,可以看到,用户采集后的全生命周期管理、合作伙伴调取用户数据前应取得用户同意等隐私规则,同时被两大巨头认可。

笔者在此建议,一些成熟互联网公司优秀的做法和沉淀下来的经验,应当成为行业惯例,在更多的互联网公司中应用,从而抑制算法的无限膨胀。

第五,除了上述几个原则,去标识化、匿名化和公开透明原则等技术规范,亦应成为本次整治关注和评估算法技术优劣的重点。

总而言之,还是回到开头那句话,在大数据时代,执法者和立法者应当清醒地看到,一些打着诸如算法等高科技幌子实际上毫无底线不断侵犯用户隐私权利的行为,应该得到遏制和抵制。

(作者为资深互联网法治研究媒体人)

(责任编辑:杨卓)