法治号 手机版| 站内搜索

网上有害信息举报

“公开数据”的流动和使用应鼓励,数据孤岛只会阻碍公平竞争

2023-09-18 15:49:01 来源:法治网微信公众号
分享:
-标准+

“数字经济不正当竞争行为的监管与规制”专题系列之一

“公开数据”的流动和使用应鼓励,数据孤岛只会阻碍公平竞争

□ 黄武双

当前,随着大数据、云计算、生成式人工智能等互联网技术的创新应用,人类正在进入到一个数字经济时代。在我国,实施国家大数据战略、建设数字中国、发展数字经济也已成为国家的战略选择。截至2021年,我国数字经济规模体量已连续多年创出历史新高,稳居全球第二,是引领全球数字技术创新和数字经济发展举足轻重的力量。

公平竞争,是现代市场经济的灵魂和本质特征,也是推动数字经济高质量发展的关键和重要前提。但在激烈的市场竞争过程中,一些平台企业间的不正当竞争、低水平竞争、重复竞争、恶性竞争等,则会妨碍数字经济市场循环畅通和新发展格局构建。

面对新形势新任务新挑战,目前我国正在着力通过加快构建数字经济公平竞争治理体系,提升数字经济竞争治理效能,打造市场化、法治化、国际化数字经济营商环境,促进大中小数字企业融通发展,持续释放数字经济强大潜能和创新动能,让数字经济真正实现规范健康持续发展,从而为我国经济社会高质量发展和中国式现代化注入不竭动力。

那么,数字经济时代,哪些可能涉及不正当竞争的行业现象值得注意?哪些目前行业内仍存在争议的法律边界需要厘清?哪些制约数字经济市场良性发展的堵点塞点淤点需要加快治理?围绕相关专业话题,近期,法治网研究院将约请多位法律专家展开研讨,陆续刊发“数字经济不正当竞争行为的监管与规制”系列文章,以期辨法析理、正本清源,促进数字经济公平竞争,推进法治化规范化数字经济公平竞争市场秩序的建设。

互联网平台的数据分为公开数据和非公开数据。凡是没有采取技术保护措施,通过爬虫技术可以抓取的数据都属于公开数据;与之相对应,凡是采取了技术保护措施的数据,就属于非公开数据。

为了维护互联网市场的公平竞争,贯彻互联网开放、共享的核心与精神,互联网平台应当满足互联互通的功能,针对没有采取技术措施保护的数据,其他平台是可以自由访问和通过网络爬虫自由抓取,其中涉及个人身份等敏感信息的,在使用事前应当做去标识化和匿名化处理。对于采取技术保护措施的信息,不得破坏该技术保护措施来抓取数据。在我国,破坏技术措施抓取数据,可能涉嫌违反《中华人民共和国刑法》第二百八十五条规定,其结果可能构成非法获取计算机信息系统数据罪。

抓取互联网平台公开数据,应不应当认定为不正当竞争?

自数据被列为生产要素以来,对于数据价值的挖掘和利用越来越深入。公开数据作为重要的数据资源,对其合理的开发与利用,才能充分发挥其价值。数据本身不符合所有权的原始取得和继受取得要件,因为数据不是由平台从无到有“创造”出来的,而是由网络用户上传到互联网的数据、网络经营者购买的数据和网络用户在互联网上各种活动所留的痕迹信息的记录数据。若要径行创设数据所有权,既不符合法理,也将造成以下负面影响:

1.阻碍其他主体向市场提供创新产品的可能。将从其他平台抓取数据的行为认定为不正当竞争,将阻断了其他主体利用这些数据开发出新产品、新服务的可能性。有些产品或服务创新的基础就是借助于某种类别的数据,而拥有这样想法的人通常没有数据基础,必须使用他人所收集的数据才能完成产品或者服务创新。

2.阻碍人工智能产业的发展。众所周知,人工智能算法的改进依赖于投喂大量的数据,如果什么数据都要靠人工智能开发者自己去收集的话,而人工智能开发者在数据收集方面又不具有能力,因而会影响人工智能产业的发展。

3. 阻碍数据的流通。认定从其他平台抓取数据的行为构成不正当竞争,意味着平台抓取数据后实际上拥有了所有权,让每个平台抓取的数据成了数据的孤岛,不能流通。数据只有在流通过程中才能发挥数据的最大价值。在不能流通的情况下,就不能为充分使用数据研发新产品创造条件。

4.阻碍公平竞争。爬虫几乎可以爬取任何网站的公开数据,即只要没有对网站所收集的数据采取保护措施,都是可以抓取到的。数据一旦成为了不可流通的孤岛,意味着数据作为市场基础资源的作用,不能发挥出来。在不影响数据收集者市场竞争优势的情况下,应该鼓励其他平台对数据进行充分利用,这样才能在公平竞争的环境下使消费者福利最大化。

目前从各家互联网平台采取的技术保护措施实践来看,主要有两种做法:一是对不受欢迎的其他网络平台设置黑名单来阻止其抓取数据;二是将允许抓取其数据的其他网络平台放在白名单中。

笔者认为,可以对那些不听劝阻抓取隐私信息和长时间在平台抓取数据造成网络堵塞的其他平台放在黑名单中,通过robots.txt文件等来限制特定爬虫抓取数据,这是互联网领域的惯例,列入黑名单的爬虫是有限的,并不会妨碍多数平台的爬虫自由抓取数据。而设置白名单就显得不是很公平合理了,因为设置白名单就是对不同的网络平台采取歧视对待,只有在白名单之内的网络平台才可以抓取数据,不在白名单里的平台不能抓取数据。这就相当于剥夺了不在白名单里的平台抓取数据的可能性,由于白名单不可能穷尽所有的平台,因而会导致多数平台失去了进入其他平台抓取数据的资格。

互联网平台数据有关竞争行为的正当性边界在哪里?

仅抓取公开数据而不以与原平台同样的方式使用数据,不影响收集数据平台构建的竞争优势。数据的价值在于使用,以与原平台不同的方式使用所抓取的数据,对原始数据进行深度开发,数据产品具有功能用途的特指性和确定性,而且当其被加工处理到不具有数据特征时,就可能超出原始数据的范畴,与原始数据分属两个不同的市场,二者之间没有竞争关系,不存在使用利益的冲突,因而无需禁止基于原始数据的开发和利用。这种对数据的使用行为应该受到鼓励,因为增加了消费者的福利又不影响原平台的市场利益。

事实上,我国司法机关此前通过不少判决形成的以下规则很值得推广,即:只要从其他互联网平台抓取的数据不以与原平台相同或者实质相同的方式使用,就不构成不正当竞争,反之则构成不正当竞争。如果允许以与数据来源平台相同或者实质相同的方式使用数据,则会在几乎没有数据搜集成本的情况下与数据来源平台争夺市场,损害数据来源平台所累积的竞争优势,这是法律要禁止的原因。

而在《中华人民共和国反不正当竞争法》第一条立法宗旨条款中,对此也已做出明确规定,即:“为了促进社会主义市场经济健康发展,鼓励和保护公平竞争,制止不正当竞争行为,保护经营者和消费者的合法权益,制定本法。”因此,不管是在制定竞争政策还是制定司法判决标准,都应当考虑到在这种政策或者判决的效果是否与反不正当竞争法第一条规定“鼓励和保护公平竞争”“保护经营者和消费者的合法权益”的立法宗旨相符。

值得肯定的是,越来越多有关不正当竞争纠纷的判决已经将“鼓励和保护公平竞争”“保护经营者和消费者的合法权益”纳入考量因素。是否保护经营者和消费者合法权益,乃是鼓励和保护公平竞争的前提。公平竞争的最终结果是增进了消费者福利。这一观点在某份生效判决中已明确表述为,“被控行为未能完全避免用户产生混淆,但也会在一定程度上增加消费者的福利,为用户提供了更多的选择。”

如何判断互联网平台数据竞争行为的正当性?

反不正当竞争法第二条,可以为判断这种类型的不正当竞争行为提供法律依据。

经营者在生产经营活动中,应当遵循法律和商业道德。这里所称的商业道德主要体现为商业惯例。我们要回答的问题是,在互联网领域是否存在不得从其他平台抓取数据的惯例?答案是否定的。尽管我国在互联网实践中存在一些公约,但是这些公约尚不能成为行业惯例。

所谓行业惯例,必须是体现了经营者、消费者和社会公众利益的行业交易规则。而目前互联网领域的各类公约,基本上仅有经营者参与制定,没有体现消费者和社会公众的利益,因此笔者认为,互联网领域的公约不能理所当然地成为行业惯例。这些公约必须经过司法审查,看其是否兼顾了消费者利益和社会公众利益,只有兼顾了这两种利益,才能成为行业惯例。

而在缺乏行业惯例的情况下,应该以效能竞争理论来判断行为的正当性。所谓效能竞争,即以自己的商品或服务的优质优价或自己经营活动的业绩展开竞争。如果竞争者提供创新商品或者服务,使消费者能够享用创新产品或者服务,这就符合效能竞争理论。效能竞争理论正是兼顾了经营者、消费者和社会公众的利益,所以符合行为正当性标准。

(作者系华东政法大学教授、博士生导师)

编辑:冀春雨