非法使用高校毕业生就业数据构成不正当竞争
法院:阻碍大数据行业正常有序发展
来源:民主与法制时报 □本社记者 任文岱
2014年6月,广州爱拼信息科技有限公司、深圳爱拼信息科技有限公司(以下统称爱拼公司)研发首创“662所高校学生毕业十年就业薪酬和就业行业分析”数据产品,公开发布、售卖后便受到广泛关注。
2015年至2017年,这一数据产品被北京学而思教育科技有限公司(以下简称学而思公司)、北京世纪好未来教育科技有限公司(以下简称好未来公司)、亿度慧达教育科技(北京)有限公司(以下简称亿度公司)在其经营的高考派网、高考派App、高考帮App、好未来高考派微信公众号中以不正当手段使用和售卖。
2017年6月,爱拼公司开启了维权之路,将上述公司告上法庭,经历一审、二审、再审,历时五年,这一数据权益纷争案件才画上句号。
今年,该案入选北京知识产权法院涉数据反不正当竞争十大典型案例。北京知识产权法院表示,此案被告一方面直接损害了原告因销售涉案数据所产生的经营收益,也在一定程度上导致原告的交易机会、销售收入及用户流量等经营利益受损;另一方面,从长远看,也将逐步降低大数据行业研发者进行技术创新和投入的积极性,破坏竞争秩序,阻碍大数据行业的正常、有序发展,并最终造成消费者基于大数据产品和服务所享有的社会福利的减损。法院明确,未经许可直接将他人开发的大数据产品进行使用和销售,构成不正当竞争行为。
采取爬虫技术获取的数据是否合法
“爱拼公司研发涉案数据产品所使用的原始数据来源涉嫌违法,是通过数据爬虫技术非法获取的。”在一审中,好未来公司等被告主张原告爱拼公司获得原始数据的手段是非法的,且无权使用这些原始数据,基于这些原始数据产生的涉案数据不合法,因此不能就此主张数据权益。
爱拼公司表示,原始数据是来自于互联网中用户自行向社会公众公开的信息,采用爬虫技术自动获取,仅是为了研发涉案数据而收集。并且,在爬虫抓取原始数据过程中,如果网站设置了robots协议(爬虫协议)或采取了其他限制抓取行为的措施,爱拼公司不会对该类网站数据进行抓取。
一审法院查明,爱拼公司研发涉案数据的原始数据主要来自于招聘平台的简历、招聘信息等互联网中的公开信息。通过爬虫技术,将访问的网址预设为爬虫抓取的初始URL地址,从而按顺序访问该URL地址中的简历信息,或者根据“行业”“职位”等关键字获取某一平台的相应简历信息等方式获取网页的源代码信息,再通过设置“薪资”“工作经历”等标签对所获网页源代码中的相关数据进行提取,从而获得研发涉案数据的原始数据。
在庭审中,原被告均出具了58同城、领英网等招聘平台的隐私政策、用户协议及涉及能否使用爬虫技术的robots协议,对涉案数据产品原始数据获取手段合法与否各执一词。
为此,爱拼公司在庭审中提交了2019年6月19日查看的58同城网、领英网、中华英才网、赶集网等网站的隐私政策,以此证明这些网站用户有“公开”简历的权利选项。爱拼公司还提交了智联招聘网的robots协议网页打印件,网页页面显示“notfound”即并无robots协议,并据此主张智联招聘网并不禁止网络爬虫获取相应简历信息。其还表示,在2014年时,大量网站未设置robots协议,爱拼公司也没有违反这些网站的robots协议,采用爬虫技术来获取数据并未违法。
一审法院北京市海淀区人民法院认为,被告未举证证明二原告对于原始数据的获取是通过非法手段获取的,“被告提交的部分平台的用户协议和隐私政策以及领英网和58同城网的robots协议,均是在诉讼过程中获取的相应证据,这些证据无法证明原告2014年涉案数据产品完成之前获取原始数据违反了相关平台的隐私协议或robots协议。”因此,法院认为被告的主张缺乏事实依据,与本案也缺乏关联性,未予采信。
付出智力劳动和经营成本所得数据受法律保护
在厘清采用爬虫技术获取原始数据手段合法问题后,被告就原告是否有权就涉案数据产品主张权益还提出两点质疑:一是原告获取的原始数据是虚假的,由此研发的涉案数据也不具有客观真实性;二是涉案数据侵犯个人隐私及第三方平台的相关权利。
针对原始数据不真实的问题,被告认为,原告宣称其分析了4000万名学生的数据不合常理,并且此类数据报告多采用抽样调查的方式进行,全样本调查不具有现实可能性,且调查报告花费时间长,并非短时间内能够完成,因此研发出的涉案数据也并非真实客观。一审法院认为,涉案数据准确、优劣与否,与原告对涉案数据享有合法权益并无必然关联,故对于被告提出的意见依法不予采信。
庭审中,被告辩称,涉案数据侵犯个人隐私及第三方平台的相关权利。对此,法院认为,从涉案数据的具体内容可以看出,涉案数据是在获取原始数据的基础上进行二次研发的衍生数据,数据本身不涉及任何个人信息和隐私,不存在侵犯个人隐私的可能性,且不会对原始数据或其提供者在市场中产生替代。同时,自2014年涉案数据完成并上市后,原告通过报纸、网络等媒体进行了大量报道和宣传,向社会公示涉案数据的研发过程及成果,从未有任何第三方主体因涉案数据存在侵权可能性向原告主张过权利,也没有证据显示存在该种情况。
爱拼公司表示,研发团队在通过爬虫技术获得原始数据后,还要通过数据清洗、别名识别、脱敏技术等程序,将原始数据整理成标准化的有效信息。然后再运用计量经济学和信息经济学模型,对基础数据进行大数据分析和计算,最终得出涉案数据。
根据证据情况,一审法院认为涉案数据系爱拼公司付出了智力劳动和经营成本所获得,爱拼公司使用涉案数据获取经营收益、市场份额及竞争优势,该种合法权益应受到反不正当竞争法的保护。
非法使用构成不正当竞争
爱拼公司向一审法院提交了一份公证书,将涉案数据与2015年、2017年取证的被告运营平台使用的数据进行比对,被告对这一数据比对结果予以认可。
法院认为,涉案数据经过广泛的宣传推广已经在相关领域中具有了一定的知名度和影响力,并且,被告之一所经营的“高考派网”中亦发布了介绍爱拼公司研发的涉案数据相关文章,故被告公司作为具有竞争关系的经营者,理应知晓原告公司研发、经营涉案数据的事实。而经对比,被告使用、销售的被诉数据与涉案数据一致性的比例极高,且被告亦未举证证明被诉数据的合法来源。
法院认定,在双方存在竞争关系及涉案数据具有一定知名度和影响力的情况下,被告销售被诉数据,获取直接经济利益,并在未经许可及未支付任何对价的情况下利用原告研发的涉案数据,将其作为自身产品对外宣传,获取竞争优势,主观恶意明显。被告的行为损害原告对涉案数据享有的竞争利益,违背了诚实信用原则和公认的商业道德,扰乱了公平、有序的市场竞争秩序,具有不正当性和可责性,违反了《中华人民共和国反不正当竞争法》第二条的规定,构成不正当竞争。
原告诉讼请求中要求被告赔偿经济损失4900万元及合理费用30万元,其主张根据是按照侵权人因侵权行为所获利润进行计算,并采用两种计算方式主张被告的侵权获利均远超过1亿元。但法院根据该案证据,综合认定原告主张的赔偿数额缺乏合理性。最终一审法院判定被告赔偿原告经济损失50万元。
一审判决后,原被告均上诉至北京知识产权法院。北京知识产权法院判决驳回上诉,维持原判。后原告又向北京高院申请再审,北京高院裁定驳回原告再审申请。