爱奇艺葛承志:去伪存真无信不立,爱奇艺如何树立“防刷量”的标杆?

在如今的视频行业,虽说存在钱能搞定一切、小鲜肉高价片酬、收视造假、流量造假等问题。

在如今的视频行业,虽说存在钱能搞定一切、小鲜肉高价片酬、收视造假、流量造假等问题。

但11月30日,在第五届中国网络视听大会开幕式暨高峰论坛上,爱奇艺创始人、CEO龚宇颇有信心的表示:“这些我们还是比较乐观的,只是昙花一现的问题,很快就会过去。”

龚宇的底气并非没有缘由。一方面,他表示要刻意创新,大胆启用新人,给新人机会,它们也确实推出了《中国有嘻哈》、《奇葩说》、《河神》、《无证之罪》、《你好,旧时光》等口碑佳作;另一方面,在防刷量这件事上,爱奇艺不遗余力。

在“视听数据高峰论坛”上,爱奇艺数据研究院院长葛承志发表了《去伪存真无信不立的网络视听节目监测》的演讲。令小娱好奇的是,自爱奇艺CTO汤兴提出“四板斧”后,爱奇艺的防刷量系统取得了哪些升级?做了哪些举措、成效如何?会后,我们对其做了独家专访。

1.道和魔总是此消彼长:爱奇艺是如何“防刷量”的?

刷量早已成为公开的秘密。

爱奇艺甚至披露过,自2015年后,影视剧“刷量”现象大肆增长,绝大部分情况都出现在一些热门剧和自制剧身上,甚至有一部剧超过90%的数据都是盗刷产生的。

很多人都认为道高一尺魔高一丈、很难解决,但葛承志坚信:“魔和道总是此消彼长的关系”。

爱奇艺CTO汤兴曾介绍过,爱奇艺自成立便组建了专业技术团队,进行数据监测系统研发,自主研发了全球领先的实时风控系统和实时防刷系统,能够通过四级防护体系防刷。

所谓“四板斧”,指的是一级实时风控、二级实时反刷量、三级离线清洗、四级业务校验。

上述概念相对宽泛,那从技术层面来说,爱奇艺究竟是如何“防刷量”的呢?

据葛承志介绍,刷量的方式是直接刷数据端的pingback接口,即通过服务器刷数据;或者靠刷关键词、伪造用户的cookie、内嵌播放页面到用户正常流量的页面来实现,方法很多。

如何应对呢?第一种,收集并整理黑名单IP和安全信息校验。“比如说就是CBN数据中心的IP地址,或者设备信息,把这些设备信息记录下来,这些设备信息出来的访问量一律不记录。”

除了可结合业务特征,评估数据真实合理性。爱奇艺还强调通过用户行为大数据来交叉识别刷量行为。如果你掌握的用户行为越多,你能够掌握用户观看长视频、短视频的行为。目前,他们已经打通了百度的数据。葛承志告诉小娱:“如果一个用户只看视频,只看那些剧,其他的搜索or消费行为都没有,那很有可能这个用户是伪造的,这个流量本身也是虚假的。”

目前,他们正不断升级数据库和用户模式的行为识别库。用大白话来说:“什么样的行为是人的行为,什么样的是机器的行为,这背后的算法是需要不断的学习,去识别的。”

而这个过程最大的考验是,你能否收集到足够多的数据、机器识别的效率是否足够高。目前各大视频网站防刷的能力不一样,但葛承志信心十足:“我对我们技术肯定是最有信心的。”

2.防刷量任重而道远?目前已公开网大数据,未来不排除公开更多数据

有了上述技术的保驾护航,爱奇艺做了哪些努力呢?

以刷量重灾区“网大”为例,爱奇艺是市场上首次公开网大的分帐数据,可谓魄力十足。

葛承志告诉小娱:“网大本来就是分帐的业务,我干脆不如告诉大家到底我们给合作方分了多少。”什么意思呢?据介绍,他们一定要让市场上投资方和市场行业方看看爱奇艺的网大排头名的前十、二十部网大电影每天能够给合作方分多少钱,上线七天、十天、二十天累计能分到多少钱,“这是市场最真实的指标,是跨越了播放量的指标。”

葛承志

值得一提的是,随着爱奇艺防刷量措施不断推出,越来越多的行为者发现刷完了之后好像量也没有长,现在爱奇艺在网大等领域的“刷量情况”也已经在好转。

既然网大可以公开,那是否有一天,爱奇艺能公开某一些更内部、更立体的数据呢?

对此,葛承志表示完全有可能。但前提是“我放出这个数据到底为了什么、爱奇艺能得到什么。我们放出来网大的数据,一方面是让那些不信任网大的人看到网大还不错。另外一方面是让那些盲目投资网大的人看到网大到底是什么东西。这个业务只有走向一个良性的发展。”

3.“刷量”横行的背后,除了提起法律诉讼,爱奇艺还提出了哪些高招?

为了表明“防刷量”的决心,爱奇艺甚至已经采取了法律措施。

今年8月,因为刷量,爱奇艺曾将杭州一家公司告上法庭,认为其刷量(在短时间内迅速提高特定视频内容访问量)行为侵犯了其合法权益,构成不正当竞争,索赔500万。

这也是国内首例因“刷量”而引发的不正当竞争案件,一经曝光颇有杀鸡儆猴的震慑力。

葛承志告诉小娱,有些地方的法院不敢接,因为太新了。但现在有一家接了,就是开了先河。

他的态度非常坚定:“还好已经有了第一步。就跟当年的淘宝刷单一样,已经被定为犯罪了,抓到是要坐牢的。刷单是犯罪,为什么刷量不是?道理上、逻辑上来讲应该是,只不过看能不能找到相关的法条来处罚。先从民事的开始做,民事的成功了,下次再告诉刑事的。”

关于未来要能否根治“刷量横行”的顽疾?

葛承志告诉小娱,第一,最关键的是有一个基于行业共识的标准,这个标准要尽可能详细,到底什么算,什么不算。算的话,包括多种情况,要讲的非常清楚,不光是播放量、时长等各种方式,有公开的标准。

其次,他也强调要有透明可追溯的监测数据。据介绍,像移动APP端,他们会通过SDK植入的方式,第三方想拿到数据依然没有可行的解决方案,但其实PC网页端很好拿,这都是可以公开出来的,并且可以反向追溯的。

不过,移动APP端以及所有APP端这一点都很难,因为它不是走的HTTP的协议,背后是其他协议,而且背后直接取的是视频文件本身,没有连接地址可言,所以如何向第三方证明这一点依然是这个行业需要解决的问题。

第三点,他呼吁行业协会除了要树立标准,更重要的是对执行标准的机构进行审计。葛承志告诉小娱,以美国的M2C作为对标物,它好比是奥运会的尿检机构。“你拿了冠军,我要检测你是不是服药了,我不但现在检测你是否服药,以后会突然飞过来看你是不是服药了。这种可信度不是靠行政指定的,而是靠他通过严格的技术、流程各方面的审计。”

末了,他也满怀期待地表示:“中国需要自己的M2C。毕竟互联网行业已经发展了十七年,我们通过什么样的方式能够让那些真正提供真实、可靠并且科学数据服务的服务方站出来,让那些做得不好的能够督促他们做得更好这样的审计和监督机制也应该存在。”

分享至:

您可能感兴趣的文章

参与讨论