苏莉安 - 别傻了,数据不是这么玩的 - 知乎

今早有人告诉我,知乎又开始扒皮了,目标是最近新崛起的一个混血姑娘

@Negar Kordi

原始地址:这个『混血』的姑娘,你的段位太低了

作为一个过气网红,特别还是曾经在知乎以数据分析出名的,我看到这种级别的扒皮会感到脸上发烧。长此以往,「数据」在知乎都会变成拿出来会被人嘲笑的玩意。

我之前搞的僵尸粉分析,是以数百万级的用户和上亿的关注关系做基础,寻找出僵尸粉异于正常用户的「不可能」,绝不是通过点开关注列表扫了几眼就得出的结论。里面的截图和例子是先仔细分析过又挑选出来的,不是拿一张图当证据的。

不仅这几张截图,连给板凳党的一些参考数据里的数字也并没有什么参考价值。 他用

@Negar Kordi

@Lydia

做对比。然而前者是最近一个星期刚红起来的新锐,引来的新粉甚至有很多是从微博观光过来的;后者是老人了,早年点过赞的很多用户在知乎混了一两年,多少也写了几个答案,三零率完全无法直接对比。

要对比的话,就拿整个2015年12月的所有热门答案一起对比,分析一下点赞三零率平均是多少,她的答案是否有很大异常。

对于点赞用户结构的分析,我这里倒有两张简单的表格可以参考。

第一个是她所有500赞以上答案的0赞、0关注、100赞、100关注、1000赞、1000关注、10000赞、10000关注的用户占比。

各答案标题太长,就直接用赞同数代替了,不造成误解就行。

最近我没有分析过全站用户数据,可能短期内也不会有,但根据之前的旧分析结果,这种数字对一个新人来说,并没有什么稀奇之处。

另一个对僵尸粉有价值的数字,是每个答案前200赞同者的类型分析:

注意,这个数字不是所有赞同的,只是前200人的

知乎热门答案必须是通过大V节点进行传播才能形成(但反之不成立,大V点赞的答案未必个个能热门)。如果一开始就全靠僵尸粉圈赞,那必然会使早期点赞者的结构发生异常。但从这表格来看,大部分答案在很早就有了足够广泛的传播节点。

当然,如果是说她聚集了一堆大V故意来点赞宣传,那就需要更有力的证据了,至少现在我还没看到这种证据。

原文提出的另一个疑点就是看知乎没有收录。

这完全是瞎。今天是2015年12月19日,按被关注数排序,排在199位。

另外,有一个很多人还不知道的技巧,右键单击这里,输入要查询的ID,比如negar-kordi,就能直接看到了,不用费劲去找排行榜:

至于说什么微博炒作。也不是没有可能,但作为证据是远远不够的。现在微博极度缺乏原创,才造就了那么多专门搬运知乎答案的营销号。一有热门答案就像吸血蚊子一样扑上来,互推互转,目的还是他们自己的人气。知乎随便哪个大V或写过高票答案的新人,几乎都有不知情的情况下被微博微信转得到处都是的经历,维权还来不及,何况主动推了。

那么,我写这一篇是专门为人洗白吗?当然不是。就像当初方韩战那样,反对方舟子的一方,大多不是相信韩寒没有代笔,而是方的质疑手段太过拙劣和偏激。倘若有确凿的实证,早就把韩寒打成郭敬明第二了。我近半年工作忙碌几乎都不在知乎活动了,并不认识这位混血姑娘,只是偶尔被推到首页来才知道有这么个人。

知乎内部应该有更可靠的数据与僵尸粉分析功能,不妨让悟空查查看,如果真有,严惩就可以。如果没有呢?这一轮人身攻击怎么算?

作为普通用户,我十分不希望知乎上有人靠这么轻率的质疑就全方位对某个人进行攻击,特别是还动用了「数据」这个平常人不明觉厉的东西。在知乎急速扩张的现在,随便哪个人都有可能被僵尸粉或一些观光性质的三零用户点赞及关注,这种质疑可能落在你我任何一个人头上,总有不明真相的群众会因此轻信。

要说数据的话,我这里一直有千万级的用户以及他们的关系可以用来分析。倘若也肯这么轻率地下结论,恐怕给90%以上的大V都能精心炮制一些「罪证」出来。但意义何在呢?打倒一个人或一群人,目的是让知乎变得更好还是更乌烟瘴气呢?

补充:刚在首页看到有人痛斥原作者昨晚说要搞个大新闻然后让大家预先点赞,欺骗了大家的感情云云。我对这种说法也很嗤之以鼻。主动拿自己的信誉为别人背书,那辜负了你自己粉丝的信任又该怎么算呢?

这几年,我至少给500个以上的「XX赞就更新」、「占坑以后答,求赞」点了反对和没有帮助。希望看到这篇专栏的人以后也这么做,随手净化知乎环境,从自己做起。


Original url: Access
Created at: 2018-11-23 15:31:35
Category: default
Tags: none

请先后发表评论
  • 最新评论
  • 总共0条评论