深圳小产权房网深圳小产权房网

丹竹头村委统建楼马蜂窝事件淡然收场,为什么业内集体默不作声?


一位内容创业平台的员工声称,马蜂窝事件后,技术检测发现,有些平台对其公司数据的爬取行为停止了,并开始清洗痕迹。“但哪天可能又开始偷偷爬取了,”他说到,“我们的技术人员在黑市上拿回任何爬取我方公司的软件,来研究反爬系统,但利益驱使,对方就会花更高的成本来爬取。”






当时马蜂窝已经尝试了一年的酒店交易,接入携程、艺龙(还没与同程合并)、Expedia、Booking、Agoda等平台的酒店资源,誓要提供“全网最多的基于中文的酒店信息”,提供真实用户评价,2015年接受采访时,马蜂窝在Agoda中国游客的海外订单中占比20%。


“早期天涯出现灌水的人,通过机器,在每个帖子后面跟发铁观音的广告,删都来不及,过滤器的升级赶不上对方的技术调整。至于爬虫,企业竞争的时候为了快速壮大,爬取数据也是如此,比如大众点评此前起诉爱帮网非法复制点评内容。爬天涯的例子就更多了。”他说到。

这或许是互联网企业在捅马蜂窝事件中,集体沉默的原因。网络世界信息透明,缺乏版权意识与法律规范,在竞争的驱动下,爬虫成了谁都可以钻的漏洞,内容创业的原罪。而马蜂窝远不是最典型的一家。


急迫寻找一些国内冷僻目的地旅行信息的早期自由行玩家,自然聚拢在马蜂窝,那些游记常常被挂出在马蜂窝首页(简称“蜂首游记”)的用户被其他人追捧。

主角之一是成长迅速的中国旅游业独角兽新星马蜂窝,早年以优质游记、攻略内容打响品牌,在去年底完成1.33亿美元D轮融资,今夏在央视世界杯转播中发布洗脑广告、曝光量大增,并在此次事件爆发前进入新一轮融资尾声。




自媒体人“老道消息”在微博上说,他觉得乎睿数据算出的内容爬取比例,仅是行业平均水平,“喜马拉雅和蜻蜓FM之前对活跃用户的注水,也是这个水平。”他说,投资行业对创业公司提供的数据做减零处理是“常识”。



10月20日至21日,丁子荃在“小声比比”上发出两篇指责马蜂窝抄袭点评、存在水军营销号的文章,随后有媒体挖出马蜂窝新一轮融资已经接近尾声的消息,并将两件事联系在一起。但直到10月24日天眼查App披露了腾讯投资马蜂窝D+轮的消息,仍然没有投资方站出来发声。

轻芒杂志找到一位马蜂窝前员工点评了“小声比比”的文章,他说到:马蜂窝对问答、评价、游记的鼓励政策(比如提供徽章)是KOL在乎的,而普通用户并不受此激励,很少有普通用户再愿意像写作文一样地写点评。“许多点评的场景其实都是用户有了不好体验后才会发生的,可是这却是与平台和商家所希望的相违背。”


有业内人士猜测,在新一轮融资节点上,自媒体的爆款文章将影响到马蜂窝的估值。而罗海资认为,投资机构在目前阶段会更在乎交易数据,因此影响不大。


“道高一尺,魔高一丈。”一位商业数据从业者形容。携程技术中心还曾发布过一个技术培训活动,主题是“爬虫VS反爬虫,一场没有硝烟的战争”,并说道,“我们所处的互联网,是一个爬虫的世界。”

今年8月,路透社曝出马蜂窝有望获得新一轮3亿美元融资的消息,并称其有可能在这轮融资中达到20至25亿美元的估值。消息发出后再无消息,直到10月都显得静悄悄。

独角兽兴起:2015年的转折

另一方则是专门做大公司调查性报道的自媒体,声明没有收取任何相关方利益,另外三个有国外高校留学背景的90后,初回国内职场创办乎睿数据公司,为此报告准备了4个月。

而舆论攻击的核心,则是指马蜂窝爬取其他网站的用户点评数据,并且没有严格监管游记中的营销水军。

业内观察者认为,实际情况没有这份数据这样夸张,不排除马蜂窝与一些合作方的数据共享。但除此之外,也没有一家被抄袭方站出来声明表态。这份沉默或许是由于,互联网内容创业领域,几乎无法独善其身。马蜂窝事件所揭露出的,是整个行业都选择性无视的问题。

2015年4月,马蜂窝宣布完成8500万美元C轮融资的消息刚一个月,整个公司270人左右的团队,还在大望路SOHO现代城面积不大的办公室里,各处堆放着杂物。CEO陈罡与COO吕刚在会议室里满腹憧憬地谈及马蜂窝的未来方向,多次解释未来的盈利模式,以及前期社区内容积累的意义。


从单纯做社区到寻求交易上的成功,这是一家内容创业企业想要存活下去的必然路径,资本入局更增添了证实其盈利能力的迫切性,而这其中的疏漏或许也为这次自媒体捅马蜂窝的事件埋下了伏笔。



在网上联系到专做旅游评论爬取的从业者,对方表示每一万条评论25元,如果速度快,一天可以爬取十万条。“这是非常简单的技术,查看需要爬取的内容所在的页面位置,花一天时间写三百行代码,就可以爬取相应的数据二十多万条。针对网站的反爬程序,可以通过放慢爬取速度、伪装成浏览器等等方式应对。”程序员张先生透露。




同时,在马蜂窝忠实用户“哈仙岛”眼里,他认为马蜂窝近一两年有所变化。“虽然在我眼中,马蜂窝仍是国内唯一一个专业化、自由的旅游交流平台,但马蜂窝游记攻略中逐渐充斥着商家的利益,包括游记中有存在虚假的广告软文。”他告诉界面新闻,自己曾向马蜂窝编辑和管理员举报,但一直没有人受理,“希望马蜂窝会正确对待此事。”


整件事身同样充满悖论的复杂性,像是互联网业与资本催产的荒诞剧:攻击马蜂窝充斥水军的言论,疑似本身由水军助推;而以游记攻略内容为品牌宣传点的公司,偏就因为内容问题而被指责。

该前员工表示,获得D轮融资后,马蜂窝在贵州成立了负责处理POI(指内容中的信息点,比如一段点评中提到的一家餐馆,或者一段游记中提到的酒店位置、名称)的部门,专门负责丰富POI的基本信息和点评,“但这究竟是用户的需求还是投资人的压力,就不得而知了。”

“价值观在这行里似乎永远都战胜不了GMV(成交总额)。”一位旁观事件的在线旅游创业人士感慨到。


去年11月,海择资本创始人罗海资通过数据分析比对,发现当时马蜂窝的交易规模要超过穷游许多。2017年马蜂窝宣布其交易额超过100亿元,而36氪消息称,马蜂窝平台2018年的交易额预计将超过150亿人民币。





旅游创业暂时缺乏亮点,互联网巨头越来越深入地通过资本布局已有企业,整合旅游市场。譬如阿里除了在资源上全力支持飞猪,还三次投资了穷游。腾讯除了在最新消息中加持了马蜂窝,还通过微信入口帮助同程艺龙加快了上市脚步,此前腾讯还投资了我趣旅行、面包旅行、赞那度等旅游企业,但同为内容创业领域的面包旅行远没有马蜂窝成功。



马蜂窝用户“乱跑的猫”记得,马蜂窝的游记被各种网站、公众号抄袭,“但凡去问一个写过游记的人,被抄袭都是家常便饭,马蜂窝还曾帮助维权。百度等刚开始做游记的时候,大量发私信请蜂首作者把他们的游记搬到他们那里,”他说到,“如果没空对方甚至可以帮忙搬运。”2016年,马蜂窝用户“白宇”发布微博称,自己在马蜂窝上的游记被百度旅游抄袭,马蜂窝官方微博帮助转发、维权。

那一年,马蜂窝的移动端用户6000多万,上一整年中,主要依靠酒店交易的试水,实现了9亿元人民币的自由行成交额。与此同时旅游行业的自由行产品刚刚从供应链端兴起,携程提供自由行碎片化产品的“当地玩乐”也是在2015年发布的。


在2015年至2016年期间,媒体开始注意到,马蜂窝、穷游等内容创业网站,开始寻求UGC的商业变现路径。这种转变一方面来自内容创业窗口期的结束,另一方面来自大资本介入后的盈利诉求。


资本市场有些时候表面越是悄无声息,暗里越是波涛汹涌。

2015年底,马蜂窝终于搬进了宽敞的新办公楼,有足够的空间来展示公司的个性与前卫,这里和携程、艺龙都很近,对面就是798,楼中间的区域从一层通到顶层阳台,挂着一个木结构的象征数据云的室内装置。乔迁近一年之后,陈罡在新办公室里告诉界面新闻,他们在2016年上半年实现了20个亿的交易额,并连续一个季度保持盈利,证明了内容到交易可以走通。而办公座位上方悬挂的大屏幕,正实时显示着最新的交易信息。证明其促成交易的能力,成了马蜂窝新一阶段的目标。



曾在麦肯锡工作的一名员工表示,他听闻马蜂窝自由行商城的转化率并不高。在目前的情况下,吸引更多用户,借助用户数据做更精准的页面展示,对提高总体交易额来说至关重要,也是马蜂窝在多次采访中提到的努力方向。但商家水军带来的营销内容,如果不加以管理,长远来看必然会影响到用户对内容的可信度,从而影响交易。

在网上公开的消息里,互联网做内容的企业,出现过的爬虫事例就包括,深圳小产权房网,大众点评起诉百度窃用点评信息,小红书指责大众点评大量违规转载,豆瓣“足迹”抓取穷游地理数据。

悄无声息的资本:未分胜负前的静默

“抄袭的人得到好处,守规矩的人变得弱势,这是不公平的。自由竞争不能解决所有问题。”李胜兵评价说,“这涉及第三方言论的权属问题。在这个领域法律定义不够清晰,且每次只有判例。如果作为权益人的内容写作者自身不主张权益,网站作为内容呈现载体,是否可以主张不抄袭?”同时他仍然保有乐观的看法,“相信互联网有个自滤的过程。”


自媒体“小声比比”创始人丁子荃似乎也没有想到事件爆发后一两天中的热度,微博上大量账号转载,接到马蜂窝起诉后的一篇回应文章,点赞数都超过了十万加。他还在朋友圈晒出了生平第一张诉讼服务告知书。甚至他妈妈忧心忡忡地打来电话,让他回家躲一躲。

网友Matti表示,2012年,朋友问他何时在马蜂窝上开了博客,他才发现自己在新浪微博上的游记都搬上了马蜂窝,而自己从未注册过马蜂窝账号。他在新浪发布的一篇赛里木湖的文章,几乎同时显示在了马蜂窝网站上。“由此我认为是机器抓取,然后把发布时间改成和原博客一样了。”Matti说。经过交涉,马蜂窝停止了该账号的更新。

似乎事件背后还有无形的力量造成了各方集体沉默、息事宁人的局面。知微数据分析发现,微博上关于“马蜂窝被指数据造假”的内容传播最大深度仅6层,却获得大量传播,转发高峰集中出现在凌晨和早上5点至7点半,午后陡然下跌,带有明显的水军传播痕迹。

2017年12月马蜂窝宣布完成1.33亿美元D轮融资,参与投资的除了此前投资方今日资本、启明资本、高瓴资本,还有旅游业新兴的投资明星鸥翎资本,以及美国泛大西洋资本集团、淡马锡这样的海外投资界大佬。当时马蜂窝平台上的自由行产品供应商达到1.5万家,交易额在成倍增长。陈罡再次接受界面新闻采访,表示马蜂窝在2017年将接近盈亏平衡,未来三年左右有能力独立IPO。


马蜂窝回应称,点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的账号数量更是微乎其微,深圳小产权房能买吗,并已经进行清理。但恐怕已无法洗脱自己存在爬虫行为的嫌疑。


通过回顾梳理这家公司的历程,以及行业的旁枝末节,或许能发现一些踪迹,来解释此次捅马蜂窝事件的默然收场。




“爬取数据或许是互联网企业的必然,否则可能需要花几倍的代价做推广才有那么多数据,更别谈拉到融资了。”移动互联网创业者徐磊告诉界面,“融资靠数据说话,我们就是因为没有数据做假,融资不顺利,转型做了线下。”

由此,两位创始人将2006年至2010年的内容积累、社区营建,称为“以时间换空间”,即日后于在线旅游市场上的生存空间。

2015年接受采访的时候,马蜂窝的两位创始人就预测到,旅游行业1.0版本的内容创业窗口已经接近尾声了。到如今,存活下来的几家都成了资本的目标。

沉默的被爬取方:被揭露一角的潜规则

“2015年会成为中国自由行分水岭的一年,供应链面对用户汹涌澎湃的需求,已经不接不行了。”马蜂窝两位创始人当时说到。而马蜂窝已经积累了中国市场上最核心的自由行用户,并且通过结构化数据的方式,吸引用户前来寻找自由行的解决方案。

马蜂窝也显得非常谨慎,除了对事件的一则声明,暂停对外任何发声,媒体采访到的唯一一条CEO陈罡的回应,还是在马蜂窝照常举办的圣地巡礼发布会上堵来的。

两天之后,迅速刷爆网络的这份调查报告像是丢入大海的巨石,巨大水花之后很快又恢复平静。被指被马蜂窝抄袭的行业竞争者,在整个事件中静默无声;马蜂窝某个分舵(指某地区线下粉丝群构成的组织)微信群中的事件讨论也仅持续了几段对话,又开始讨论各地的美景和新写的游记;投资者也是一副不以为意的态度。



爬虫的行为,或许从互联网内容平台诞生并出现竞争的那天就开始了。天涯社区是中国最早一批内容平台,其早期创始人、曾任COO的李胜兵向界面新闻聊起互联网爬虫和水军的历史。


公众号“小声比比”的第一篇针对性文章,写的是马蜂窝点评内容抄袭。乎睿数据团队在马蜂窝上发现了7454个抄袭账号,称这些抄袭账号平均每个从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评、1221万条酒店点评,占到马蜂窝所有点评总数的85%。

其他影响还可能包括,令部分马蜂窝用户对其一直信赖的平台感到失望。自媒体文章在微博广泛转载后,有不少马蜂窝用户在微信群中自发要为马蜂窝说话,守卫心中的城池。“大多数人就算知道水军和僵尸号,出发前还是会先看马蜂窝攻略,毕竟对于我们深度用户来说,暂时还没找到哪个网站的攻略实际能用的东西,比马蜂窝好。”一位马蜂窝用户对界面新闻说到。但也有用户认为,“小声比比”指出的问题确实存在,并为此感到遗憾,“马蜂窝和以前不一样了。”