算法 – 蜗牛派

从执着于“社交分发”到开始拥抱“算法分发”微信是如何转变的？

蜗牛派的朋友们 — Tue, 15 Sep 2020 01:15:54 +0000

编者按：本文来自微信公众号“卫夕指北”（ID:weixizhibei），作者：卫夕，蜗牛派经授权发布。

如果问过去一两年微信最大的变化是什么，我的答案一定是——微信终于开始拥抱算法分发了！

从执着于“社交分发”到开始拥抱“算法分发”，这是一个惊人的转变，这个是微信在路线上的一个重要迭代和进化，而这个转变背后的逻辑也非常值得每一个互联网人深入思考。

一、改变了的微信内容分发逻辑

很显然，一开始张小龙并不喜欢算法！

准确地说，在微信这个故事开始的时候，张小龙对算法介入内容分发非常忌惮。

这在很多方面可以体现——

朋友圈排序永远只有时间序；
公众号排序永远只有时间序；
微信里从来没有任何地方有推荐、猜你喜欢、热门等算法介入模块；
微信改进公众号阅读体验也仅仅从公众号列表变成内容列表；
所有你在微信上看到的内容都是你个人主动选择的结果；

然而今天，情况发生了极大的转变，算法分发开始在多个维度渗透到了微信内容生态的方方面面——

看一看：看一看里推出了基于算法推荐的“精选”。
视频号：视频号出现了”热门“这个通过算法计算出来的标签；
公众号排序：公众号的文章目前已经不再是原来纯粹按照时间序来进行排序了，而是通过算法进行优化排序；
公众号推荐：在公众号信息流里，开始通过算法推荐你可能喜欢的公众号了；
公众号文章推荐：在公众号文章末尾，开始通过算法推荐与该主题相关的文章了；
搜索：微信搜索的结果目前及其丰富，微信的搜索算法日益成熟。

公众号信息流推荐的账号

这不得不说这是一次非常有趣而惊人的改变，卫夕想通过这篇文章尝试解释这种转变是如何发生的，着重回答两个问题——

1.微信早期，张小龙为什么如此执着于天然的社交分发？

2.微信从社交分发到算法分发的转变又是如何发生的？

二、张小龙的产品哲学

先来看第一个问题——张小龙为什么如此执着于天然的社交分发？

毫无疑问，微信被深深打上了张小龙的个人烙印，他的产品哲学也被深深地注入到了微信的产品逻辑里。

那么为什么张小龙在微信诞生之初的相当长一段时间内都只推崇纯粹的社交分发而丝毫不染指算法分发呢？

这个问题不同人会有不同的答案。

我的答案是——这和张小龙信奉“用简单规则构建一个生态”这个理念有非常大的关系。

为什么这么说呢？我们来看几个事实——

一、张小龙曾经非常推崇凯文*凯利写的《失控》这本书，他有一次在演讲中说：

“凯文·凯利的《失控》我给很多人推荐，这本书篇幅很长，大部分人没有耐心看完，但是如果有一个大学生来面试，说他看完了这本书，我一定会录用他。”

那么这本书到底讲了什么呢，这本书完整标题是《失控——机器、社会与经济的新生物学》，这本书本质上是关于复杂科学的。

书中一个非常核心的观点就是——从无机物到生物、从社会到机器都在向复杂方向进化，而在这个过程里，大多数时间是没有领导、没有组织、没有中心化布局的，这就是最自然的一个状态。

《失控》本质上讲的并不是说失去控制，更准确地说是——无需控制，因此，很多人建议将这本书翻译成《无为》可能更加合适。

二、张小龙在早期在腾讯内部有一个著名的长达8小时关于微信产品哲学的演讲，在这个演讲中的PPT，我们可以看到他反复表达了这样一些观点——

1.“产品经理像上帝一样，构建系统并制定规则，让群体在系统中演化。”

2.”通过建立简单规则，创作一个自运行系统，满足人群的某种心理或经济需求。“

3.”如果将产品比喻成生命体的话，它是有DNA的，只有有DNA的产品才会自动演化”

4.“通过对人内心欲望的洞察，建立虚拟社会的规则，引发群体效应，群体效应再推动规则变化。”

5.“微信会升级，但结构会保持简单”

6.“做一劳永逸的事情”

7.“如果解决方案非常复杂，那一定是问题问错了”

8.“每增加一种选择，都会让用户迷惑，增加不固定感”

张小龙PPT之一

三、张小龙曾经有一个饭否账号，在这个发了2359条消息的饭否账号中，他也说出了很多类似的想法——

1.“产品就象一个生物，有它自然的进化之道。最重要的，是制定好产品的内在基因的“竞争策略”，让竞争策略在进化中再自行演化为具体的表现形态。”

2.“互联网产品应该是由用户推动，而不是产品经理来推动。产品经理的作用只是找到四两拨千斤的地方稍微用点力。”

3.“天文学家约翰尼斯·开普勒（Johannes Kepler）曾经公开宣称，大自然钟爱简单和统一。”

4.“人一想复杂就偏了。”

张小龙饭否，完整版请在“卫夕指北”公众号回复“饭否”

四、张小龙早期是做邮箱的——邮箱作为一个最传统的通讯工具，对“确定性”有着极高的要求，因此即便在QQ邮箱张小龙做的“阅读空间”，本质上也是一个订阅产品，需要用户主动订阅各个频道。

张小龙非常在意给用户确定性，而他本身是一个非常在意掌控感的人，他也要让他的用户能获得对自己看到的内容的一种掌控感。

五、张小龙在2019的公开课中更加直接地解释了自己为什么对社交分发如此执着——

“我一直很相信通过社交推荐来获取信息是最符合人性的，因为在现实里面，我们其实接纳新的信息，并不是我们主动到图书馆或者到网上去找的信息，大部分情况都是听到周边的人的推荐而获得的。”

好了，通过回顾张小龙这一系列想法和言论，我们可以看到他的一个重要产品理念——“通过设定简单的、确定的规则来构建一个自然的生态，用户在这个去中心化生态里能自然演进”

因此，微信的分发规则是极其简单的——纯粹靠人来进行天然分发。

任何算法的介入都是对这种简单规则的破坏。

三、世界上并没有完美的方案

那么这种分发方式有没有什么问题呢？当然有，比如典型的是朋友圈微商泛滥的问题。

为什么说朋友圈微商泛滥会和朋友圈分发机制有关系呢？

微信默认的规则就是你所有的好友发的朋友圈都只按一种简单规则——时间序进行全部展示，这等于微信默认了以下两个前提——

1.你所有的朋友对你而言都同等重要，无论她是你的闺蜜还是素不相识的微商。

2.你同一个朋友发的所有内容对你而言都同等重要，不管他发的是生日照还是减肥茶。

很显然，这并不符合现实，那么微信如何解决这个问题呢？

微信一开始的逻辑是——人们发广告太多，就会有人把他删掉，而为了不被人删掉，人们会自动少发一些广告，多发一些有趣的内容，从而达到一个微妙的平衡！

这个逻辑对吗？看起来没问题，但事实上并不凑效，微妙的平衡其实很难达到，为什么这么说呢？

因为就连微信自己也发现依靠“删掉”这个如此重的功能根本起不到调节的作用，于是微信进行了自我改进——推出了“屏蔽某人朋友圈”这一功能，这时候逻辑变成——

人们发太多广告，就会有人把他屏蔽掉，而为了不被人屏蔽掉，他会选择自动少发一些广告，多发一些有趣的内容。

这回就完美了吗？答案是——不知道，我们只能说，效果肯定会比”删除“好一些，但屏蔽一个人这个操作真的就很轻么？

且不说在操作层面我需要点5下才能屏蔽一个人，更重要的是从心理层面，屏蔽一个人意味着他发的一切我都看不到了，不到忍无可忍的某个临界点，很多人不会轻易这么做。

那有木有更完美的解决方案呢？有人说有，系统自动算出这个人哪些是广告，哪些是有趣内容，只给人展示有趣内容而屏蔽广告！

这个方案怎么样？看起来很完美，但有一个问题是，如果这个人的广告不会被看见，那他为什么要拼命发有趣内容呢？他闲的蛋疼么？

所以，在产品层面其实没有完美的方案，有的只是不同的取舍。

我们来比较三种取舍——头条把内容展示完全交给算法，微信把内容展示完全交给用户，而Facebook某种意义上综合了二者：

Facebook的内容用了一个叫“边际排名算法”（Edge Rank Algorithm）。

这个规则会计算每一个内容的重要性，重要性高则排在前面，而重要性E由三个因素决定，具体公式为——E = u*w*d:

u：用户与内容发布者之间的亲密度分数，互动越多则关系分数越高
w：不同的互动动作具有不同的权重，如评论、点赞等。比如评论动作的权重就会高于点赞。
d：发布时间，发布越近的新消息重要性越高。

很显然，Facebook会根据算法来计算哪个朋友对你而言更重要，点赞多评论多就是更重要，但这个算法也并不完美——比如我如果暗恋某个女生，我断然是不会给她点赞、评论的，但她的每一条朋友圈我一定要看。

所以Facebook这种算法也剥夺了一种权力，我能看到什么不再由我决定，而由机器决定，我就失去了确定性，很多人会因此恐慌。

而微信的哲学是——它不会替你自己决定谁更重要，张小龙坚信人是有主观能动性的，可以自己屏蔽朋友圈、删除好友、取消关注，微信需要的是确定性。

没错，微信在给内容消费者确定性的同时也就自动赋予了内容生产者的确定性——公众号的运营者们知道，自己的内容哪怕是广告粉丝也一定会看到，这背后是巨大的利益。

巨大的利益就意味着巨大的动力，这也是微信成长为中国内容创业最坚实堡垒的一个最重要的原因。

所以，每一个方案其实都是一种取舍！

只是张小龙选择相信碳基人类，而张一鸣选择相信硅基算法，二者就像华山派的“剑宗”和“气宗”。

本质上这只是一种价值取舍！

好，到此我们就已经回答了这篇文章两个问题中的第一个问题——为什么在微信早期，张小龙如此执着于简单的社交分发？

答案是这和张小龙的“用简单规则构建自然演进的生态”这一产品哲学息息相关。

四、转变是如何发生的？

接下来，我们来讨论本文的第二个问题——微信从社交分发到算法分发的转变是如何发生的？

首先，我们需要明确的一个事实——微信并非完全从社交分发直接全面转变成为了算法分发，准确的说法是微信是在社交分发的基础上引入了算法分发。

社交分发依然是微信最核心的分发方式，而算法分发可以认为是一种补充，我们可以从以下事实看到——

1.朋友圈依然是严格的时间顺序，完全没有算法。

2.看一看的第一个Tab是“朋友在看”，第二个Tab才是基于算法的“精选”

3.视频号默认的依然是基于社交分发的”朋友“，第二个Tab才是基于算法的”热门“

4.公众平台的排序尽管引入了算法排序，但据目前普遍的观察，算法的干预力度和幅度都非常小。

5.微信这几年重点打造的小程序依然没有算法介入，完全由社交分享分发。

所以我们可以看到——

张小龙其实并没有抛弃自己产品哲学，社交分发依然是微信最核心的分发方式，而引入算法某种意义上可以看成是对原有产品哲学的一种修正。

那么，这种修正是如何发生的呢？

为什么有产品洁癖的张小龙也会放弃自己多年的”坚持“呢？

卫夕总结了下面四个角度来理解这种转变——

首先，张小龙是一个迭代能力极强的人。

要知道他经历过很多人难以想象的几次跨度极大的转变——

从PC软件的Foxmail到QQ邮箱的转变，这是将软件思维切换互联网思维；而从QQ邮箱到微信，这是PC互联网逻辑到移动互联网逻辑的转变；而从微信的早期到微信的后期，他完成了从产品架构师到生态管理者的角色转变。

每一次的逻辑和能力圈都是完全不一样的，普通人能完成一个转变就已经异于常人了，而张小龙经历了三次，每一次都脱胎换骨、刻骨铭心。

所以，这是一个勇于且善于修正自己的男人。

从这个意义上，根据形势和格局的变化改变产品策略其实是顺理成章的事。

其次，我们来看一看冰冷的数据——

这两张图是分别是QuestMobile2018年9月和2020年6月中国互联网各巨头的时间分布——

2018年9月数据

2020年6月数据

我们看到腾讯系产品的用户时长占比从47.3%下降到39.5%，而头条系从9.7%上升到15.3%。

尽管腾讯还有其他庞大的产品体系，但头条系在抢微信的用户时长这个大的逻辑无疑是确定的。

微信从0开始到成长为巨无霸，几乎没有遇到什么像样的竞争对手，但头条系在时间战场上的攻城略地的确给了微信极大的压力。

这某种意义上代表着算法分发的胜利。

尽管张小龙在很多场合经常强调不关注竞争对手、不关注用户时长，但我们也看到了在2018年的腾讯员工大会上他公开说——

“大部分产品都在欺骗用户，做各种滤镜，喊口号说「记录美好生活」，但生活其实并不总是美好的。”

其中的火药味还是很浓滴。

的确，头条系的崛起让一直扑在第一战线的微信感受到了用户时间被侵占的压力。

第三，公众号的内容生态在变得日益成熟的同时也有一些弊端开始浮现，具体体现在——

1.从内容生产的角度，主要问题有——整体阅读打开率逐步走低、马太效应导致公众号阶层固化严重、中小有质量的号很难获得关注、公众号本身的机制并不适合分发短内容等等。

2.从内容消费的角度，主要问题有——好内容不容易被发现、长期内容单一和趋同、在各种诱惑下关注的公众号导致的关注列表混乱等等。

这些问题既制约了公众号内容的生产，也制约了公众号内容的消费，面对这些问题，张小龙在 2018 年微信公开课上开出了自己的药方，他宣称——

“我们只会去改善阅读效率，而不是胡乱变成不受掌控的信息。”

没错，算法介入其实就是改善阅读效率的一个重要举措。

微信事业部的算法工程师招聘岗位越来越多

第四，微信在视频化层面的压力。

如果说在公众号时代微信的内容生态还能和今日头条平分秋色的话，那么抖音快手等短视频内容崛起让微信在视频消费这一领域明显落后。

某种意义上，这其实是腾讯在这一领域的落后，事实上，在美国，Facebook也没有干过以算法见长的Tik Tok。

算法分发再次在短视频领域展现出明显的优势。

于是，在微视拼尽全力但依然没有大突破的情况下，微信的视频号肩负了腾讯短视频反击的大旗。

当然，张小龙做短视频依然是有其强烈风格的，三个Tab从左到右分别是“关注”、“朋友”、“热门”，主打社交分发的“朋友”依然是默认选项，优先级高于算法分发的“热门”。

微信其实也做过非常重度的短视频尝试——即刻视频，这个寄予厚望的功能效果并不好，我四个5000好友的的微信号经常发现发即刻视频的数量仅仅为个位数，尽管它在上线开始的时候有8个入口。

张小龙曾经在2019年的微信公开课上花了半个多小时讲即刻视频旨在减小大家发布压力背后的逻辑，而最后他说了一句意味深长的话——

“我觉得一个好的产品不需要费口舌解释，我解释了这么多，说明我们做得不够好。”

没错，正是在以上四个因素的共同作用下，微信修正了自己的产品路线，在社交分发的基础上拥抱了算法分发！

而这时候当我们回顾其他产品，会发现社交分发和算法分发的融合事实上已成为一种标配的趋势——

微博早就从时间序修改成了算法排序，同时在“关注”Tab后边加上了并列的算法Tab“推荐”；
字节系的头条和抖音这两年也明显更加强调基于关注的社交分发，喊出了*粉丝的口号；
而快手本身就是算法分发和关注分发平衡做的特别好的产品。

尽管每一个产品都有自己的侧重点，但修正和进化则是永远的主题，而这也是永远蓬勃向前的互联网最有趣的一面。

大道至简，殊途同归。

免责声明：本文版权归原作者所有，文章系作者个人观点不代表蜗牛派立场，如若转载请联系原作者；本站仅提供信息存储空间服务，内容仅为传递更多信息之目的，如涉及作品内容、版权等其它问题都请联系kefu@woniupai.net反馈！

浅析探探类陌生人社交产品的业务分析、产品策略及算法思考

蜗牛派 — Mon, 20 Jul 2020 00:50:03 +0000

作为连接人的工具，社交产品的价值不言而喻；熟人社交领域，微信已经是绝对霸主地位，但是陌生人社交领域还未出现类似绝对地位的产品。今天就跟大家交流陌生人社交产品，主要以探探和Tinder为例; 前面50%的内容主要是以业务分析为主，后半部分介绍基于这样的业务形态引入的一些数据、算法、架构体系的设计，希望可以让大家在做算法和数据过程中了解到对业务洞察的必要性。

跟以往资讯、短视频、电商、音乐等等常用产品不一样的地方是，前面介绍的这几种产品属于典型的以单向匹配及满意度为终结，比如电商产品中的用户->商品、短视频产品中的用户->短视频等；而陌生人社交则以双向匹配满意度为终结的，最大的不一样就是满意度体现在单向还是双向匹配的完成度上，正因为这种不一样，建模就异常复杂，所以梳理过程可以为我们带来非常大的启发(其实招聘、打车、外卖等都存在一定的双向匹配问题，有感兴趣的我们可以微信做做探讨)。那我们开始进入今天的探索之旅。

图1 在线交友约会双向匹配图

交友匹配/推荐在广义上，也是撮合交易的一种，在平台产品上的展现形态，也以推荐、排序、匹配聊天为主。但交友匹配有极其独特的特点，那就是人是无库存的唯一品和非标准品。唯一指的是每个人几乎各不相同，长相、性格、职业等等，完全不同于商城的商品推荐。非标是指，需求方对另一方是有要求的，而且在不同人、时间也不同，是非标准品；所以在非标、唯一的情况下，我们需要考虑当下单向交互、中期双向匹配、长期群体成功率。

图2 交友领域的匹配问题要素解构

一、简介

首先我们大致介绍一下陌生人社交中以Tinder为代表的业务和产品形态，然后再讲一下其中的一些有趣的问题，最后我们看看有哪些东西是可以数据化和算法介入的。

Tinder是基于LBS的陌生社交产品，当你打开它，手机屏幕上就会呈现出一张异性的照片，喜欢就向右滑动，给一个yes，不喜欢就向左滑动，给出一个no，如下图。如果恰巧对方也喜欢你（互相都右滑了），那么你们就匹配成功，接下来可以聊天、交流、满意的话，你们就可以约会了。

图3 Tinder产品使用界面（喜欢右滑，不喜欢左滑）

而Tinder背后的母公司Match Group 作为交友领域的鼻祖，在婚恋社交领域产品矩阵非常庞大，发展迅速，并且有很好的盈利，旗下产品和近年来的收入和盈利可参考下图（来自其财报），其中Tinder更是众多APP中发展最迅猛的，Tinder也是全球除了游戏以外，IAP(In-App Purchase)付费最高的产品。

图4 Match Group系列产品

图5 Match Group15-19年收入和利润

图6 Tinder的排位

再介绍一下Tinder上的用户的大致分布，主流的群体为90后和00后，学生和初入职场的单身白领居多，男女比例接近（国内探探类似的情况，男女比8:2）。

二、业务特点及一些思考

作为一个陌生人社交领域的产品，他有哪些不同于其它互联网产品的点呢，我们逐一来看看。

1、产品标签明显

Tinder用户定位及标签明显，用户大多数情况是会在单身、无聊、xxx等时候安装使用软件，这个是常态；在需要的时候下载安装一下，然后用了几天或者几个小时就卸载了，当再有需求时又安装使用。熟人社交产品往往是大家展现自己正向的那一面，极力保持个人良好的形象，而由于陌生人社交产品有着鲜明的标签特色（比如Tinder、探探、陌陌都逃不过YP的标签），用户往往在这里的诉求就会差异较大，而且隐私要求更高（真实信息不希望过多暴露）；陌生人社交其实很多用户都有突破原有禁锢，在平台上以新的形象/不同于生活中的另一面，展现和认识一些人。

2、双向&链路长

上面也说过，大多数交友类APP最终的用户体验诉求是匹配成功（即用户开始聊天、交流、约会、成为男女朋友等），这个跟大部分互联产品不一样的地方是非单向网络，双向网络存在双向匹配问题，单向满意效用低。双向匹配网络中，如果有用户发现了很多心仪的对象，右滑表示喜欢以后，如果不能有一定比例的回音的话，用户可能很快流失，这也说明单单从一方来决定最终的展现是有问题的，而这些产品往往非常依赖于智能匹配技术，这就给推荐系统提出了新的挑战。

图7 典型的双向匹配

在双向匹配问题中，从展示到喜欢，再到被喜欢方交互和回应，这里面的转化链非常长，而且由于用户是否在线问题；就算最终匹配成功后，用户可以进行聊天和约会，我们还需要评估聊天的成功率；这里面可能存在有很长的时间反馈延迟，用户的体验和收益需要被喜欢人反馈后才能真正体现。链路长也带来了成功率的下降。

图8 Tinder类产品交友匹配链路

虽然很复杂，很困难，但是在社交领域先行者的探索中，也证明了数据&算法预估建模是可以真实地带来匹配及回复聊天率的上升，通过数据我们可以看到下图的相关性(来自于OkCupid Blog)，建模匹配率高的真实情况下也是更高的。

图9 建模匹配率和回复率的关系

3、网络效应&流动性

互联网的本质就是一张信息网络，互联网产品普遍具有网络效应，而社交类产品则更加依赖于网络效应，边际成本下降明显，边际收益上升明显。那某个社交产品如何评估网络效应的强弱，或者说达到多少才是合适的呢。前两天跟一个朋友交流陌生人社交，他们有一个观点就是在可互动（比如基于LBS的产品，可互动指的是距离不能大于某个值）的用户每日用户数需要达到2000以上，7日留存在40%以上，这个产品是初具网络效应的，值得投入持续拉新最大的（当然上述2000和40%会被具体产品的用户活跃情况、性别比例、产品特性决定）。比如可以分析每个区块（比如同城）中人数对整体活跃度的影响，最终可以画出如下的图表，随着用户增长，拐点会出现（拐点可能就是magic number），规模临界点前后的差异巨大。当然下图需要在用户体量增加的时候做好匹配，不然用户量的上升可以使体验下降，继而带来留存的下降。

图10 上线用户数与留存的关系

因为交友类产品存在地理位置的限制，如果某个地区匮乏的话，无法解决这个地区足够数量的潜在匹配问题，一个用户在若干次交互后再无新的用户可交互。这种情况下，无论用户体验多么有趣或参与度很高，这个地区的用户就容易流失，网络效应需要分地区。所以初期基于地域的属性可以集中力量做片区发展，在某个或某几个地区走通并验证，则可以逐个地区铺开。

陌生人社交就像我前面介绍的，用户可能会有反复下载和卸载的过程，并且不像熟人社交，用户天然具有流动性。这是业务天然的优点和缺点，缺点是说今天用户就不会像使用微信一下长期高频使用，比如找到女朋友了。优点是每天有新的供给和需求在轮替。有足够多的流动性，可以带来新鲜感，才能产生更多的匹配与聊天。

由于流动性和网络效应在双向匹配中的影响，必然存在单边失衡的情况，这时候出现了需求多供给少的情况，需要做好流量的平衡，动态维持一个比例，比如当性别失衡时（突然大量涌入一波男性用户），需要保证核心的用户的体验。活跃、留存高的用户不一定是你的核心用户，活跃、留存高、付费、且被别人喜欢的用户才是你的核心用户（付费、或者被其他人消费）。核心要素是找到一个生态系统良性运转的本质，有流入有流出，动态平衡。这中间就是长期与短期目标的确定，长期需要考虑生态性问题，短期一般是可度量可迭代的。很多社交产品一开始做得很好，却因为没有很好的一套生态体系，逐渐走向末路。很多用户的个性优势、兴趣需求互相不匹配，甚至感觉到干扰。只有当用户自然流失等于或小于平台自然流入，产品运营团队才可以把更多精力放在服务用户身上，而非拉新促活。

4、哪方才是驱动力

Tinder的男女比例接近（国内2款头部陌生人社交产品男女比大概为8:2、7:3），那到底是男性还是女性才是社交类产品的驱动力呢？哪方的存在可以更多地拉升产品整体的体验，或者哪方对产品影响更大。目前几款产品都是认为女性更重要，至少在冷启动阶段体现的特别明显，两方市场率先都引入了女性作为种子用户，因为在当下社会男女比例以及性别心理差异化方面看，男性更容易被女性吸引，且*流成本更低。虽然是双向匹配，但是还是存在供给与需求的差异，冷启动阶段女生的角色更偏向于供给的角色。比如从国内较大的陌生人社交产品了解到的数据，用户看了每100张照片，女生会选择6%喜欢（右滑），男生会选择60%喜欢（右滑），和现实中选择态度很相似，男生对于陌生匹配的反感程度更低，耐受度更高，男生天然更开放，只要这里女生多，对男生而言就是最好的服务了。维持这种生态系统运作的基本机制，通常是对女性提供更加开放友好的环境，吸引她们入驻，再以此辐射其他男性群体。这中间需要以女性视角关注产品(男生希望快速触达，女生希望更有安全感)，所以相互匹配才能交流，从这个角度来看是一个偏向于女性的功能。

从另一个视角来看这个问题，在匹配效率达到一定值以后，核心用户会被服务好，并且有不错的留存。这时候用户体量的外扩是两方持续博弈的过程。在新用户进入或老用户流失过程中，永远是非平衡态，一方的快速增长，需要快速推动另一方的新用户进入。如果更深入地从匹配角度来看，假设产品的匹配效率和推荐没问题，在现有用户群体下，理想情况下互相满意的匹配完成后，剩余了一群人，这群人的性别比例才是根本。因为不是两方数量达到一定比例就可以了，还需要考虑质量，如果男性需求过剩，需要新的女生进入产生供给，这部分女生不是引入对应的数量就可以了，而是要满足上述过剩男生需求的女生，才能使得生态达到平衡。

当然最终哪个群体才是某个阶段的核心驱动力呢？其实就是看供需关系、看贡献，供小于需的那部分群体就是需要重要考虑和保护的，差体验用户（卖货、不法交易）需要被限制，这部分人的存在和留存高反而会严重拉低其它用户体验和留存；不同用户价值不同，留存的高低对系统影响也就应该区别对待。

5、资源独占/头部效应&有限供给

在电商、内容、等等领域，一个商品、短视频可以海量地分发给各个用户，但是在社交特别是交友类领域，这肯定是不行的，道德性问题和双向匹配满意度问题都限制了分发的有限性。每个用户作为供给，只能完成一定次数的被匹配（而且这个次数一般不会大），同一人能与多人匹配并聊天，但是一般只能与一人成为男女朋友谈恋爱。如果不考虑道德问题，用户的交际带宽也是有限的，无法做到人人有反馈（探探-发现有个女生在几天之内被喜欢了30w次）。优质用户也只能提供有限的供给，这和书籍或者商品很不一样，并不是只要有库存就可以同时推荐给很多用户。美女帅哥在平台上从来不缺被喜欢，很容易成为产品的头部用户，他们也可以为产品吸引更多的用户进来；如果我们过度推荐这些用户可能会让这些用户收到到上万个喜欢的轰炸，但他们无法提供高的反馈率，比如下图中的头部用户拿到了几倍于普通用户的喜欢，但是回复率和匹配率却是颜值一般的人的五分之一水平(来自于OkCupid Blog)。

图11 颜值与收信数的关系，回复率与颜值的关系

头部效应不受控的话，海量匹配会被沉没，带来了双向匹配成功率的快速下降，而且占用了大量的曝光机会。不要大部分人没人喜欢，没有曝光，需要平衡。所以这里面就要求在流量分发的过程中做流控，但是如何在这有限次展现中获得优质匹配是个大学问。既要尽量为这个用户匹配到合适的用户，但是又不能海量地将其展现给各类用户，就算Ta可能被大部分喜欢。

图12 匹配相关的流量宏观调控系统

举个例子，今天有2个候选人分别为A和B，现在有个用户C使用产品，他对A和B均比较满意，但是A跟C的匹配度更高，这时候给C首先展现A好像比较自然。但是如果现在用户D进来了，他对A比较满意，对B不满意，这时候是不是在C来的时候，为其展现B更合适，因为后面D来可以匹配A，这样匹配度为100%，不然的话就是50%。上述问题中，有效供给、时间先后效应，全局最优匹配度问题均暴露了出来。好的很容易被匹配，不要过早匹配，而是留给另一个还不错且更苛刻的用户？那前提是你知道ta是好的，并且为了还有匹配机会，你才会在初期匹配度较高的情况下，不对ta进行匹配。比如头部的用户往往是相对优质的用户，但是他们也是单点，存在有限供给问题。推荐系统中存在趋热问题，召回打压，排序如何打压，最终控制减少头部效应。比如引入每个用户的受欢迎程度指标（可以通过仿真系统模拟其未来的被喜欢数和匹配概率等），可以为匹配时是否进行平缓限流有影响。因为有限供给，如果在达到限流条件后，其被匹配方若无回应或回应负向，则可以再次释放这个用户进入新的匹配。有限供给下的问题，是全局优化问题，但是看看能否拆解到局部优化，每次匹配尽量当下，这个比较重要，如果能拆，那就好办非常多了。你有一盘不错的货，上午来了很多人，询价了问你卖不卖，卖了感觉下午还有人过来，不卖下午可能匹配不好，大概这个意思。对用户分层，并构建流量配比实验。这中间如何分层，从被喜欢最多的群体里面反推他们喜欢的人，如果这群人没有再往外推，那么自成一个群体；剩余人群继续这个操作。

6、新人

契合上面提到的流动性问题，在池子中存在流出情况，并且被需求方用户消费过的用户无法做二次展现（不能给一个人反复看他之前看过的），这时候新用户的快速引入就非常有必要。由于匹配概率的准确率依赖于数据，所以如何让新人在只有静态信息时(地区、设备、年龄、职业等)，快速定位其喜欢和被喜欢的人群，这中间对新用户进行聚类是一个很重要的点；通过静态信息初步匹配后，在后续的左右滑过程中(平衡好Exploit & Explore)，尽量多样的积累用户信息非常重要。这里需要兼顾精准与多样，利用用户实时的正反馈（比如右滑）来快速修正其初期的群体偏好，当然这中间存在匹配不精准，流量的浪费情况。

初期新用户对匹配或对高颜值的期待，会非常有别于老用户，比如往往初次体验对颜值期待更高，当然通过数据分析，我们发现颜值也是测试偏好和拉新的手段。但长期来说，匹配聊天成功率是普遍的终极需求。新用户的首次匹配成功，开启聊天的时间间隔，会对长期留存产生较大的影响。

7、心理学效应

序列效应:这个效应与幼鹅效应/锚定效应类似。用户在浏览产品内的其他用户时，对其中某个用户的喜欢或不喜欢往往会受前面女生的影响，举个例子，比如用户看到的其他用户的颜值顺序是一般、一般、一般、一般和美、美、美、一般，两个序列中第四个人为同一人，有可能在第一个序列中用户4会被喜欢，在第二个序列中用户4可能不会被喜欢。推荐的整体序列问题，给一群难看的+一个一般的，和一群不好看的和一个好看的。比如在流量分发过程中通过list-wise方式的强化学习建模，目标提升累计的长期收益。

争议效应:有人喜欢有人讨厌出现分歧的情况越多，更容易有匹配和交流。比如Okcupid做了大量分析，分析结果如下图(来自于OkCupid Blog)，左边的用户整体评分比右边的接近些，但是右边的高分与低分的较多，属于争议型用户，而往往争议型用户收到的右滑比前者更多。

图13 评分有分歧的用户收到更多的信息

可得性、激情对时效性敏感:前面也介绍了本身陌生人社交类产品具有较强的用户诉求，比如可得性和时效性是较强的影响，往往初期是蓝色的线，我们希望往橙色的线靠近，希望可以在短时间内达成更多的匹配，如果同时去看留存情况的话，橙色线的留存好了很多。

图14颜值与收信数的关系，回复率与颜值的关系

性别区分大:对于男性，主要通过照片颜值来判断；对于女性，则考虑背景、学历、地位等各种因素。如下图，首先评分上女性更正太的分布，并且三分之二的男性将喜欢给了最漂亮的三分之一；而评分上男性则大部分集中在低分(可能男生不会拍照吧)，收到喜欢率相对颜值稍微有左移一些(来自于OkCupid Blog)。

图15 男性与女性新引力分布&收信数分布

年龄集中/年轻人的游戏:在OkCupid的数据来看(下左图)，陌生人社交的人群集中在24岁附近，30岁后急剧下降，最后逐渐减少，因为其余的单身人士要么找到伴侣，要么退出了竞争。当然这中间男女吸引力的下降也有区别，比如女性吸引力的峰值出现在31岁，男性则出现在36岁。

图16 平台不同年龄的分布&平台不同年龄可匹配人数分布

性别&年龄对于异性年龄的接受度差异大:男性往往随着年龄的增长可以接受越大的年龄下限，而上限基本维持；女性则基本维持这个上下限，见下图(来自于OkCupid Blog)。

图17 男性与女性随年龄增长可接受对方的年龄上下限

上面举了几个例子，由于各种心理学效应的存在，往往需要通过复杂建模（比如序列模型），并结合部分规则干预的手段来做匹配校准。

8、风控

社交类产品，第一肩负着较大的“舆论与监管的压力”，第二劣质流量将破坏氛围，所以建立一套风控体系既可以降低产品监管下架风险，也可以提升体验，并且降噪（劣质用户行为数据基本无价值）。

一个好用户好不容易在平台上匹配到了一个其他用户，结果这个用户上来就卖货，这样的经历基本可能就让用户卸载了APP。除了上述这种情况，还有些用户使用网红甚至明星的非本人照片来做头像，有些用户不是来交友的，他们用非本人信息匹配完成后，开始骚扰用户，类似恶意用户无非就是各类拖、卖货、色情等。这里面可利用图像技术识别用户的信息真伪性（比如头像是否被其他人使用，如果是明星存在被其它使用的可能）；也可以利用利用NLP技术识别用户聊天阶段是否出现违禁词、是否存在兜售商品或者骚扰性词汇等。

当然这里面推荐也可以发挥价值，对于风险高但不明确的用户分发过程中不做海量分发，虽然可能他短时间内有较好的颜值和被喜欢率，并且反馈及时；也可以开通用户举报反馈渠道，当存在用户投诉情况时，将被投诉用户送入审核通道，不在推荐上给予流量。

9、为了匹配效率，进行全面的数据收集

为了让匹配效率更高，并且识别出隐藏的恶意用户或低价值用户，我们需要收集更多的数据进行预测和筛选。比如前置显性数据收集，可以再用户进入APP后，加一些对自己的描述，或者对另一半要求标签，当然这个功能男女生使用频率差异大。当然也需要记住的是用户不会告诉你一切，并且用户可能也无法准确描述自己的需求。这时候就需要收集一些“隐式”的数据信息，比如新用户进来在推荐了一批用户后，他的交互（喜欢or不喜欢，是否查看某个用户的详细标签信息、是否有较长的停留等），这些都可以反映出用户感兴趣的对象和不感兴趣的人，这背后利用算法和数据技术进行分析就可以得到一个隐式的用户偏好。

数据非常有用，但也需要进行降噪，比如上述的偏好建模过程中，需要进行噪声数据的识别，比如滑动速度与是否是谨慎可以用来判断用户随意性。比如用户滑动速度小于1s，基本不做停留，而且基本大量右滑，这时候可能需要丢弃这个数据。去噪类的方法看上去很简单，但是最终线上的效果却可能很好。

10、社交产品中的感性因素

社交场景中存在很多感性因素，对于这些感性因素的把握，也可能会带来不错的收益，比如：

持续刺激:短时高强度给予被匹配用户改为持续间隔刺激对用户刺激及留存有较大的影响。比如头部、中腰部用户获取到的关注、匹配率、被喜欢率均高出其他人很多，这时候可以引入蓄水池，在这些匹配完成后（比如有100个match），不是在用户打开APP的瞬间完成全部展现，而是在用户使用APP的过程中，每隔一段时间（比如5分钟或者更久）或者用户滑卡疲劳时，弹出匹配，让用户在体感上有在线持续有匹配，在这个产品上自己很受欢迎，类似的体验可以拉升用户活跃和留存。

地理位置可能胜过颜值:由于陌生人社交有较强的可得性需求，所以对于LBS也是较敏感的，在距离上的贴近可以带来用户对于可得性的满足。比如在颜值相当或者略差的情况下，用户可能对于近距离的匹配也会更感兴趣，这个在陌陌上特征明显。

快匹配和慢匹配: 陌陌单向可发起匹配和交流，Tinder和探探需要双向匹配才可发起聊天；陌陌属于瀑布流形式，一屏可以看到若干用户，直接可进行比较，而Tinder和探探则是单图滑卡型；虽然后者匹配速度慢，难度大，但是后者对用户的骚扰更少，匹配质量会高于前者。作为Soul这类不看颜值的匹配，就更加突出了效率低和质量高。

男女匹配策略差异: 前面也讲了男女用户在匹配过程中注意力的差异，男看女只关注外贸，均匀分配给男生；女生看男生完全不一样，颜值曲线波动特别大，证明推荐和个性化维度会有更强的效能。

群体有偏&谁先说话:根据前面哪个是核心驱动力的基础上，我们可以对匹配进行改造，非核心用户与核心用户完成匹配后，非核心用户发起第一次聊天后才为核心用户展示已匹配成功。比如男生A与女生B完成匹配，男生会先收到匹配信息，然后如果男生说了第一句话，才给女生展示已经匹配的信息，这样女生的体验会更好。

三、体系设计

1、挑战

业务特点: 流动性（用户卸载与下载循环，非强需求）、新用户、消耗速度快（用户消费的就是用户）、有限的供给关系。

建模: 双向、延时、多指标博弈、难以度量感性因素、社会学因素，商业化（ “查看喜欢我的人”是用户付费功能模块，如何提升普通用户的付费率和续费率，并且尽量平衡其它普通用户的体验），流量不具有独立性(无法使用传统的灰度方式进行迭代)。

2、目标

我们先来看看Tinder的核心指标，如下图

图18 Tinder建模目标

可以看到Tinder从三个维度来看分别为Activeness(新账户数量、使用时长、每日访问次数、每次匹配完成后的对话频率)、Pickiness(右滑率、喜欢率)、Attractiveness(被喜欢率、信息被点击率、信息展示时长)，其中attractiveness 和pickiness基本可以用户推荐的当下可预估，做起来比较简单，activeness就需要考虑宏观匹配、调控及长期规划了。（被喜欢率:这个维度的分数取决于有多少人右划喜欢你，而喜欢你的人自己获得的喜欢越多，对你的分数加成也越大。被喜欢率=被右滑个数/展现次数。喜欢率:这个指标是表现了用户对平台其它用户的满意度，看了同样的用户数以后，你右滑的越多这个值越高。喜欢率=右滑个数/展现次数。）
除了上述因素之外，交友类产品中距离也是一个非常重要的的因素，所以在上面的匹配公式中，匹配与被匹配用户距离也需要作为一个因子，融合进匹配度计算公式。“效率”是陌生人社交应用至关重要的竞争力，需要每天绞尽脑汁琢磨男、女用户的心理，如何才能更好地做到高效匹配问题，只有高效的匹配健康的匹配率才是长期发展的根本，下图中我们更倾向于后者。

图19 用户数与匹配率的不健康和健康关系图

短期指标我们不过多介绍，中长期的评价指标可以是用户次日、7日、30日留存，用户付费率、用户整体匹配率等等。用户留存，我们需要看核心用户群体的保留，不单单看全局的流失和留存，关键用户的重要度需要加权。做分类以及评分预测时，不妨针对业务的头部和长尾现象来做模型改造和模型选择，这就是需要识别优质资源(贡献较高的喜欢率，付费意愿强，留存互动较好等)，先分类再匹配。一个方向是用户来了之后，我帮助他在平台内找到合适的用户，还有一种思路是通过将高价值用户识别出来，在策略上进行一些优先级的排定，比如老用户召回的Push可以分优先级来做，这批用户是第一优先级的。还有一些维度我们也需要分用户维度，比如新用户的首次匹配成功。因为新用户在第一次使用产品过程中，开启聊天的时间间隔，对长期有较深远的影响。

指标的非独立性和联动:首先，指标之间不可能完全独立，我们在优化一个指标的同时很容易对另一个指标产生副作用。比如互动率、留存、付费率等。一个产品上线初期（其实中后期也很难），不可能在太复杂的业务逻辑下，完全依靠算法达成产品目标，所以初期可能需要加入一些规则进行宏观控制，在机制运行过程中进行调整纠偏。

3、相关数据指标及特征

拟合一个目标最好的方式之一就是将这个目标的历史先验信息加入进来，比如一个被喜欢率很高的用户，在未来任然高的概率比历史被喜欢率低的要高。所以一个用户的历史被喜欢率、喜欢率、匹配率都可以加入特征去影响匹配。

反馈率/在线率:这个指标需要计算用户在收到一个被喜欢后，多久会反馈，因为双向匹配网络中，两个人在互相右滑的间隔中，越短的间隔可以带来更好的首滑用户体验。反馈率=被喜欢后进行喜欢操作的时间间隔，在线率=一天24小时内在线次数(时间间隔小于30分钟记为1次)。

颜值分:用户会在注册使用产品中上传照片，通过图像识别进行颜值打分，这个分偏向于大众分，属于大部分人的审美；在匹配阶段使用的图像Match分更加重要，毕竟萝卜青菜各有所爱。

用户标签:当然用户双方选择并不是完全看颜值，毕竟大部分都是（长相）普通的人，所以可以通过标签及用户生活圈层的相似程度来为每个用户建立一套算法作为推荐参考。比如某大陌生人社交平台上有超过70%的人填了各种标签，平均每人填了15个以上的标签。这些都是在照片背后的信息，可以用来为匹配增加更多信息决策依据，而且越详细的标签也代表了用户的认真程度，可以加分不少，也是一个特征。在前期匹配，标签数据不一定有颜值这么有影响，但是长远来说，跟图片无关的文本型的信息，但是对聊天的影响非常大（比如职业、学历、背景相同可能话题更多，聊天更多）。

其它特征还有很多，比如用户的年龄、性别、使用频次、活跃时间段、地理位置(城市、小区)、星座、生日、毕业院校、工作行业、工作岗位、历史匹配数/率、左右滑卡数等等。对于统计类指标及样本进入模型是需要降噪，异常低频和高频的需要进行处理。

4、精准与去中心化

双向匹配算法中有两个要素：一个是精准度，一个是去中心化。既要控制头部的用户的超级火爆，第二个就是需要精准扶贫，对匹配困难户扶一把。这两个点真正做好的非常少，因为这两个一定程度上是相互冲突的。

这里面需要突出的是分别对供需建模（供需关系）、决策匹配建模（匹配率预估）、分配建模（流控、运筹规划）、匹配时效建模（时间预估）。

图20 匹配中的关键系统模块图

5、核心系统

针对上述的问题，需要构建起几大系统对网络、社会环境进行建模分析，比如仿真系统、计划系统、控制系统、指标系统、溯源系统。

指标系统: 业务的核心指标统计分析中心。

控制系统: 实际业务中的召回、排序、业务逻辑、流量控制等模块。

溯源系统: 通过日志埋点，记录历史每个时刻各个系统的状态，方便未来回溯分析。

仿真系统: 即“沙盘模拟环境”，交友类产品要求用户之间深度参与服务过程，线上试错成本极高。仿真系统主要是覆盖主流程，对于细节部分可以忽略，一般精度在8-9成，结合溯源回放历史过程对业务建模、用户行为模拟等方法模拟线上场景，仿真通过选取指标系统中的核心指标输出报告，做到离线预估，当然这个系统是逐步完善的。

计划系统: 利用全局历史数据、单粒度用户历史数据进行预测后，进行规划尽量逼近全局最优的流量和曝光分配方案，并通过控制系统在实际系统中产生影响，当然这个过程也是在实时调整的，客观和虚拟的实时融合，通过数据反馈时刻都在推演未来，就像下围棋一样，每一步的落子前多往前看几步棋，别人落子后，重新推演计算下一步方案。

图21 匹配场景中的若干系统

推荐架构:在这个体系内，用户上线瞬间，我们能准确找到它的潜在的匹配用户，预测出Ta有多受欢迎（在不同的冷热分桶里会有多少个喜欢），策略是让人 – 人匹配，和让过于受欢迎、有竞争力的用户能够牺牲部分曝光（由于大量的喜欢已经产生，这部分曝光为头部用户带来的边际收益很小），分配给新、中腰部用户，达到反馈提升的效果。调度系统对已有的各类算法匹配结果进行调度使用，跟据用户行为和既定分配策略，并使用增量学习算法，学习用户偏好并动态调整用户推荐结果。

图22 产品漏斗和模块解构

使用智能系统需要做双向概率预估，通过将A对B和B对A的喜欢概率进行预估，并相乘计算匹配成功率；由于反馈及时程度往往也较大地影响了这个用户的留存，所以在给用户匹配其他可能Ta喜欢的人时，我们需要在匹配计算公式中加入对方未来活跃(活跃时间间隔预估)并回复的概率，并作为因子影响匹配成功率。比如对实时在线的用户给予优先权（因子分数高），让反馈速度提升。并且我们在展示层引入供需关系，并通过冷热预估、投放策略（贪心、概率、bandit等）来进行控制。

各个模块要点和目标诉求可参考下图。

图23 目标与拆解

细节点上，我们需要在整流程中注意popularity(受欢迎度/热度)，distance(距离)，recency（活跃度），fatigue(疲劳度)，match(匹配度)等；通过引入用户静态标签在召回、排序、干预阶段进行策略学习(比如男生会学习到颜值的重要性，女生模型会学习到学历、职业等标签的重要性，有些喜欢多滑动多看漂亮小姐姐，有些希望快速匹配近距离的异性)。分地区、分时段、多模型的精细化预估；分布式、多线程、并行计算满足海量数据的实时性要求；在供需失衡之前，实施调控干预。通过数据和算法回顾过去、监控现在、预测未来，利用网络状态的分析及推演(看清网络，为优化提供支撑)指导业务。

图24 匹配产品背后的系统图

6、总结

社交类产品的发展壮大一定是感性与理性交织，个体匹配(微观)和全局匹配(宏观)兼顾的。尽可能从微观出发，利用数据和算法，得到宏观，并通过类似财务对账机制，保证两者的一致性，一致才能驱动优化。

社交类产品异常复杂，如何制定正确的优化指标真的很难，需要构建闭环，并缩短业务迭代的闭环，提升迭代效率，小步快跑试错。数据质量是地基，保证好质量，并多做复盘分析。业务理解 > 工程实现；数据 > 系统 > 算法。
永远没有一招鲜吃遍天的方法、模型、架构的，没有完美的产品形态，往往想出一个elegant idea，必须做足dirty work。

本文作者：阅读以明智，其版权均为原作者所有，文章内容系作者个人观点，不代表蜗牛派对观点赞同或支持，未经许可，请勿转载，题图来自Unsplash，基于CC0协议。

Facebook首届Deepfake检测挑战赛结果:准确率65.18%

蜗牛派 — Sat, 13 Jun 2020 03:36:27 +0000

蜗牛派6月13日消息，Facebook日前宣布了其首届Deepfake检测挑战赛的结果，获胜算法能够以65.18%的平均准确率发现非常逼真的Deepfake虚假内容。Deepfake检测挑战赛旨在寻找能够识别出由人工智能（AI）操纵的视频的算法。

Facebook首席技术官迈克·施罗普夫(MikeSchroepfer)表示，他对挑战赛的结果感到高兴，这将为研究人员创造一个基准，并指导他们未来的工作。他说：“老实说，这场比赛的成功程度超出了我的预期。”

约2114名参赛者提交了超过3.5万个Deepfake检测算法参加比赛，它们需要从大约10万个短片的数据集中识别假视频。Facebook雇佣了3000多名演员来制作这些视频，并利用AI进行了修改，将其他演员的脸粘贴到视频中。

Facebook目前正在开发自己的Deepfake检测技术，并于今年早些时候宣布将禁止此类内容。但批评人士指出，虚假信息面临的更大威胁来自使用传统手段编辑的假视频。

事实证明，Deepfake对社交媒体来说是一种被夸大的威胁。尽管这项技术引发了很多人对可靠视频证据被侵蚀的担忧，但到目前为止，Deepfake的政治影响还很小。相反，更直接的危害是创造非双方同意的色情内容，这类内容更容易被社交媒体平台识别和删除。