硅谷投资人王川：抄袭模仿让强者更强？

来源：腾讯科技发布时间：2017.04.11

（1）

到陌生都市的游客，驻足街头寻找餐馆时，常常面临这样一个问题:

一家餐馆人满为患，热闹非凡; 隔壁另一家餐馆门可罗雀，只有两三个食客.

在没有其它更多信息的情况下，该到哪家餐馆吃?

如果你像大多数人一样, 答案是:选择那家人多的餐馆.

因为你没有能力迅速判断哪家餐馆更好，而其他人的选择，成了最可靠的指南.

这种行为模式的后果是，拥挤的餐馆生意越来越好. 人少的餐馆则长期萧条，倒闭的风险更大.

世上多有自命不凡者，为标榜自己的与众不同，常常不屑的评论同类说， “ *国人就是浮躁，爱扎堆！”

模仿/抄袭其他人的行为方式，究竟是愚蠢浅薄，还是聪明实用？不爱扎堆，特立独行的个体，是否真的比爱扎堆的个体，有更多进化优势？

（2）

2007年，英国 St Andrews 大学的进化生物学家 Kevin Laland，决定通过公开悬赏一万英镑的方式，给这个问题寻找一个科学的答案.

他给全世界的学术界同仁发公开信:

“假设你在一个陌生的环境里，不知道哪里有好吃的，不知道如何从点 A到点 B，你会花时间自己调查呢，还是观察模仿其他人？如果模仿，你会模仿谁？你看到的第一个人吗，还是最常见的行为方式？你总是模仿呢，还是选择性的模仿？”

竞赛的规则，是以所谓的“多臂赌博机”(multi-armed bandit) 的数学模型为基础. 赌博机，也叫老虎机，赌徒在投掷硬币后，转动其把柄（就是所谓的 “臂”）后，马上可以看到自己的回报.

参赛者每一个回合的行动，可以有三个选择: 观察，探索和开发.

观察, 就是看别的参赛者的行为 (拨动了哪个老虎机?) 和相应的回报, 记录下来.

探索，就是随机尝试探索别的行为（老虎机）和相应的回报，记录下来.

开发，就是在自己记录下来的策略中选择，直接拨动一个老虎机，获得相应的回报.

每个老虎机的回报，不是完全固定，而会随时间推进，有一定几率会改变.

只有选择“开发”的行为时，才可以真正获得回报。参赛的程序，必须制定策略，分配多少时间去开发，探索或者是观察。参赛者，每个回合都有可能死亡，而其过去每个回合的平均回报越低，死亡被淘汰的概率就越大.

包括Laland 在内的大部分学者，在比赛开始前，预测胜出的策略，将会是模仿和探索的这两种学习方式的结合.

来自十六个国家的 104个参赛者，提供了他们的竞赛程序。经过一年多，两个阶段，几十万个回合的厮杀，来自加拿大的两个年轻研究生提交的一个叫做 discountmachine 的算法，意外地获得第一名.

(配图来自 Rendell 和 Laland 2010年四月发表在“科学”杂志上的论文，"Why Copy Others?")

discountmachine 的策略，以“观察”为主，几乎完全不用“探索”的学习方式。即便在竞赛主持者调节各种环境参数后 (改变环境变化速度，改变观察信息失真或者无效的几率，改变可观测的其它个体的数目), 这个策略仍然在绝大多数情况下轻松击败其它对手.

事后分析，“观察”，作为一种社交学习方式，它的本质优势在于，观察到的社会其它成员的行为，有较大的几率是回报最高的选择，所以值得模仿。这种优势在相对稳定的环境里尤其突出。而“探索”获得的回报，统计平均上会趋于平庸，不利于建立进化优势.

唯一的例外，是环境变化速度极快的情况，这意味着老的行为模式的回报随时间流逝变化很大，简单的模仿抄袭完全丧失了价值.

生物界的扎堆现象，原来不是天生如此，而是进化淘汰的自然结果。那些总是特立独行者，大多很快耗尽自身资源而早夭。

(3)

美国学者，前哥伦比亚大学教授，Duncan Watts 2006年曾经做了一个实验:

他从网上召集了一万多名少年测试者，给他们一组 48 首不知名的歌曲的清单，观察他们下载试听歌曲的行为。测试者可以先试听音乐，然后决定是否下载歌曲。测试者分为两组，一组知道每首歌曲其他多少人下载 (A组), 另一组则什么都不知道 (B 组).

没有多余信息的 B 组，48 首歌曲下载的分布是这样的:

（配图来自 Peter Ormerod 的著作 "Positive Linking", 下同）

不同歌曲, 下载数目差别不大. 如果把中位数设为 100，下载数从 175 到 50以下，均匀分布.

而 A 组，下载的分布是这样的:

排名第一的歌曲的下载数是 350，第二名是 200，最后一名歌曲的下载数不到 10，除了前三名以外，其它所有歌曲下载数都低于100，而一半以上的歌曲下载数不到30 !

公开透明的信息，使个体迅速模仿他人的选择。模仿的结果，则是市场份额急剧向前几名倾斜。前几名吃肉，其他人只能喝汤.

这个现象在网络时代尤其突出. 美国有统计数字显示，谷歌搜索使用者 98%都只会点击前面三个搜索结果，而第一个搜索结果会得到 60% 的点击. 如果你在搜索结果排行前三名之外，不要说肉，连汤也很难喝上了.

(4)

进一步观察歌曲下载数的细节时，Watts 和他的团队又有新的发现:

歌曲下载数目的相对排序，两个对照组之间，并没有很强的关联。有更多信息后，最大的改变，来自于谁变成了第一名，谁变成最后一名。原先最热门的歌曲变得冷门的概率很小，最冷门的歌曲变得热门的概率也很小.

但是其它各种情况都有可能. 原先排名中间的歌曲，可能突然变成头牌，但更可能的是，排名跌倒最后，无人问津.

这个现象的后果让人不禁打了一个激灵:

一些行业涌现出来的成功者，很可能是因为这种个体模仿的网络效应所致. 其产品特性, 往往并不是最优秀的.

但成功者可能错误的把成功归因于产品特性。失败者则没有研究如何正确利用网络效应，而是开错了药方，继续埋头研究如何提高产品特性，但这并没有什么卵用。失败者长期陷入 "失败 - 开错药方 - 继续失败 - 继续用错药"的痛苦怪圈内苦苦挣扎，无法自拔.

（5）

实际上，对于群体抄袭模仿的行为导致的正反馈现象，匈牙利数学家波利亚 (George Polya) 早就提出过所谓 “波利亚罐子模型（Polya Urn Model)”的问题。这个罐子模型的一个例子是:

有一个罐子，装满红色和绿色的球。红球和绿球的数目一样, 50/50。假设我们每次从罐子里随机拿出一个球，然后再把这个球和另外一个相同颜色的球放回罐子里.如果我们不断长期重复这个过程，最终罐子里的球的颜色分布会是什么样子的?

英国经济学家 Brian Arthur 和几名同事在 1983 年的论文里，计算分析这个例子得出的结论是:

1) 给足够长的时间，最终这两个不同颜色的球的比例，将会接近 100:0.

2) 最开始很难预测是红球，还是绿球会胜出. 受各种偶然因素影响, 都有可能.

3) 胜出者在过程的早期就会涌现.

4) 一旦领先，很难反转.

这里的关键是: 事先无法预测谁是胜者, 但在早期胜者开始涌现, 趋势不可逆转时，应果断加仓, 顺应趋势.

(6)

西班牙服装品牌 Zara, 采用的就是这种策略。他们意识到对于未来几个月流行服装款式的预测，他们其实不比别人强。大部分时装品牌公司, 试图预测下一季流行的款式，但一旦预测失误，大批服装在店里滞销，损失惨重.

Zara 派人定期到各个大规模购物中心，观察消费者的穿衣样式。再根据这些数据，设计大量各种款式,衣料和颜色的服装组合，随后迅速生产出小批量的成衣，送到零售店.

零售店的销售数据，马上可以告诉他们什么款式卖得好. 他们再据此信息, 迅速大规模生产卖得好的款式. Zara 可以在两周内, 完成对新款服装的设计/生产/运输/销售，覆盖全世界的所有角落.

Zara 的创始人，Amancio Ortega, 2017年三月时身价高达七百亿美元，是欧洲首富.

抄袭模仿，是导致强者益强的唯一因素吗？

落后者，难道就永远没有机会翻盘吗？

如何以弱胜强？

何时需要果断止损，退出放弃一个市场？

且听下回分解.

(作者：硅谷王川编辑：ahtianen)

上一篇：加码Azure 微软收购开源软件容器提供商Deis

下一篇：BAT齐聚首，人工智能未来会如何改变我们的生活？

硅谷投资人王川：抄袭模仿让强者更强？

合作伙伴

关于天恩

重点推荐

资质证书