大音希声,大象无形;胜者无迹,故无可乘。

总结

好像推了个简单的定理出来, 姑且叫 沉默稳定定理 吧.

Theorem

在可伪造、非承诺、利益冲突的消耗战中,若信号本身有成本,解读信号也有成本,则唯一严格稳定且不可剥削的信号结构是:

对任意其它策略:

都有:

信号若有用, 就会被伪造;
信号若无用, 就没人发出;
没人发信号, 解读机制就只剩成本;
所以稳定状态只能是沉默.

1. 基本对象

1.1 信号空间

令:

表示所有非空信号。

例如:

加入一个特殊符号:

表示“不发信号”。

完整信号空间为:


1.2 行动空间

令:

表示真实行动空间。

在消耗战里,可以理解为:

或者更一般地, 是真实的对抗行动。


1.3 底层收益函数

令:

表示真实行动带来的收益。

如果自己采取行动 ,对方采取行动 ,自己的底层收益为:

这里的 可以包含全部交叉影响,例如:

  • 谁坚持更久;
  • 谁获得资源;
  • 谁付出时间成本;
  • 双方行动组合带来的收益差异。

我们不把这些影响拆成几个简单相加的项。


2. 无信号基准行为

设无信号消耗战中的基准稳定行动分布为:

当没有任何信号时,个体按照 行动。

定义:

这是无信号基准收益。

我们需要一个底层稳定假设:

对任意:

成立。

也就是:

在无信号消耗战中不可被单方行动偏离剥削。

如果要得到严格稳定,则再假设:

这表示 是底层严格稳定行为。

道金斯那段“退却时间不能被预估”的意思,正是在说明消耗战里稳定行为不是固定行动,而是某种不可预知的随机行动。任何提前暴露未来行为的迹象都会被利用。


3. 策略

一个完整策略写作:

其中 是发信号规则, 是行动规则。


3.1 发信号规则

在这个简化模型里,发信号规则就是一个分布:

玩家按:

发出信号。

特殊规则:

即:

所以:


3.2 行动 / 解读规则

行动规则写成:

其中:

表示:

自己发出了 ,观察到对方发出了 ,然后采取的行动分布。

这里第一项 是自己的信号,第二项 是对方的信号。

这样可以表达信号和后续行动的绑定。

例如:

表示发出 之后真的死磕。

而:

表示发出 之后其实不死磕。


3.3 无信号归一化

为了让模型只研究“信号层”,我们规定:

意思是:

如果双方都没有发信号,那么行动回到无信号基准行为。

否则,某个策略可以通过 改变底层行动,这就不是信号问题了,而是在换一个消耗战策略。


3.4 不解读信号规则

定义:

也就是:

扑克脸策略为:

即:


4. 成本

4.1 信号成本

定义信号成本:

满足:

并且:

发信号分布 的期望成本为:

所以:

若:

则:


4.2 规则成本

定义行动 / 解读规则成本:

满足:

并且:

这里 可以理解为:

  • 维护信号—行动对应关系的成本;
  • 认知成本;
  • 误判风险;
  • 策略复杂度成本。

如果不接受这条假设,那么可以得到弱稳定,但不能得到唯一严格稳定。


5. 总期望收益

设玩家 1 使用:

玩家 2 使用:

过程如下:

玩家 1 发出:

玩家 2 发出:

玩家 1 行动:

玩家 2 行动:

注意玩家 2 的行动规则写作 ,因为对玩家 2 来说, 是自己的信号, 是对方的信号。

于是玩家 1 的期望收益定义为:

这个式子没有把收益强行拆成“发送影响 + 解读影响”。

所有交叉影响都留在:

里面。


6. 稳定、不可剥削、可剥削

6.1 严格稳定

策略 称为严格稳定,如果对任意:

都有:

意思是:

当种群全都使用 时,任何突变策略 都不能入侵。

如果存在:

使得:

则称 不稳定。


6.2 不可剥削

策略 称为不可剥削,如果对任意策略 ,都有:

意思是:

没有任何外部策略能在面对 时获得高于 自身的收益。

严格稳定蕴含不可剥削。


6.3 信号可剥削

策略 称为信号可剥削,如果存在某个发信号分布 和某个行动规则 ,使得:

意思是:

面对 ,某个突变者在保持同一套信号—行动规则 的前提下,选择发出信号,比选择沉默更有利。

这正好表达“你的信号系统给了对方一个可利用入口”。

若对任意:

都有:

则称 信号不可剥削。


7. 定理

在上述模型与假设下:

严格稳定,且不可剥削。

并且,对任意:

都有:

或者:

即:


8. 证明第一部分: 稳定且不可剥削

先计算:

双方都使用:

所以:

双方都使用:

所以:

且:

因此:


现在取任意突变策略:

计算:

因为对方使用 ,所以:

因为对方使用 ,所以无论自己发出什么 ,对方行动都是:

突变者自己的行动分布由:

共同决定。

把突变者面对无信号对手时诱导出的行动分布记为:

这是一个 上的分布。

于是:

由底层稳定假设:

所以:

而:

因此:

所以:

若:

则至少有:

或:

如果 ,则:

如果 ,则:

因此:

再结合底层稳定假设,得到:

所以:

第一部分证毕。


9. 证明第二部分:其它策略要么可剥削,要么不稳定

取任意:

分两种情况。


情况一: 信号可剥削

如果存在:

使得:

那么按照定义:

结论成立。


情况二: 信号不可剥削

现在假设 信号不可剥削。

即:

因为:

所以分两种可能。


情况二 A:

考虑突变策略:

它和 使用同一个行动规则 ,但不发信号。

由信号不可剥削定义,对任意 有:

令:

得到:

也就是:

且:

因为:

于是存在突变体 ,使得:

这违反严格稳定定义。

所以:

直觉是:

如果面对 ,任何发信号都不比沉默更好,那么一个“不发信号但保留同样行动规则”的突变体至少不差。


情况二 B:,但

此时:

也就是:自己不发信号,但保留一个非平凡行动 / 解读规则。

因为双方都不发信号,所以:

根据无信号归一化:

所以:

因此:

由于:

所以:

于是:

现在考虑扑克脸突变体:

它面对 时,双方仍然都不发信号:

双方行动仍为:

但扑克脸没有规则成本:

所以:

于是:

因此:

第二部分证毕。


10. 结论

在这个更适合表达“诚实 / 说谎”的模型里:

即行动同时依赖于自己的信号和对方信号。

这时仍然可以证明:

并且:

其中:

表示:

表示:


11. 这个模型如何表达“诚实 / 说谎”

设:

表示“竖毛”。

设:

表示“死磕行动”,例如坚持时间超过某个阈值。

那么:

诚实竖毛

表示:

一旦自己发出 ,之后确实采取死磕行动。

此时 是诚实信号。

虚假竖毛

表示:

自己发出 ,但之后并不真的死磕。

此时 是虚假信号。

不动声色

表示:

根本不发 ,也不发任何其它信号。

并且:

表示:

即使看到别人发 ,也不改变自己的行动。


所以,你这个改法是成立的。

它比上一版更好的一点是:

可以直接把“自己发了什么”和“自己之后做什么”绑定起来。

这样“诚实”不再依赖外生状态 ,而是变成一个内生关系:

最后的证明结构仍然不变:

稳定且不可剥削。

每个时刻随机有一定的退让概率.