大音希声,大象无形;胜者无迹,故无可乘。
总结
好像推了个简单的定理出来, 姑且叫 沉默稳定定理 吧.
Theorem
在可伪造、非承诺、利益冲突的消耗战中,若信号本身有成本,解读信号也有成本,则唯一严格稳定且不可剥削的信号结构是:
对任意其它策略:
都有:
信号若有用, 就会被伪造;
信号若无用, 就没人发出;
没人发信号, 解读机制就只剩成本;
所以稳定状态只能是沉默.
1. 基本对象
1.1 信号空间
令:
表示所有非空信号。
例如:
加入一个特殊符号:
表示“不发信号”。
完整信号空间为:
1.2 行动空间
令:
表示真实行动空间。
在消耗战里,可以理解为:
或者更一般地, 是真实的对抗行动。
1.3 底层收益函数
令:
表示真实行动带来的收益。
如果自己采取行动 ,对方采取行动 ,自己的底层收益为:
这里的 可以包含全部交叉影响,例如:
- 谁坚持更久;
- 谁获得资源;
- 谁付出时间成本;
- 双方行动组合带来的收益差异。
我们不把这些影响拆成几个简单相加的项。
2. 无信号基准行为
设无信号消耗战中的基准稳定行动分布为:
当没有任何信号时,个体按照 行动。
定义:
这是无信号基准收益。
我们需要一个底层稳定假设:
对任意:
成立。
也就是:
在无信号消耗战中不可被单方行动偏离剥削。
如果要得到严格稳定,则再假设:
这表示 是底层严格稳定行为。
道金斯那段“退却时间不能被预估”的意思,正是在说明消耗战里稳定行为不是固定行动,而是某种不可预知的随机行动。任何提前暴露未来行为的迹象都会被利用。
3. 策略
一个完整策略写作:
其中 是发信号规则, 是行动规则。
3.1 发信号规则
在这个简化模型里,发信号规则就是一个分布:
玩家按:
发出信号。
特殊规则:
即:
所以:
3.2 行动 / 解读规则
行动规则写成:
其中:
表示:
自己发出了 ,观察到对方发出了 ,然后采取的行动分布。
这里第一项 是自己的信号,第二项 是对方的信号。
这样可以表达信号和后续行动的绑定。
例如:
表示发出 之后真的死磕。
而:
表示发出 之后其实不死磕。
3.3 无信号归一化
为了让模型只研究“信号层”,我们规定:
意思是:
如果双方都没有发信号,那么行动回到无信号基准行为。
否则,某个策略可以通过 改变底层行动,这就不是信号问题了,而是在换一个消耗战策略。
3.4 不解读信号规则
定义:
也就是:
扑克脸策略为:
即:
4. 成本
4.1 信号成本
定义信号成本:
满足:
并且:
发信号分布 的期望成本为:
所以:
若:
则:
4.2 规则成本
定义行动 / 解读规则成本:
满足:
并且:
这里 可以理解为:
- 维护信号—行动对应关系的成本;
- 认知成本;
- 误判风险;
- 策略复杂度成本。
如果不接受这条假设,那么可以得到弱稳定,但不能得到唯一严格稳定。
5. 总期望收益
设玩家 1 使用:
玩家 2 使用:
过程如下:
玩家 1 发出:
玩家 2 发出:
玩家 1 行动:
玩家 2 行动:
注意玩家 2 的行动规则写作 ,因为对玩家 2 来说, 是自己的信号, 是对方的信号。
于是玩家 1 的期望收益定义为:
这个式子没有把收益强行拆成“发送影响 + 解读影响”。
所有交叉影响都留在:
里面。
6. 稳定、不可剥削、可剥削
6.1 严格稳定
策略 称为严格稳定,如果对任意:
都有:
意思是:
当种群全都使用 时,任何突变策略 都不能入侵。
如果存在:
使得:
则称 不稳定。
6.2 不可剥削
策略 称为不可剥削,如果对任意策略 ,都有:
意思是:
没有任何外部策略能在面对 时获得高于 自身的收益。
严格稳定蕴含不可剥削。
6.3 信号可剥削
策略 称为信号可剥削,如果存在某个发信号分布 和某个行动规则 ,使得:
意思是:
面对 ,某个突变者在保持同一套信号—行动规则 的前提下,选择发出信号,比选择沉默更有利。
这正好表达“你的信号系统给了对方一个可利用入口”。
若对任意:
都有:
则称 信号不可剥削。
7. 定理
在上述模型与假设下:
严格稳定,且不可剥削。
并且,对任意:
都有:
或者:
即:
8. 证明第一部分: 稳定且不可剥削
先计算:
双方都使用:
所以:
双方都使用:
所以:
且:
因此:
现在取任意突变策略:
计算:
因为对方使用 ,所以:
因为对方使用 ,所以无论自己发出什么 ,对方行动都是:
突变者自己的行动分布由:
共同决定。
把突变者面对无信号对手时诱导出的行动分布记为:
这是一个 上的分布。
于是:
由底层稳定假设:
所以:
而:
因此:
所以:
若:
则至少有:
或:
如果 ,则:
如果 ,则:
因此:
再结合底层稳定假设,得到:
所以:
第一部分证毕。
9. 证明第二部分:其它策略要么可剥削,要么不稳定
取任意:
分两种情况。
情况一: 信号可剥削
如果存在:
使得:
那么按照定义:
结论成立。
情况二: 信号不可剥削
现在假设 信号不可剥削。
即:
因为:
所以分两种可能。
情况二 A:
考虑突变策略:
它和 使用同一个行动规则 ,但不发信号。
由信号不可剥削定义,对任意 有:
令:
得到:
也就是:
且:
因为:
于是存在突变体 ,使得:
这违反严格稳定定义。
所以:
直觉是:
如果面对 ,任何发信号都不比沉默更好,那么一个“不发信号但保留同样行动规则”的突变体至少不差。
情况二 B:,但
此时:
也就是:自己不发信号,但保留一个非平凡行动 / 解读规则。
因为双方都不发信号,所以:
根据无信号归一化:
所以:
因此:
由于:
所以:
于是:
现在考虑扑克脸突变体:
它面对 时,双方仍然都不发信号:
双方行动仍为:
但扑克脸没有规则成本:
所以:
于是:
因此:
第二部分证毕。
10. 结论
在这个更适合表达“诚实 / 说谎”的模型里:
即行动同时依赖于自己的信号和对方信号。
这时仍然可以证明:
并且:
其中:
表示:
表示:
11. 这个模型如何表达“诚实 / 说谎”
设:
表示“竖毛”。
设:
表示“死磕行动”,例如坚持时间超过某个阈值。
那么:
诚实竖毛
表示:
一旦自己发出 ,之后确实采取死磕行动。
此时 是诚实信号。
虚假竖毛
表示:
自己发出 ,但之后并不真的死磕。
此时 是虚假信号。
不动声色
表示:
根本不发 ,也不发任何其它信号。
并且:
表示:
即使看到别人发 ,也不改变自己的行动。
所以,你这个改法是成立的。
它比上一版更好的一点是:
可以直接把“自己发了什么”和“自己之后做什么”绑定起来。
这样“诚实”不再依赖外生状态 ,而是变成一个内生关系:
最后的证明结构仍然不变:
稳定且不可剥削。

每个时刻随机有一定的退让概率.