标准式博弈
对于3元组Γ=(I,S,π),Γ被称为标准式博弈(normal form game),如果满足以下条件:
- 规定I表示(在Γ中)玩家集合,I是可列的
- 记S={S[i]∣∣∣∣i∈I},规定S[i]表示玩家i(在Γ中)的策略集合,S表示(在Γ中)策略空间
- 记π={π[i]∣∣∣∣i∈I},规定π[i]表示玩家i(在Γ中)的收益函数,π表示(在Γ中)收益函数组合,即有
π[i]:S→R
补充说明 对于标准式博弈Γ=(I,S,π),令J是I的某一全排序,记S[J]=j∈J×S[j],π[J]=j∈J×π[j],即有
∀s∈S, π[J](s)=j∈J×π[j](s)∈R∣J∣
。特别的,如果I本身是有序的,那么可默认S=S[I]和π=π[I]。
有限标准式博弈
对于标准式博弈Γ=(I,S,π),Γ被称为有限标准式博弈(finite normal form game)或者是有限的,如果满足以下条件:
- 0<∣I∣<∞
- ∀i∈I, 0<∣S[i]∣<∞
扩展博弈
对于标准式博弈Γ=(I,S,π),标准式博弈H=(I,Δ,u)被称为Γ的(混合策略)扩展博弈(extensive game),如果满足以下条件:
- Γ和H的玩家集合都是I
- 记Δ={Δ[i]∣∣∣∣i∈I},规定Δ[i]表示玩家i(在H中)的策略集合,Δ表示(在H中)策略空间,即有
Δ[i]={x[i]∈R+∣S[i]∣∣∣∣∣k∈S[i]∑x[i,k]=1}
- 记u={u[i]∣∣∣∣i∈I},规定u[i]表示玩家i(在H中)的收益函数,u表示(在H中)收益函数组合,即有
u[i]:Δ→R
;对于s∈S和x∈Δ,记x(s)=i∈I∏x[i,s[i]],则有
u[i](x)=s∈S∑x(s)⋅π[i](s)
补充说明 对于标准式博弈Γ=(I,S,π)及其扩展博弈H=(I,Δ,u),为简便起见,假定I是有序的。对于∀i∈I,∀x∈Δ,x[i]可被认为是i在S[i]上的频率分布策略,即可定义混合策略为线性组合x[i]⋅S[i],而Δ[i]⊂[0:1]∣S[i]∣是i的所有可选的线性组合,如此可记Θ[i]作为S[i]的凸包,即有
Θ[i]={δ⋅S[i]∣∣∣∣δ∈Δ[i]}=co(S[i])
,继而有S的凸包
Θ=i∈I×Θ[i]=co(S)
。由此可见,Δ[i]和Θ[i]是同构的,Δ[i]可以被视为在R∣S[i]∣上的一个标准的单位正交基的凸包,且当∣S[i]∣<∞时,Δ[i]是在R∣S[i]∣中的一个∣S[i]∣−1维单纯形。因而,Δ和Θ是同构的,如果Γ是有限的,那么Δ=i∈I×Δ[i]⊂i∈I×[0:1]∣S[i]∣是R∏i∈I∣S[i]∣中的一个凸多面体。
占优策略
对于标准式博弈Γ=(I,S,π),对于i∈I和x∈S,记x[−i]是x去除x[i]后剩余的组合,可以定义下面这些概念:
- 称x[i]∈S[i]弱占优于y[i]∈S[i],记作x[i]≽y[i],如果满足:
- ∀z∈S, π[i](x[i],∗z[−i])≥π[i](y[i],∗z[−i])
- ∃z∈S, π[i](x[i],∗z[−i])>π[i](y[i],∗z[−i])
- 称x[i]∈S[i]严格占优于y[i]∈S[i],记作x[i]≻y[i],如果满足:
- ∀z∈S, x[i]=y[i]⟹π[i](x[i],∗z[−i])>π[i](y[i],∗z[−i])
- 称x[i]∈S[i]是i的弱占优策略,如果满足:
- ∀z∈S, ∀y[i]∈S[i], x[i]=y[i]⟹x[i]≽y[i]
- 称x[i]∈S[i]是i的严格占优策略,如果满足:
- ∀z∈S, ∀y[i]∈S[i], x[i]=y[i]⟹x[i]≻y[i]
未完待续。。。