标准式博弈

标准式博弈

标准式博弈

对于33元组Γ=(I,S,π)\Gamma=(I,S,\pi)Γ\Gamma被称为标准式博弈(normal form game),如果满足以下条件:

  1. 规定II表示(在Γ\Gamma中)玩家集合II是可列的
  2. S={S[i]iI}S=\bigg\{S[i]\bigg|i \in I\bigg\},规定S[i]S[i]表示玩家ii(在Γ\Gamma中)的策略集合SS表示(在Γ\Gamma中)策略空间
  3. π={π[i]iI}\pi=\bigg\{\pi[i]\bigg|i \in I\bigg\},规定π[i]\pi[i]表示玩家ii(在Γ\Gamma中)的收益函数π\pi表示(在Γ\Gamma中)收益函数组合,即有

π[i]:SR\pi[i]:S \to \mathbb R

补充说明 对于标准式博弈Γ=(I,S,π)\Gamma=(I,S,\pi),令JJII的某一全排序,记S[J]=×jJS[j]S[J] = \underset{j \in J}\times S[j]π[J]=×jJπ[j]\pi[J] = \underset{j \in J}\times \pi[j],即有

sS, π[J](s)=×jJπ[j](s)RJ\forall s \in S, \space \pi[J](s) = \underset{j \in J}\times \pi[j](s) \in \mathbb{R}^{|J|}

。特别的,如果II本身是有序的,那么可默认S=S[I]S=S[I]π=π[I]\pi=\pi[I]


有限标准式博弈

对于标准式博弈Γ=(I,S,π)\Gamma=(I,S,\pi)Γ\Gamma被称为有限标准式博弈(finite normal form game)或者是有限的,如果满足以下条件:

  1. 0<I<0<|I|<\infty
  2. iI, 0<S[i]<\forall i \in I,\space 0<|S[i]|<\infty

扩展博弈

对于标准式博弈Γ=(I,S,π)\Gamma=(I,S,\pi),标准式博弈H=(I,Δ,u)\mathrm{H}=(I,\Delta,u)被称为Γ\Gamma的(混合策略)扩展博弈(extensive game),如果满足以下条件:

  1. Γ\GammaH\mathrm{H}玩家集合都是II
  2. Δ={Δ[i]iI}\Delta=\bigg\{\Delta[i]\bigg|i \in I\bigg\},规定Δ[i]\Delta[i]表示玩家ii(在H\mathrm{H}中)的策略集合Δ\Delta表示(在H\mathrm{H}中)策略空间,即有

Δ[i]={x[i]R+S[i]kS[i]x[i,k]=1}\Delta[i] = \bigg\{x[i]\in\mathbb{R}_+^{|S[i]|}\bigg|\sum_{k \in S[i]} x[i,k]=1\bigg\}

  1. u={u[i]iI}u=\bigg\{u[i]\bigg|i \in I\bigg\},规定u[i]u[i]表示玩家ii(在H\mathrm{H}中)的收益函数uu表示(在H\mathrm{H}中)收益函数组合,即有

u[i]:ΔRu[i]:\Delta \to \mathbb R

;对于sSs \in SxΔx \in \Delta,记x(s)=iIx[i,s[i]]x(s)=\displaystyle\prod_{i \in I}x[i,s[i]],则有

u[i](x)=sSx(s)π[i](s)u[i](x)=\sum_{s \in S} x(s)\cdot\pi[i](s)

补充说明 对于标准式博弈Γ=(I,S,π)\Gamma=(I,S,\pi)及其扩展博弈H=(I,Δ,u)\mathrm{H}=(I,\Delta,u),为简便起见,假定II是有序的。对于iI,xΔ\forall i \in I, \forall x \in \Deltax[i]x[i]可被认为是iiS[i]S[i]上的频率分布策略,即可定义混合策略为线性组合x[i]S[i]x[i] \cdot S[i],而Δ[i][0:1]S[i]\Delta[i] \subset [0{:}1]^{|S[i]|}ii的所有可选的线性组合,如此可记Θ[i]\Theta[i]作为S[i]S[i]的凸包,即有

Θ[i]={δS[i]δΔ[i]}=co(S[i])\Theta[i] = \bigg\{\delta\cdot S[i]\bigg|\delta \in \Delta[i]\bigg\}=\mathrm{co}(S[i])

,继而有SS的凸包

Θ=×iIΘ[i]=co(S)\Theta = \underset{i \in I}\times \Theta[i]=\mathrm{co}(S)

。由此可见,Δ[i]\Delta[i]Θ[i]\Theta[i]是同构的,Δ[i]\Delta[i]可以被视为在RS[i]\mathbb{R}^{|S[i]|}上的一个标准的单位正交基的凸包,且当S[i]<|S[i]|<\infty时,Δ[i]\Delta[i]是在RS[i]\mathbb{R}^{|S[i]|}中的一个S[i]1|S[i]|-1维单纯形。因而,Δ\DeltaΘ\Theta是同构的,如果Γ\Gamma是有限的,那么Δ=×iIΔ[i]×iI[0:1]S[i]\Delta = \underset{i \in I}\times \Delta[i] \subset \underset{i \in I}\times [0{:}1]^{|S[i]|}RiIS[i]\mathbb{R}^{\prod_{i \in I} |S[i]|}中的一个凸多面体。


占优策略

对于标准式博弈Γ=(I,S,π)\Gamma=(I,S,\pi),对于iIi \in IxSx \in S,记x[i]\mathscr{x}[-i]xx去除x[i]x[i]后剩余的组合,可以定义下面这些概念:

  1. x[i]S[i]x[i] \in S[i]弱占优于y[i]S[i]y[i] \in S[i],记作x[i]y[i]x[i] \succcurlyeq y[i],如果满足:
  1. zS, π[i](x[i],z[i])π[i](y[i],z[i])\forall z \in S,\space \pi[i](x[i],*\mathscr{z}[-i])\ge\pi[i](y[i],*\mathscr{z}[-i])
  2. zS, π[i](x[i],z[i])>π[i](y[i],z[i])\exists z \in S,\space\pi[i](x[i],*\mathscr{z}[-i])>\pi[i](y[i],*\mathscr{z}[-i])
  1. x[i]S[i]x[i] \in S[i]严格占优于y[i]S[i]y[i] \in S[i],记作x[i]y[i]x[i] \succ y[i],如果满足:
  1. zS, x[i]y[i]    π[i](x[i],z[i])>π[i](y[i],z[i])\forall z \in S,\space x[i] \ne y[i] \implies \pi[i](x[i],*\mathscr{z}[-i])>\pi[i](y[i],*\mathscr{z}[-i])
  1. x[i]S[i]x[i] \in S[i]ii弱占优策略,如果满足:
  1. zS, y[i]S[i], x[i]y[i]    x[i]y[i]\forall z \in S,\space \forall y[i] \in S[i],\space x[i] \ne y[i] \implies x[i] \succcurlyeq y[i]
  1. x[i]S[i]x[i] \in S[i]ii严格占优策略,如果满足:
  1. zS, y[i]S[i], x[i]y[i]    x[i]y[i]\forall z \in S,\space \forall y[i] \in S[i],\space x[i] \ne y[i] \implies x[i] \succ y[i]

未完待续。。。

评论

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×