题目描述
设有一个转盘被均分为 n 个区域,分别标号为 {1,2,…,n}。每次旋转转盘,各数字出现的概率均为 n1。重复旋转,记录出现的数字序列 X1,X2,…。实验在首次出现重复数字时停止。令随机变量 S=X1+X2+⋯+XT,其中 T+1 是首次出现重复数字的时刻。求 E[S]。
解题思路
记样本空间为 Ω={1,2,…,n},记录的数字集合为 A={X1,X2,…,XT}。
根据期望的线性性质,E[S]=E[∑i=1ni⋅1{i∈A}]=∑i=1ni⋅P(i∈A)。(其中 1{i∈A} 是指示函数,当 i∈A 时取值为 1,否则为 0。)
考虑任意数字 i,j∈Ω,由对称性可知,任意两个数字被记录的概率相同,即 P(i∈A)=P(j∈A)。因此,设 P(i∈A)=p,则有:
E[S]=i=1∑ni⋅p=2n(n+1)⋅p
计算 p。根据期望的线性性质,E[T]=∑i=1nE[1{i∈A}]=∑i=1nP(i∈A)=n⋅p。
则 E[S]=2n(n+1)⋅nE[T]=2n+1E[T]。
计算 E[T]。T 是在出现重复前选出的不同元素个数。P(E≥k) 表示前 k 个元素都不重复的概率,即:
P(E≥k)=nn⋅nn−1⋅nn−2⋯nn−k+1=(n−k)!nkn!
由期望的定义,E[T]=∑k=1nP(E≥k)=∑k=1n(n−k)!nkn!。
因此,最终结果为:
E[S]=2n+1k=1∑n(n−k)!nkn!
变体问题
变体一:转盘被均分为 n+1 个区域,其中一个区域为空白,其余规则不变。
解答:
空白区域既不计入 S 的求和,也不会导致实验提前停止。因此,空白区域对数字序列没有影响;换言之,考虑转盘得到的数字序列 X1,X2,…,在忽略空白后,与原问题完全相同。
因此,变体一的期望值与原问题相同。
变体二:转盘被均分为 n+1 个区域,其中一个区域为空白,且当转到空白区域或者已经出现过的数字时,实验停止。
解答:
以数字 0 表示空白区域,新的停止条件变为了出现 0 或者出现重复数字。
P(E≥k) 表示前 k 个元素都不重复且不为 0 的概率,即:
P(E≥k)=n+1n⋅n+1n−1⋅n+1n−2⋯n+1n−k+1=(n−k)!(n+1)kn!
除此之外,E[T] 的计算方法与原问题相同。代入 E[S]=2n+1E[T],
最终结果为:
E[S]=2n+1k=1∑n(n−k)!(n+1)kn!