●Страховщик хочет оценить среднюю выплату по полису. Чем больше полисов в выборке, тем точнее оценка. Как именно растёт точность с ростом n? Ответ — в законе больших чисел: дисперсия выборочного среднего равна \(\sigma^2/n\) и убывает к нулю.
Выборочное среднее \(\bar{X}\) — это сумма n независимых слагаемых, делённая на n. Дисперсия суммы n независимых одинаковых слагаемых \(= n \cdot \sigma^2\). Делим на \(n^2\) (деление на \(n^2\) при масштабировании \(1/n\)): \(Var[\bar{X}] = n \cdot \sigma^2/n^2 = \sigma^2/n\). При \(n=100\) разброс вчетверо меньше, чем при \(n=25\).
![График $Var[\bar{X}]=\sigma^2/n$ как функция n: гиперболически убывает к нулю. Видно, что удвоение n вдвое уменьшает дис](/img/law-of-large-numbers.png)
График \(Var[\bar{X}]=\sigma^2/n\) как функция n: гиперболически убывает к нулю. Видно, что удвоение n вдвое уменьшает дисперсию.
✍️ Разберём на числах
\(X\) с \(Var[X]=4\), \(n=50\). \(Var[\bar{X}] = 4/50 = 0{,}08\). По неравенству Чебышёва: \(P(|\bar{X}-\mu| \geq 0{,}5) \leq 0{,}08/0{,}25 = 0{,}32\).
📐 Формула