●Представьте страховой портфель из 100 полисов ОСАГО. Каждый клиент может подать иск с вероятностью 0.2 — то есть в среднем 20 исков за период. Как оценить разброс суммарных выплат?
Число исков \(N\) имеет биномиальное распределение \(\mathrm{Bin}(100, 0.2)\). Его ключевое свойство: \(\mathrm{Var}[N] = np(1-p) = 16\), а не 20, как было бы у Пуассона. Это называется недодисперсией — биномиальное \(N\) «зажато» сильнее Пуассона, потому что число полисов ограничено, и каждый клиент предъявляет иск не более одного раза.
![Гистограмма суммарного иска $S$ по 20 000 симуляциям. Красная вертикаль — теоретическое $E[S] = 100$ тыс. руб. Видно, чт](/img/compound-binomial-distribution.png)
Гистограмма суммарного иска \(S\) по 20 000 симуляциям. Красная вертикаль — теоретическое \(E[S] = 100\) тыс. руб. Видно, что распределение \(S\) правоскошено, хвост вправо длиннее.
✍️ Разберём на числах
Дано: \(n=100\), \(p=0.2\), \(E[X]=5\) тыс. руб., \(E[X^2]=50\). Шаг 1: \(\mathrm{Var}[X] = E[X^2] - (E[X])^2 = 50 - 25 = 25\). Шаг 2: \(E[N] = np = 100 \cdot 0.2 = 20\), \(\mathrm{Var}[N] = np(1-p) = 100 \cdot 0.2 \cdot 0.8 = 16\). Шаг 3: \(\mathrm{Var}[S] = E[N] \cdot \mathrm{Var}[X] + \mathrm{Var}[N] \cdot (E[X])^2 = 20 \cdot 25 + 16 \cdot 25 = 500 + 400 = 900\ (\text{тыс. руб.})^2\).
📐 Формула
Общая формула для compound-распределения:
Для биномиального \(N \sim \mathrm{Bin}(n, p)\):