●У нас есть таблица убытков. Как из «сырых» чисел извлечь \(E[s^2(\theta)]\) и \(\mathrm{Var}[m(\theta)]\) — структурные параметры, от которых зависит весь расчёт премии доверия?
Общий разброс данных складывается из двух частей: — шум ВНУТРИ рисков: в каждый год убыток «прыгает» вокруг своего среднего; — различия МЕЖДУ рисками: разные клиенты имеют разные средние. \(E[s^2(\theta)]\) оценивается как среднее внутригрупповых дисперсий. \(\mathrm{Var}[m(\theta)]\) — межгрупповая дисперсия за вычетом поправки на шум.
![Два столбца: $E[s^2(\theta)]$ (шум внутри) и $\mathrm{Var}[m(\theta)]$ (различия между рисками). Видно, что $\mathrm{Var](/img/ebct-parameter-estimators.png)
Два столбца: \(E[s^2(\theta)]\) (шум внутри) и \(\mathrm{Var}[m(\theta)]\) (различия между рисками). Видно, что \(\mathrm{Var}[m(\theta)] \gg E[s^2(\theta)] \to\) высокий \(Z\).
✍️ Разберём на числах
Данные: \(\bar X_1=50\), \(\bar X_2=61\), \(\bar X_3=41\), \(\bar{\bar X}=50{,}667\); \(n=3\). Внутри риска 1: дисп. \(= ((48-50)^2+(52-50)^2+(50-50)^2)/2 = (4+4+0)/2 = 4\). Внутри риска 2: \(((60-61)^2+(65-61)^2+(58-61)^2)/2 = (1+16+9)/2 = 13\). Внутри риска 3: \(((40-41)^2+(38-41)^2+(45-41)^2)/2 = (1+9+16)/2 = 13\). \(E[s^2(\theta)] = (4 + 13 + 13) / 3 = 10\). Межгрупповая дисп. \(= ((50-50{,}667)^2+(61-50{,}667)^2+(41-50{,}667)^2)/2 = 100{,}333\). \(\mathrm{Var}[m(\theta)] = 100{,}333 - 10/3 \approx 97\).
📐 Формула
(expected process variance — средняя внутригрупповая дисперсия).
(variance of hypothetical means — дисперсия средних за вычетом поправки).