●Ковариация \(= 15\), у другой пары \(= 3\). Какая «сильнее связана»? Без знания масштабов X и Y нельзя ответить. Корреляция решает эту проблему: нормирует ковариацию на стандартные отклонения.
\(\rho = \mathrm{Cov}/(\sigma_X \cdot \sigma_Y)\): «ковариация в единицах стандартных отклонений». \(\rho=+1\): прямая линейная зависимость. \(\rho=-1\): обратная. \(\rho=0\): нет линейной связи. Всегда в \([-1,\ 1]\) — удобно сравнивать пары переменных.

Диаграмма рассеяния с \(\rho \in (-1,1)\): разные степени наклона облака точек.
✍️ Разберём на числах
📐 Формула