5.2. Критерии согласия несгруппированных данных

Когда данные заранее сгруппированы, очевидно, часть информации теряется, так как реальные значения измеряемого параметра распределены в каждом интервале, а эта информация о реальных значениях каждого отдельного измерения никак не учтена в статистике Пирсона.

Для анализа согласия некоторого гипотетического распределения и эмпирического, заданного рядом индивидуальных значений, распределения, можно использовать критерии Колмогорова и Крамера–Мизеса.

Сначала построим эмпирическую функцию распределения. Пусть для контролируемой случайной величины $x$ получена выборка, насчитывающая $n$ значений. Эти значения упорядочены и составляют ряд распределения

$\displaystyle X_1, X_2, \ldots X_n$

Эмпирической функцией распределения назовем функцию, которая скачкообразно возрастает в каждой из точек ряда распределения на величину $1/n$. В каждой из точек $X_i$ эта функция непрерывна справа и равна $i/n$.

Пример такой эмпирической функции распределения на рис. 5.1 отображает результаты измерений токов мгновенного расцепления выборки из совокупности модульных автоматических выключателей с номинальным током 40А и типом характеристики C.

Рис. 5.1. Эмпирическая функция распределения
\includegraphics{emp_func}

Выборочные значения этого тока были измерены на 11 образцах и представлены рядом распределения

\begin{displaymath}\begin{array}{\vert*{11}{c\vert}}
\hline
\rule{0mm}{11pt}\use...
...8&236&292&308&324&350&356&368&372&381&396\\
\hline
\end{array}\end{displaymath}


Оба упомянутых критерия основаны на сравнении значений эмпирической функции распределения и значений гипотетической непрерывной функции распределения в точках, где определена эмпирическая функция.

Критерий Колмогорова предусматривает вычисление статистики, которая определена как верхняя грань модуля разницы эмпирической и гипотетической теоретической функции распределения

$\displaystyle D_n=\sup_{-\infty<x<+\infty}\left\vert\hat{F}_n(x)-F(x)\right\vert.$ (5.4)

Поскольку эмпирическая функция распределения имеет вид ступенчатой функции для вычисления статистики Колмогорова достаточно проанализировать все точки разрыва этой функции. Тогда можно представить (5.4) в виде

$\displaystyle D_n(x_1,\dots x_n)=\max_{1\le i\le n}\left\{\left\vert\frac{i}{n}-F(x_i)\right\vert, \left\vert F(x_i)-\frac{i-1}{n}\right\vert\right\}.$ (5.5)

Гипотеза о согласии теоретической и эмпирической функций распределения отвергается, если выполняется неравенство

$\displaystyle \sqrt{n}\,D_n(x_1,\dots x_n)\ge x_{1-\alpha}.$ (5.6)

В этом неравенстве $x_{1-\alpha}$ — квантиль функции распределения Колмогорова. Таблица некоторых квантилей этой функции приведена в табл. 5.3.


Таблица 5.3. Квантили функции распределения Колмогорова $K(x)$

Пример вычислений для проверки согласия с помощью критерия Колмогорова представлен в табл. 5.4. В качестве значений эмпирической функции распределения использованы значения токов мгновенного расцепления модульных автоматических выключателей с характеристикой типа C и номинальным током 40А. Гипотеза о теоретическом распределении формулируется следующим образом:

\fbox{\begin{minipage}{0.9\textwidth}
$\mathbf{H_{0}{:}}$~случайные з...
...ению на интервале от~$g=200~A$\ до~$h=400~A$.
\end{minipage}}


Таблица 5.4. Расчетные данные для вычисления статистики критерия Колмогорова


Значения функции равномерного распределения на интервале от $a$ до $b$ вычислены по очевидной формуле

$\displaystyle F(x_i)=\frac{x_i-a}{b-a}.$

В примере расчета, представленного табл. 5.4 максимальное значение из полученных в двух последних столбцах равно 0,26, т. е.

$\displaystyle D_n(x_1\dots x_n)=0{,}26.$

При уровне значимости 0,05 статистика

$\displaystyle \sqrt{n}\,D_n = \sqrt{20}\cdot0{,}26\approx1{,}16$

не превосходит критического значения, так как

$\displaystyle 1{,}16 \le x_{1-\alpha} = 1{,}36.$

Поэтому гипотеза о согласии равномерного распределения тока мгновенного расцепления в интервале от 200А до 400А не отвергается.

Практически это означает, что выключатели удовлетворяют требованию стандарта, которое предписывает принадлежность тока мгновенного расцепления интервалу от 5/кратного до 10/кратного значений номинального тока.

Используя критерий Колмогорова, мы опираемся лишь на одно значение эмпирической функции распределения. В отличие от этого критерий Крамера–Мизеса предусматривает вычисление статистики, которая учитывает вклад всех наблюденных отличий эмпирической и теоретической функций распределения. Статистика этого критерия определяется соотношением

$\displaystyle n\omega_n^2=\frac{1}{12n}+\sum_{i=1}^n\left[F(x_i)-\frac{2i-1}{2n}\right]^2.$ (5.7)

Пример расчета статистики Крамера–Мизеса для проверки той же гипотезы, что и выше дан в табл. 5.5


Таблица 5.5. Расчетные данные для вычисления статистики критерия Крамера–Мизеса


С учетом суммы значений последнего столбца табл. 5.5 статистика критерия Крамера–Мизеса оказывается равной

$\displaystyle n\omega_n^2=\frac{1}{12\cdot20}+0{,}4902=0{,}4944.$

Квантили закона распределения этой статистики в соответствии с [6] и [39] заданы табл. 5.6.


Таблица 5.6. Квантили функции распределения статистики Крамера–Мизеса

При уровне значимости гипотезы $\alpha=0{,}05$ статистика Крамера–Мизеса 0,4944 оказалась больше, чем критическое значение 0,46. Это означает, что гипотеза  $\mathbf{H_{0}}$ о согласии функций распределения должна быть отвергнута.

Сравнив выводы критерия Колмогорова и критерия Крамера–Мизеса, можно сделать вывод о том, что последний оказывается более чувствительным.

Критерии Колмогорова и Крамера–Мизеса применимы, когда число значений ряда эмпирического распределения не менее 20. Гипотетическое распределение должно быть обязательно непрерывным. В остальном к этому распределению никаких других требований не предъявляется.