Когда данные заранее сгруппированы, очевидно, часть информации теряется, так как реальные значения измеряемого параметра распределены в каждом интервале, а эта информация о реальных значениях каждого отдельного измерения никак не учтена в статистике Пирсона.
Для анализа согласия некоторого гипотетического распределения и эмпирического, заданного рядом индивидуальных значений, распределения, можно использовать критерии Колмогорова и Крамера–Мизеса.
Сначала построим эмпирическую функцию распределения. Пусть для контролируемой случайной величины получена выборка, насчитывающая
значений. Эти значения упорядочены и составляют ряд распределения
Эмпирической функцией распределения назовем функцию, которая скачкообразно возрастает в каждой из точек ряда распределения на величину . В каждой из точек
эта функция непрерывна справа и равна
.
Пример такой эмпирической функции распределения на рис. 5.1 отображает результаты измерений токов мгновенного расцепления выборки из совокупности модульных автоматических выключателей с номинальным током 40А и типом характеристики C.
Выборочные значения этого тока были измерены на 11 образцах и представлены рядом распределения
Оба упомянутых критерия основаны на сравнении значений эмпирической функции распределения и значений гипотетической непрерывной функции распределения в точках, где определена эмпирическая функция.
Критерий Колмогорова предусматривает вычисление статистики, которая определена как верхняя грань модуля разницы эмпирической и гипотетической теоретической функции распределения
Поскольку эмпирическая функция распределения имеет вид ступенчатой функции для вычисления статистики Колмогорова достаточно проанализировать все точки разрыва этой функции. Тогда можно представить (5.4) в виде
| (5.5) |
Гипотеза о согласии теоретической и эмпирической функций распределения отвергается, если выполняется неравенство
| (5.6) |
Пример вычислений для проверки согласия с помощью критерия Колмогорова представлен в табл. 5.4. В качестве значений эмпирической функции распределения использованы значения токов мгновенного расцепления модульных автоматических выключателей с характеристикой типа C и номинальным током 40А. Гипотеза о теоретическом распределении формулируется следующим образом:
Значения функции равномерного распределения на интервале от до
вычислены по очевидной формуле
В примере расчета, представленного табл. 5.4 максимальное значение из полученных в двух последних столбцах равно 0,26, т. е.
Практически это означает, что выключатели удовлетворяют требованию стандарта, которое предписывает принадлежность тока мгновенного расцепления интервалу от 5/кратного до 10/кратного значений номинального тока.
Используя критерий Колмогорова, мы опираемся лишь на одно значение эмпирической функции распределения. В отличие от этого критерий Крамера–Мизеса предусматривает вычисление статистики, которая учитывает вклад всех наблюденных отличий эмпирической и теоретической функций распределения. Статистика этого критерия определяется соотношением
| (5.7) |
Пример расчета статистики Крамера–Мизеса для проверки той же гипотезы, что и выше дан в табл. 5.5
С учетом суммы значений последнего столбца табл. 5.5 статистика критерия Крамера–Мизеса оказывается равной
При уровне значимости гипотезы
статистика Крамера–Мизеса 0,4944 оказалась больше, чем критическое значение 0,46. Это означает, что гипотеза
о согласии функций распределения должна быть отвергнута.
Сравнив выводы критерия Колмогорова и критерия Крамера–Мизеса, можно сделать вывод о том, что последний оказывается более чувствительным.
Критерии Колмогорова и Крамера–Мизеса применимы, когда число значений ряда эмпирического распределения не менее 20. Гипотетическое распределение должно быть обязательно непрерывным. В остальном к этому распределению никаких других требований не предъявляется.