В предыдущей главе был рассмотрен вопрос о представлении эмпирического распределения для данных, которые были сгруппированы в некоторые интервалы. Графически такие данные представлены были гистограммами, а количественно таблицами частот попадания в интервалы.
Гистограммы принято строить, если данные сгруппированы в равные интервалы. Табличное представление данных может быть использовано и при интервалах неравной длины. Если общее число группированных данных не менее 50, то часто для оценки статистической близости теоретического распределения эмпирическому можно применить критерий Пирсона.
При использовании критерия Пирсона прежде всего следует образовать статистику этого критерия. Обозначим эту статистику . По определению [35,39]
| (5.1) |
Значение этой статистики необходимо сравнить с критическим значением
, которое задается функцией обратной к функции распределения
с числом степеней свободы
при уровне значимости
. Если параметры гипотетического распределения известны заранее (как в рассмотренном ниже примере), то число степеней свободы есть величина на единицу меньшая числа интервалов
.
Относительно возможности применения критерия Пирсона следует сделать несколько замечаний.
Во‑первых, в каждый интервал должно попадать не менее 5 значений. Если в эксперименте таких значений меньше, то следует соединить малочисленный интервал с каким‑либо соседним и следовательно пересмотреть границы этого нового объединенного интервала.
Во‑вторых, число интервалов не должно быть менее пяти. Если это условие нельзя выполнить, то следует применить какой‑либо другой критерий согласия, например, из описанных в [39]. Эти два ограничения приводят к соображению, что практически, если число экспериментальных результатов меньше 50, то применение критерия Пирсона становится малообоснованным.
Ниже рассмотрен пример использования критерия Пирсона.
Пример касается согласованности гипотез о виде и параметрах функции распределения тока мгновенного расцепления автоматических выключателей с эмпирическими данными.
Сначала проверим гипотезу
Эта гипотеза была выдвинута в параграфе 4.2. Там же в табл. 4.2 для каждого из интервалов номера представлены эмпирическая частота попадания
и вычисленная теоретическая частота
, которая получена как произведение теоретической вероятности
на общее число
эмпирических результатов.
Обратившись к этой табл. 4.2, видим, что попадания в интервалы с номерами 1, 2, 3, 12, 13 и 14 малочисленны и, потому, для корректности применения критерия Пирсона необходимо объединить интервалы, добиваясь того, чтобы в каждом из них было не менее 5 значений. Поскольку при этом изменятся границы интервалов, потребуется пересмотреть и соответствующие значения функции распределения и вероятности. Такое изменение интервалов представлено в табл. 5.1, где объединены интервалы 1, 2 и 3, а также интервалы 11, 12, 13 и 14.
|
|
В последнем столбце этой таблицы представлены вклады каждого из интервалов в статистику Пирсона, значение которой оказалось равным
. При уровне значимости
и числе степеней свободы
критическое значение статистики Пирсона можно вычислить5.1 или найти в таблицах [6]
Поскольку статистика Пирсона превышает критическое значение, гипотеза о нормальном распределении тока мгновенного расцепления с параметрами
А и
А должна быть отвергнута. И даже при уровне значимости
, когда критическое значение становится равным
, гипотеза должна быть отвергнута.
В параграфе 4.2 была выдвинута и другая гипотеза о теоретическом распределении, которую и проверим теперь. Новая гипотеза формулируется как
Для этой гипотезы новые значения функции распределения, частот, вероятностей и вкладов в статистику Пирсона представлены в табл. 5.2.
Поскольку статистика Пирсона
оказывается меньше критического значения
, гипотеза не отвергается и можно принять, что нормальное распределение с параметрами
А и
А не противоречит экспериментальным данным контрольного листка №36 (см. рис. 2.3).
При выдвижении гипотезы о параметрах распределения можно опираться на оценки параметров, вычисляемые по экспериментальным данным. Если в качестве гипотезы принято нормальное распределение Гаусса, то по данным эксперимента можно вычислить оценки математического ожидания и стандартного отклонения
:
В формулах (5.2) и (5.3) значение случайной величины параметра для
/го интервала может быть выбрано любым в границах интервала. Вполне целесообразным представляется выбрать это значение равным середине интервала.
Однако теперь потеряны еще две степени свободы. И это следует учесть при выборе критического значения.
Вспомнив, что критерий Пирсона применим к группированным данным, рассмотрим иные критерии согласия.