7.2. Использование критерия Пирсона для оценки сопряженности при стратификации

Для оценки сопряженности при стратификации возможно использование критерия Пирсона с одной степенью свободы [28,33]. Статистика этого критерия в данном случае вычисляется по формуле

$\displaystyle Q^2=f_{00}\cdot\frac{(f_{11}\cdot f_{22}-f_{12}\cdot f_{21})^2}{f_{10}\cdot f_{20}\cdot f_{01}\cdot f_{02}}.$ (7.1)

Эту статистику сравнивают с $(1-\alpha)$ квантилем распределения $\chi^2$ с одной степенью свободы. Этот квантиль  $\chi^2_$критич — критическое значение статистики. Если

$\displaystyle Q^2\ge\chi^2_$критич$\displaystyle ,$ (7.2)

нуль‑гипотеза о несопряженности признака со слоями отвергается и следует признать наличие связи признака с принадлежностью к слою.

Этот критерий применим, если выполнены условия

Ожидаемые частоты в каждой клетке таблицы вычисляют как отношение произведения сумм по строке и столбцу к общему числу наблюдений:

$\displaystyle \omega_{ij}=\frac{f_{i0}\cdot f_{0j}}{f_{00}}.$ (7.3)

Если хотя бы одно из этих условий не выполняется, следует пользовться более мощным точным критерием Фишера, который будет рассмотрен далее в этой главе.

Для примера проведем вычисления, используя данные табл. 7.6. Ожидаемая частота для клетки $f_{11}$ равна $18\cdot19/38=9>3$. Очевидно, все остальные ожидаемые частоты не ниже. Общее число наблюдений $38>20$. Таким образом, возможно использование критерия Пирсона. Согласно таблицам [6] при уровне значимости $\alpha=0{,}05$ $\chi^2_$критич.$=3{,}84$. Поскольку

$\displaystyle Q^2=38\cdot\frac{(5\cdot6-13\cdot14)^2}{19\cdot19\cdot18\cdot20}\approx6{,}76>3{,}84$    

гипотеза о несопряженности вида брака катушек по уровню сопротивления с временем появления дефекта (до или после наладки) отвергается.

Более детально сопряженность вида дефекта с наладкой станков можно исследовать, вводя более тонкую стратификацию. В частности, можно проверить отдельно ту же самую нуль‑гипотезу для катушек типа 1 и катушек типа 2. Соответствующие таблицы сопряженности представлены в табл. 7.7 и 7.8.


Таблица 7.7. Таблица сопряженности $2\times 2$ при исследовании сопряженности вида дефектов катушек и времени появления дефекта: до или после наладки станка для катушек типа 1


Таблица 7.8. Таблица сопряженности $2\times 2$ при исследовании сопряженности вида дефектов катушек и времени появления дефекта: до или после наладки станка для катушек типа 2

Анализируя эти таблицы, необходимо сделать следующие выводы.

Данные табл. 7.8 удовлетворяют условиям применимости критерия Пирсона (минимальное значение ожидаемое частоты ${\omega_{11}=11\cdot13/24\approx6>3}$, при общем числе наблюдений ${f_{00}=24>20}$). И поскольку значение статистики

$\displaystyle Q^2=24\frac{(4\cdot4-7\cdot9)^2}{11\cdot13\cdot11\cdot13}\approx2{,}59$    

меньше критического значения (3,84), гипотеза однородности слоев (гипотеза несопряженности) не отвергается.

Но к таблице 7.7 нельзя применить критерий Пирсона, поскольку общее число результатов  $f_{00}=14<20$. Кроме того, ожидаемая частота $\omega_{11}=7\cdot6/14=3$. Неравенство  $\omega_{11}>3$ не соблюдено. Поэтому необходимо рассмотреть более совершенный критерий проверки гипотезы несопряженности.