7.3. Использование точного критерия Фишера для оценки сопряженности при стратификации

Точный критерий Фишера основан на непосредственном сравнении принятого уровня значимости нуль-гипотезы с вероятностью появления заданной экспериментом таблицы и всех возможно ещё худших таблиц с неизменными маргинальными частотами.

Для использования этого критерия удобно полученную в эксперименте таблицу сначала преобразовать так, чтобы минимальная частота была представлена частотой $f_{11}$, т. е. находилась бы в верхней левой клетке матрицы $2\times 2$. Этого всегда можно добиться перестановкой строк и столбцов таблицы. Заметим, что такие перестановки должны реализовываться с сохранением у столбцов и строк их имен и их маргинальных частот.

Все возможно еще худшие таблицы образуются, последовательно уменьшая на единицу значение в клетке с частотой $f_{11}$. Значения остальных частот в новых таблицах вычисляют по вполне очевидным формулам, основываясь на неизменности маргинальных частот:

$\displaystyle f_{12}$ $\displaystyle =f_{10}-f_{11},$ (7.4)
$\displaystyle f_{21}$ $\displaystyle =f_{01}-f_{11},$ (7.5)
$\displaystyle f_{22}$ $\displaystyle =f_{20}-f_{21}.$ (7.6)

Затем следует найти вероятности всех этих таблиц вплоть до последней, у которой $f_{11}=0$. Гипотеза однородности отвергается, если сумма вероятностей всех таблиц окажется меньше уровня значимости.

Вероятность каждой из построенных таблиц вычисляют как гипергеометрическую вероятность:

$\displaystyle h_{f_{00}f_{01}}^{f_{10}f_{11}}=
\frac{\dbinom{f_{01}}{f_{11}}\cd...
...10}}}=
\frac{f_{01}!f_{02}!f_{10}!f_{20}!}{f_{11}!f_{12}!f_{21}!f_{22}!f_{00}}.$ (7.7)

Для примера, представленного табл. 7.7, последовательность таблиц и результаты вычислений их вероятностей с помощью (7.7) показаны на рис. 7.1.

Рис. 7.1. Последовательность таблиц, полученных из экспериментально полученной таблицы сопряженности для катушек типа 1, и расчетные значения вероятностей появления таких таблиц при неизменных маргинальных частотах
\begin{figure}\par\hbox to \textwidth{%
{\small\begin{tabular}{cc}
Шаг выч...
...$\longrightarrow$\hfill
\par$\displaystyle\sum P_i=0{,}051282$}
\par\end{figure}

Полученная сумма вероятностей больше уровня значимости $0{,}05$ и потому для катушек типа 1 не отвергается гипотеза несопряженности вида дефекта и наладки станка при изготовлении.

Вычисление вероятности очередной таблицы, полученной в результате уменьшения значения $f_{11}$ может быть проведено без расчетов новых факториалов. Для такого расчета можно воспользоваться рекуррентным соотношением. Если частоты в клетках таблицы обозначить так, как показано в табл. 7.9, то вероятность таблицы на шаге $i+1$ вычисляется по формуле [28]:

$\displaystyle P_{i+1}=\frac{a_id_i}{b_{i+1}c_{i+1}}P_i.$ (7.8)


Таблица 7.9. Обозначения частот в клетках таблиц $2\times 2$ сопряженности признаков

Завершая главу, следует отметить, что анализ сопряженности разработан и для большего числа измерений, то есть для матриц большего размера [4,28].