В процессе управления качеством приходится решать задачи, связанные с оценкой сопряженности различных признаков, с принадлежностью контролируемых изделий к различным категориям. Например, исследуя причины брака, появляющегося в процессе намотки катушек, может быть необходимо ответить на вопрос о сопряженности вида брака с принадлежностью катушек к партиям, изготовленным на двух разных станках.
В общем случае в таких задачах бывает необходимо выделить слои (страты), к которым принадлежат объекты, и решить вопрос о распределении качественного признака в этих разных слоях.
Если распределение признака в слоях статистически однородно и практически такое же, как и в общей совокупности объектов, то разделение на слои не дает оснований говорить о сопряженности признака с принадлежностью к слою.
В простейшем (но и наиболее частом) варианте метода стратификации объекты разбивают на два слоя и исследуют сопряженность с признаком, который представлен двумя противоречащими категориями. В этом случае соотношение распределений признака по слоям может быть представлено матрицей частот размера .
Каждому слою соответствует строка матрицы, каждому признаку — его столбец. Элемент матрицы задает число объектов, принадлежащих к соответствующему слою и обладающих соответствующим признаком.
Матрицу сопряженности принято сопровождать дополнительными сведениями об общих количествах объектов в слоях и об общих количествах объектов, обладающих заданным признаком. Эти количества называют маргинальными частотами. Таким образом, таблица сопряженности обычно выглядит так, как табл. 7.1.
В этой таблице символом обозначена частота — количество наблюдений или объектов, соответствующих номеру слоя и номеру признака, принадлежащих всему слою или относящихся к тому или иному признаку.
Проверке следует подвергнуть, так называемую, нуль‑гипотезу о несопряжённости признаков со слоями. Её часто формулируют следующим образом: слои однородны. Это означает, что, хотя бы приближенно, распределения частот в слоях по признакам близко к распределению маргинальных частотот признаков.
В таблице 7.2 приведен пример идеально однородной таблицы. Для нее нуль-гипотеза выполнена очевидным образом. Если в эксперименте получена таблица такого вида, то можно сделать вывод, что появление того или иного признака (def1 или def2) не связано с принадлежностью к слою. Или коротко, слои однородны.
В таблицах 7.3, 7.4 и 7.5 приведены примеры неоднородных слоев. В примерах таблиц 7.3 и 7.4 неоднородность слоев очевидна. Нуль‑гипотеза должна быть отвергнута. Слои неоднородны. Принадлежность к тому или иному слою связывается с преобладанием одного из признаков. Часто в таком случае говорят, что признак сопряжен с принадлежностью к слою. Для таблицы 7.5 несопряженность признака со слоем возможно требует проверки.
В качестве примера далее используем конкретную таблицу 7.6, полученную при обработке данных одного из многофакторных контрольных листков, рассмотренных выше (см. рис. 2.4).
Проверке следует подвергнуть, так называемую, нуль‑гипотезу о несопряжённости признаков со слоями.