5.2.3. Распределение числа дефектных единиц в выборке

Распределение числа дефектных объектов в выборке полно описано, если известны вероятности каждого возможного значения случайной величины $S_{n,Be}$. Пусть $d$ обозначает число дефектных объектов в выборке, т. е. число единиц в сумме $S_{n,Be}$. Тогда распределение $S_{n,Be}$ задано, если известна вероятность того, что  $S_{n,Be} = d$.

Число единиц (успехов) $d$ среди $n-d$ нулей («неудач») может появляться на разных местах последовательности. Например, последовательности  $001001000100000$ и $000001100100000$ дают одинаковое значение $d = 3$. Вероятность любой такой последовательности, в силу теоремы умножения вероятностей задается произведением  $p^dq^{n-d}$.

Но вариантов появления точно $d$ успехов существует столько, сколько существует подмножеств мощностью $d$, образованных из элементов множества мощности $n$. Поэтому вероятность обнаружить точно $d$ единиц на любых местах среди $n$ можно записать в виде

$\displaystyle \Pr\left\{S_{n,Be}=d\right\} = \binom{n}{d}\cdot p^d\cdot q^{n-d},$ (5.11)

где выражение

$\displaystyle \binom{n}{d} = \frac{n!}{d!\cdot(n-d)!}$ (5.12)

и есть число $d$‑подмножеств $n$‑множества, которое в комбинаторике называют числом сочетаний [17], а в анализе — биномиальным коэффициентом [15] и обозначают $C_n^d$.

Из выражения (5.12) непосредственно следует, что

$\displaystyle \binom{n}{0}=\binom{n}{n}=1.$ (5.13)

Кроме того, подстановкой факториальной формы (5.12) проверяется важное рекуррентное соотношение

$\displaystyle \binom{n}{d} = \binom{n-1}{d}+\binom{n-1}{d-1}.$ (5.14)

Эта формула, иногда очень полезная при вычислениях, лежит в основе так называемого треугольника Паскаля, начальная часть которого представлена в табл. 5.1. Каждая строка этого треугольника содержит биномиальные коэффициенты вида  $\binom{n}{d}$ для всех значений  $0\le d \le n$.

Таблица 5.1. Начальная часть треугольника Паскаля

Вероятности (5.11) связаны с биномом Ньютона: сумма всех этих вероятностей для значений  $0\le d \le n$ представляет разложение бинома

$\displaystyle (p+q)^n = \sum_{d=0}^{n}\binom{n}{d}\cdot p^d\cdot q^{n-d}.$ (5.15)

Имея в виду, что $p + q = 1$, из (5.15)) следует, что

$\displaystyle \sum_{d=0}^{n}\binom{n}{d}\cdot p^d\cdot q^{n-d} = 1.$ (5.16)

Это равенство, очевидно, должно соблюдаться потому, что сумма в (5.16) распространена на вероятности событий, образующих полную систему (или группу) несовместных событий, т. е. достоверное событие [4,16].