U-критерий Манна — Уитни
U-критерий Манна — Уитни (англ. Mann–Whitney U-test) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Другие названия: критерий Манна — Уитни — Уилкоксона (англ. Mann–Whitney–Wilcoxon, MWW), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test) или критерий Уилкоксона — Манна — Уитни (англ. Wilcoxon–Mann–Whitney test). Реже: критерий числа инверсий.
История
Данный метод выявления различий между выборками был предложен в 1945 году американским химиком и статистиком Фрэнком Уилкоксоном (F. Wilcoxon). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann) и Д. Р. Уитни (D. R. Whitney), по именам которых сегодня обычно и называется.
Описание критерия
Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.
Ограничения применимости критерия
Использование критерия
Для применения U-критерия Манна — Уитни нужно произвести следующие операции.
U 1 = n 1 ⋅ n 2 + n 1 ⋅ ( n 1 + 1 ) 2 − R 1 {displaystyle U_{1}=n_{1}cdot n_{2}+{frac {n_{1}cdot (n_{1}+1)}{2}}-R_{1}} ,
U 2 = n 1 ⋅ n 2 + n 2 ⋅ ( n 2 + 1 ) 2 − R 2 {displaystyle U_{2}=n_{1}cdot n_{2}+{frac {n_{2}cdot (n_{2}+1)}{2}}-R_{2}} , если всё вычислено верно, то U 1 + U 2 = n 1 ⋅ n 2 . {displaystyle U_{1}+U_{2}=n_{1}cdot n_{2}.} ,
3. Определить значение U-статистики Манна-Уитни по формуле U = m i n { U 1 , U 2 } . {displaystyle U=min{U_{1},U_{2}}.}
4. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n 1 {displaystyle n_{1}} и n 2 {displaystyle n_{2}} . Если полученное значение U {displaystyle U} меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U {displaystyle U} больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U {displaystyle U} .
5. При справедливости нулевой гипотезы критерий имеет математическое ожидание M ( U ) = n 1 n 2 / 2 {displaystyle M(U)=n_{1}n_{2}/2} и дисперсию D ( U ) = n 1 n 2 ( n 1 + n 2 + 1 ) / 12 {displaystyle D(U)=n_{1}n_{2}(n_{1}+n_{2}+1)/12} и при достаточно большом объёме выборочных данных ( n 1 > 19 , n 2 > 19 ) {displaystyle (n_{1}>19,n_{2}>19)} распределён практически нормально.
Таблица критических значений
- Critical Values for the Mann — Whitney U-Test.
- Расчет критических значений U-критерия Манна — Уитни для выборок больше 20 (N>20)