Метод линейных дискриминантных функций

14.04.2015

Впервые в отечественном животноводстве этот метод был применен одним из авторов для разработки таблиц прогноза откормочных и мясных качеств свиней. Он основан на законах математической логики, несложен и характеризуется довольно высокой разрешающей способностью. Таблицы прогноза того или иного селекционируемого признака разрабатывают на типичной (эталонной) для данного стада и популяции группе животных.
Каждый признак у животных в стаде может иметь два различных значения — желательное для данного стада (с учетом направления его селекции) и нежелательное. Поэтому любую совокупность животных, несмотря на то что признаки могут иметь различную степень выраженности, по каждому из них можно разделить на две группы, причем для определения степени различий (расхождения) между признаками применяют метод линейных дискриминантных функций (метод альтернативных распределений).
В основе распределения животных по группам лежит величина прогнозируемого признака: в первую включают животных с желательным уровнем продуктивности, во вторую— всех остальных, с нежелательной продуктивностью. После этого в обеих группах по каждому показателю, используемому для прогноза, например по тестам крови, рассчитывают средние арифметические, сводные дисперсии и на их основе — дискриминантные коэффициенты, отражающие различия между группами по этим показателям. Сколько показателей используют для прогноза селекционируемого признака, столько должно быть дискриминантных коэффициентов, определяемых по следующим формулам:

Метод линейных дискриминантных функций

После вычисления дискриминантных коэффициентов каждый из признаков, выбранных для использования в прогнозе, в интервале от минимального и максимального значения в группе разбивают на диапазоны и по каждому диапазону определяют среднее значение, умножив которое на дискриминантный коэффициент, вычисляют индексы прогноза.
Например, для прогноза какого-то продуктивного признака используют содержание в крови глобулиновой фракции белка. У животных, взятых в качестве эталона, дискриминантный коэффициент по глобулинам равен 0,127, а содержание их в крови изменяется в пределах от 63,1 до 75,8%. Этот общий диапазон изменчивости признака можно разделить на четыре диапазона: 63,1—66,0; 66,1—69,0; 69,1—73,0 и 73,1—75,8. Средние значения по диапазонам составят 63,05; 67,55; 71,05; 74,45. Умножив каждое из них на дискриминантный коэффициент, получают следующие значения индексов прогноза: 7,95; 8,58; 9,02; 9,52 (после округления 8; 8,5; 9; 9,5). Если у какого-то оцениваемого животного содержание глобулинов в крови составит, предположим, 69,5%, то индекс прогноза по глобулинам будет равен 9, так как он входит в диапазон 69,1—73,0%.
Рассчитанные по всем признакам значения индексов сводят в таблицу прогноза: признаки с положительными индексами размещают в ее левой части, с отрицательными — в правой. В таблицах оставляют только названия признаков, границы диапазонов и индексы прогноза (табл. 18).
Метод линейных дискриминантных функций

Процедура прогноза включает: определение индексов, соответствующих значениям каждого признака у оцениваемого животного, их суммирование с учетом знака индекса и сопоставление полученной суммы с прогностическим порогом, который представляет собой минимальное значение суммы индексов, с какой животное может быть отнесено в группу с желательным направлением и уровнем продуктивности.
Для установления прогностического порога применяют метод λ Колмогорова — Смирнова, позволяющий установить максимальный модуль разности, т. е. максимальное расхождение распределения между животными. Для этого у каждого животного определяют общую сумму индексов, которую заносят в общий упорядоченный ряд, всегда размещая в левой части животных с желательным признаком.
Полученные суммы индексов (дискриминаторы) размещают в возрастающем порядке, однако с условием, чтобы можно было различать, какие из них относятся к группе с желательным признаком, какие — к группе с нежелательным. Это достигается расположением первой группы левее некоторой вертикальной границы, второй — правее. Для распределения дискриминаторов с одинаковыми значениями в левом и правом ряду пользуются следующим приемом.
Если одинаковых чисел всего два, их распределение должно быть случайным. Когда встречается еще пара не-различающихся чисел в обоих рядах, их располагают в обратном порядке. Если неразличающихся чисел три, их располагают так:
Метод линейных дискриминантных функций

При четырех неразличающихся числах расположение будет следующее:
Метод линейных дискриминантных функций

Принцип распределения заключается в том, чтобы не давать приоритета ни одному ряду. Обработка упорядоченного ряда по методу К Колмогорова — Смирнова позволяет выделить диапазон с максимальным модулем разности. Он и является порогом для разделения животных (по величине дискриминатора) с высоким и низким значением признака.
Пример расчета прогностического порога показан в таблице 19 (он равен 58,02, округленно 58). Всех животных с величиной дискриминатора ниже 58 относят к высокоценным в племенном отношении, а выше 58 — к низкопродуктивным.
Метод линейных дискриминантных функций

Прогностический порог, или граница между верхней и нижней частью упорядоченного ряда, в таблице 19 обозначен сплошной линией. Идеальным считается распределение, когда выше границы располагаются животные только второй группы, ниже — только первой. В приведенном примере насчитывается шесть нарушений этой закономерности: в первой группе трое животных располагаются выше границы прогностического порога, во второй — трое находятся ниже ее. Следовательно, из 34 животных, включенных в упорядоченный ряд, правильный прогноз получен по 28—82,4%, ошибочный — по 6—17,6% и для селекционных целей можно отобрать 18 животных, или 52,9% из числа оцениваемых. Общая ошибка составляет 17,6%, но ошибка отбора в группу с нежелательными качествами неважна, так как этих животных исключают из селекционного процесса. Фактически ошибочно вошло в группу лучших только трое животных, и ошибка прогноза, таким образом, составляет 8,8%.