НЕКОТОРЫЕ ПОДХОДЫ К СТАТИСТИЧЕСКОЙ ОБРАБОТКЕ ПОЛИМОРФНЫХ ИММУНОГЕНЕТИЧЕСКИХ ХАРАКТЕРИСТИК ГРУПП КРОВИ КРУПНОГО РОГАТОГО СКОТА
НЕКОТОРЫЕ ПОДХОДЫ К СТАТИСТИЧЕСКОЙ ОБРАБОТКЕ ПОЛИМОРФНЫХ ИММУНОГЕНЕТИЧЕСКИХ ХАРАКТЕРИСТИК ГРУПП КРОВИ КРУПНОГО РОГАТОГО СКОТА
Научная статья
Герасимова В.Е.1, Герасимова Л.А.2, *, Еремина И.Ю.3
2 ORCID: 0000-0001-8037-6080,
1, 2 Сибирский университет науки и технологий, Красноярск, Россия;
3 Красноярский аграрный университет, Красноярск, Россия
* Корреспондирующий автор (lyu-gerasimova[at]yandex.ru)
Аннотация
В работе рассмотрены статистические методы сопоставления антигенных показателей одной популяции крупного рогатого скота в разные периоды времени. Оценивались информативность и точность определения разницы совокупности поливариантных параметров разными методами статистической обработки. Установлено, что в то время как коэффициент корреляции не показывал достоверных отличий, двухвыборочный t-критерий Стьюдента для парных выборок уловил отличия между совокупностями. Особенно чувствителен метод расчета критерия Стьюдента для сравнения изменений по отдельным сортировкам антигенов групп крови. Таким образом, данный метод позволяет статистически подтвердить и выявить изменения генетической структуры популяции.
Ключевые слова: иммуногенетические характеристики, группы крови крупного рогатого скота, антиген-частотные показатели, достоверность отличий, коэффициент корреляции, двухвыборочный t-критерий Стьюдента.
SOME APPROACHES TO STATISTICAL TREATMENT OF POLYMORPHIC IMMUNOGENETIC CHARACTERISTICS OF BLOOD GROUPS OF CATTLE
Research article
Gerasimova V.E.1, Gerasimova L.A.2, *, Eremina I.Yu.3
2 ORCID: 0000-0001-8037-6080,
1, 2 Siberian State Aerospace University, Krasnoyarsk, Russia;
3 Krasnoyarsk Agrarian University, Krasnoyarsk, Russia
* Correspondent author (lyu-gerasimova[at]yandex.ru)
Abstract
The paper discusses statistical methods for comparing antigenic indicators of a single cattle population in different periods of time. The information content and accuracy of determining the difference of the set of polyvariant parameters were evaluated by different statistical processing methods. It was established that while the correlation coefficient did not show significant differences, the two-sample Student's t-test for paired samples caught differences between the aggregates. The method of calculating student’s criterion for comparing changes in the individual screening of blood group antigens is especially sensitive. Therefore, this method allows statistically confirming and identifying changes in the genetic structure of a population.
Keywords: immunogenetic characteristics, blood groups of cattle, antigen-frequency parameters, authenticity of differences, correlation coefficient, two-sample Student's t-test.
Особенности иммуногенетических характеристик групп крови крупного рогатого скота заключаются в их высокой вариабельности, разнородности и корреляцией с хозяйственно-полезными признаками. С одной стороны, это качественные показатели – анализируются 65 антигенов групп крови, которые могут присутствовать у каждого животного практически в любых комбинациях. С другой стороны каждый антиген в исследуемой группе животных наблюдается с определенной, характерной для него частотой, что является количественной характеристикой. Частоты встречаемости антигенов групп крови могут быть весьма специфическим и показательным средством описания выборки – изучаемой группы животных. В качестве выборки обычно принимают популяцию животных, а для крупного рогатого скота – поголовье конкретного хозяйства, что также можно отнести к категории популяций. Таким образом, антиген-частотные показатели помогают оценить популяционные процессы происходящие под давлением естественного и искусственного отбора в процессе селекции. Они могут быть использованы как для характеристики внутрипопуляционных (внутригрупповых) процессов, так и для описания межпопуляционных (больших групп, пород) отличий [1], [2], [3], [4].
Цель работы – оценить популяционные процессы, происходящие под воздействием селекционного давления на основе анализа иммуногенетических характеристик групп крови крупного рогатого скота. В ходе выполнения исследования решались задачи: 1) обоснование выбора статистического метода для выявления микропопуляционных процессов на основе антиген-частотных характеристик крупного рогатого скота; 2) расчет статистических показателей на примере конкретных стад; 3) биологическая интерпретация полученных статистических показателей относительно происходящих популяционных процессов на примере реальных данных.
Проводились сравнения данных по популяции за 3 периода – базовое стадо (исходные данные) и уже измененное в ходе селекции стадо с интервалом рождения животных через 5 лет и 3 года, которые условно обозначили как период 1, 2 и 3. Следовательно, временной интервал между данными по популяции за период 1 и 3 составляет 8-10 лет. Исходя из специфики ведения селекционной работы предполагаем, что популяция периода 1 будет иметь некоторые, возможно не очень значительные отличия, по сравнению с периодом 2 и существенные изменения по отношению к периоду 3. При этом характеристики популяции периодов 2 и 3 будут весьма близки. Численность анализируемого поголовья составляла 214, 435 и 170 голов по периодам 1, 2 и 3 соответственно.
Для сравнения изменений состояния популяции в целом, по всему комплексу антигенов, как правило, используется коэффициент корреляции [5], [6], [7], [8]. Коэффициент корреляции между состояниями популяции всех трех периодов близок к 1, что свидетельствует о наличии высокой степени прямой взаимосвязи между рядами частот в разные периоды времени, то есть по частоте антигена одного года можно спрогнозировать значения частоты данного антигена в другой изучаемый период. Причем, ожидаемо, связь между частотами периодов 2 и 3 более тесная, чем связь между данными этих же периодов с частотами за период 1. Результаты представлены в таблице 1.
Таблица 1 – Значения коэффициента корреляции между разными периодами
Исследуемые периоды | 2 | 3 |
1 | 0,847176 | 0,823361 |
2 | 0,904633 |
Таким образом, коэффициент корреляции не выявил значительных различий по антиген-частотным характеристикам стада в интервале почти 10 лет, хотя наблюдается тенденция по снижению уровня корреляции с увеличением временного разрыва между популяцией изучаемых периодов.
Логично предположить, что с учетом постоянно проводимого селекционного процесса, в ходе которого в популяцию вводятся новые генотипы, изменения в составе антигенов должны быть. И действительно значения частот антигенов существенно изменяются. Тем не менее, базовый генофонд популяции также сохраняет свое влияние. Следовательно, возникает необходимость выявить и оценить скорость и масштаб этих изменений. При этом, учитывая общность базового генофонда, выборки в разные временные периоды рассматриваются как зависимые совокупности.
Для того, чтобы установить наличие или отсутствие различий между частотами антигенов в одной популяции в разных периодах необходимо проверить однородность данных характеристик, то есть установить из одной генеральной совокупности или из разных взяты два ряда частот антигенов. Поскольку исследования проводятся по антигенам в одной популяции животных, то выборки частот зависимы. Каждому антигену соответствует частота встречаемости в популяции в каждом из исследуемых периодов, что обуславливает парность рядов данных. В этом случае целесообразно использовать двухвыборочный t-критерий Стьюдента для зависимых (парных) выборок [5], [7], [8], [9], [10], который позволяет идентифицировать однородны ли два ряда антигенов или различны.
Для расчета эмпирического значения t-критерия вычисляется разница между частотами каждого антигена в ряду
где zi – разница частот i-ого антигена в разные периоды, p1i - частота i-ого антигена в период 1, p2i - частота i-ого антигена в период 2, k - количество антигенов в частотном ряду.
Далее вычисляется среднее и разница между частотами антигенов
где – среднее значение разности частот антигенов, k – количество антигенов в частотном ряду, sz – стандартное отклонение разностей.
Аналогично рассчитывается для периодов 2-3 и 1-3.
Рассматривается нулевая гипотеза об отсутствии различий (об однородности) в двух рядах частот, то есть о равенстве нулю среднего значения разницы частот и альтернативная гипотеза о различии в двух рядов частот, то есть о неравенстве нулю среднего значения разницы частот
Эмпирическое значение двухвыборочного t-критерия Стьюдента для зависимых (парных) выборок:
Эта статистика имеет распределение t (k-1). Вычисленное значение t сравнивается с табличным tкр при (k-1) числе степеней свободы и заданном уровне значимости.
Если модуль расчетного значения критерия меньше табличного |t\<tкр, то нулевая гипотеза принимается и делается вывод о том, что два ряда частот антигенов однородны. Если модуль расчетного значения критерия больше табличного |t\>tкр, то нулевая гипотеза отвергается и принимается альтернативная гипотеза о различии в двух рядов частот, делается вывод о том, что два ряда частот антигенов различны.
В данной работе устанавливалось наличие или отсутствие различий между частотами всех рассматриваемых антигенов в различных периодах.
Таблица 2 – Использование t-критерия Стьюдента для сравнения популяций по всей совокупности антигенов
Исследуемые периоды | 2 | 3 |
1 | отличия есть | отличия есть |
2 | отличий нет |
Из таблицы 2 видно, что по всей совокупности антигенов групп крови двухвыборочный t-критерий Стьюдента выявил отличия между иммуногенетическими характеристиками популяции между периодами 1-2 и 1-3, что соответствует первоначальному предположению.
Кроме того, в исследовании необходимо было установить наличие или отсутствие различий между частотами антигенов в классах (по генетическим системам групп крови). У крупного рогатого скота существует несколько поливариантных систем групп крови. В исследуемой популяции выделены 5 таких систем по 2, 6, 7, 10 и 34 антигена. Все исследуемые антигены разбивали на классы в соответствии с системами групп крови и далее для каждого класса антигенов рассматривали вопрос об однородности (или различии) между рядами частот антигенов в разных периодах, то есть сравнивали ряды антигенов одной системы группы крови, полученные в популяции, находящейся в разных временных периодах. По системам, представленным не более 10 антигенами, статистически достоверных отличий не выявлено. Достоверные отличия были определены только по самой многофакторной системе, включающей 34 антигена (EAB-система), причем с уровнями достоверности 95 и 99% (табл.3).
Таблица 3 – Выявление внутрипопуляционных изменений на основании антигенных отличий по EAB -системе групп крови
Показатели | Значения t-критерия | Наличие отличий |
Порог достоверности 95% | 2,03 | |
Порог достоверности 99% | 2,73 | |
Между периодами 1-2 | 2,62 | Есть, достоверность 95% |
Между периодами 1-3 | 3,49 | Есть, достоверность 95%, 99% |
Между периодами 2-3 | 2,61 | Есть, достоверность 95% |
В таблице 3 показаны ярко выраженные межпопуляционные отличия по EAB-системе между периодами 1 и 3. Наглядно видны изменения генетической структуры между наиболее отдаленными по времени состояниями популяции. Популяции, близкие во временных рамках, проявили отличия лишь с порогом достоверности 95%. Таким образом, мы можем отметить начальные этапы генетической дивергенции, которая со временем только усиливается, что объясняется действием направленного отбора. Очевидно, антигены полифакторной ЕАВ-системы групп крови подвергаются наибольшему давлению отбора в ходе селекционного процесса, то есть, вероятно, более активно коррелируют с хозяйственно-полезными признаками.
Кроме того, в исследовании устанавливалось наличие или отсутствие различий между частотами внутри сортированных групп антигенов. В каждой из трех совокупностей антигены ранжируются по значениям частот встречаемости. Все исследуемые антигены разбивали на классы: редко встречающиеся и элиминирующиеся, часто встречающиеся и средние с порогами встречаемости 0-15%, свыше 50% и 16-50% соответственно.
В связи с тем, что в каждом из исследуемых периодов разделение антигенов на данные группы различно, рассмотрим сравнение частот групп антигенов отдельно для каждого периода. То есть, сначала для каждого из исследуемых периодов делается разбиение всех антигенов на группы и оно считается базовым. Далее при базовом разделении антигенов на группы рассматривается вопрос об однородности или различии рядов частот каждой группы антигенов с соответствующими рядами частот этих же антигенов в другом (не являющимся базовым) периоде. Следует отметить, что в частотные классы в разные периоды попадает разное число антигенов и они отличаются по своему качественному составу.
При анализе, когда за базовый приняли период 1 и попарно сравнивали частотные классы с аналогичными показателями периодов 2 и 3, получили достоверно статистически подтвержденные отличия с обеими периодами в группе редко встречающихся антигенов, что тоже показательно. Редковстречающиеся и элиминирующиеся антигены представляют собой группу вымываемых отбором, т.е. не поддерживаемую селекцией и экологическими факторами часть генофонда.
При базовом периоде 2, логично не выявлено отличий с частотными классами периодов 1 и 3.
Сравнение периода 3 с данными периодов 1 и 2 достоверные отличия отмечены по классу средне встречающихся антигенов только с периодом 1.
Во всех остальных случаях отличий не определено.
Заключение
Двухвыборочный t-критерий Стьюдента максимально информативен для оценки изменений генетической структуры популяции на начальных этапах их развития.
Коэффициент корреляции не улавливает начальные уровни дивергенции популяционных признаков.
Популяционные процессы наиболее отчетливо проявляются по антиген-частотным характеристикам ЕАВ-системы групп крови.
Классы антигенов по частотам встречаемости проявляют характерные отличительные признаки только между отдаленными периодами.
Класс редко встречающихся антигенов можно рассматривать, как показательный для выявления кумуляции отличий.Конфликт интересов Не указан. | Conflict of Interest None declared. |
Список литературы / References
- Букаров Н. Генетический мониторинг в молочном скотоводстве с использованием маркерных групп крови / Букаров Н., Силкин С. // Молочное и мясное скотоводство. – 2011. – №. 7. – С. 14-16.
- Тихонов В. Н. Мониторинг микроэволюции и породообразования свиней на основе молекулярно-иммуногенетического анализа / Тихонов В. Н., Бобович В. Е. // Сельскохозяйственная биология. – 2004. – №. 2. – С. 10-27.
- Еремина И. Ю. Ретроспективный анализ филогенеза при формировании маточной субпопуляции голштинизированного молочного скота Красноярского края / Еремина И. Ю., Герасимова Л. А., Лущенко А. Е. // Вестник Омского государственного аграрного университета. – 2016. – №. 2 (22)
- Никитин С. В. Динамика гетерозиготности и ее связь с приспособленностью в популяции домашних свиней // Генетика. – 2009. – Т. 45. – №. 10. – С. 1401-1410.
- Айвазян С. А. Теория вероятностей и прикладная статистика. Т. 1. / Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-е изд., испр. / С. А. Айвазян,В. С. Мхитарян. - Москва: Юнити-Дана, 2001, 656 с.
- Венцель Е.С. Теория вероятностей: Учеб. пособие для студентов вузов. / Е.С. Венцель, Л.А. Овчаров. - М:.-1969
- Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике: Учеб. пособие для студентов вузов / В.Е. Гмурман. – М.: Высш. школа, 1979. 400 с.
- Кремер Н.Ш. Теория вероятностей и математическая статистика: Учеб. пособие для студентов вузов. / Н.Ш. Кремер. - М:.-2004
- Рубан А.И., Методы анализа данных / А.И. Рубан. – Красноярск 1993.
- Хижняк С.В. Математические методы в биологии и экологии: часть 3. Учебно-методическое пособие. / С.В. Хижняк. – Красноярск, 2005.
Список литературы на английском языке / References in English
- Bukarov N. Geneticheskii monitoring v molochnom skotovodstve s ispolzovaniem markernykh grupp krovi [Genetic Monitoring in Dairy Cattle Breeding using Marker Blood Groups] / Bukarov N., Silkin S. // Molochnoye i myasnoye skotovodstvo [Dairy and Beef Cattle]. – 2011. – No. 7. – P. 14-16. [in Russian]
- Tikhonov V. N. Monitoring mikroevolyutsii i porodoobrazovaniya svinei na osnove molekulyarno-immunogeneticheskogo analiza [Monitoring of Microevolution and Pig Breeding on the Basis of Molecular Immunogenetic Analysis] / Tikhonov V. N., Bobovich V. E. // Sel'skokhozyaystvennaya biologiya [Agricultural Biology]. – 2004. – No. 2. – P. 10-27. [in Russian]
- Eremina I. Yu. Retrospektivnyi analiz filogeneza pri formirovanii matochnoi subpopulyatsii golshtinizirovannogo molochnogo skota Krasnoyarskogo kraya [Retrospective Analysis of Phylogenesis in the Formation of Uterine Subpopulations of Holsteinized Dairy Cattle of the Krasnoyarsk Territory] / Eremina I. Yu., Gerasimova L. A., Lushchenko A. E. // Vestnik Omskogo gosudarstvennogo agrarnogo universiteta [Bulletin of Omsk State Agrarian University]. – 2016. – No. 2 (22) [in Russian]
- Nikitin S. V. Dinamika geterozigotnosti i ee svyaz s prisposoblennostyu v populyatsii domashnikh svinei [Dynamics of Heterozygosity and its Connection with Fitness in the Population of Domestic Pigs] // Genetika [Genetics]. – 2009. – V. 45. – No. 10. – P. 1401-1410. [in Russian]
- Ayvazyan S. A. Teoriya veroyatnostei i prikladnaya statistika. T. 1. [Probability Theory and Applied Statistics. V. 1] / Applied Statistics. Fundamentals of Econometrics: Textbook for universities: In 2 volumes. 2nd ed., Rev./S. A. Ayvazyan, V.S. Mkhitaryan. - Moscow: Unity-Dan, 2001, 656 p. [in Russian]
- Ventsel E.S. Teoriya veroyatnostei: Ucheb. posobie dlia studentov vuzov. [Theory of Probability: Study Guide for University Students] / E.S. Ventsel, L.A. Ovcharov. – M:. – 1969 [in Russian]
- Gmurman V.E. Rukovodstvo k resheniyu zadach po teorii veroyatnostei i matematicheskoi statistike: Ucheb. posobie dlia studentov vuzov. [Guide to Solving Problems in Probability Theory and Mathematical Statistics: Study Guide for University Students] / V.E. Gmurman. – M.: Vysshaya Shkola, 1979. 400 p. [in Russian]
- Kremer N.Sh. Teoriya veroyatnostei i matematicheskaya statistika: Ucheb. posobie dlia studentov vuzov. [Probability Theory and Mathematical Statistics: Study Guide for University Students] / N.Sh. Kremer. – M:. – 2004 [in Russian]
- Ruban A.I. Metody analiza dannykh [Data Analysis Methods] / A.I. Ruban – Krasnoyarsk 1993. [in Russian]
- Khizhnyak S.V., Matematicheskie metody v biologii i ekologii: chast 3. Uchebno-metodicheskoe posobie. [Mathematical Methods in Biology and Ecology: Part 3. Teaching aid] / S.V. Khizhnyak. – Krasnoyarsk. 2005. [in Russian]