Новые вычислительные методы ускоряют селекцию животных
Докторская диссертация изучила новые статистические методы для селекции животных, позволяющие более эффективно анализировать обширные выборки данных о поголовье и использовать сложные модели. Время вычислений, длящееся месяцами, можно сократить до недель.
Исследователь Каарина Матилайнен объясняет, что в крайних случаях для обработки сложных моделей, используемых в исследованиях по селекции животных, требуются месяцы работы.
Целью было найти эффективный вычислительный метод, который позволил бы быстрее обрабатывать выборки данных, используя меньшие вычислительные мощности.
Модели описывают характеристики поголовья
Для улучшения поголовья ученым необходимо оценивать генетические параметры, такие как степень генетической вариации определенных признаков. Это основано на измерениях наблюдаемых характеристик, например, надоев молока у молочного скота или скорости роста у свиней. В этом могут помочь смешанные модели, учитывающие вариации из различных источников. Для каждого источника вариации необходимо оценить статистический параметр — дисперсию.
Исследование было сосредоточено на методах оценки параметров дисперсии моделей, описывающих характеристики животных.
Из-за больших выборок данных и сложных моделей, часто используемых в оценках селекции, вычислительная эффективность является ключевой особенностью методов оценки.
В работе изучался так называемый метод ограниченного максимального правдоподобия. Линеаризация использовалась для оценки кривых роста у свиней, а метод Монте-Карло — для вычисления дисперсий в моделях надоев молочного скота. Хотя методы в основном изучались на смоделированных выборках данных, также анализировались реальные выборки по молочному скоту.
Более быстрые решения для сложных моделей
Линеаризация позволила использовать существующее мощное программное обеспечение с небольшими доработками для оценки кривых роста. Этот метод хорошо работал с выборками данных, описывающих развитие веса животных от рождения до взрослого состояния.
Новые приложения, использующие метод Монте-Карло, оказались эффективными как с точки зрения требуемой памяти компьютера, так и времени вычислений.
Это означает, что в будущем параметры генетической дисперсии, необходимые для программ селекции животных, можно будет вычислять быстрее. Вычисления, которые раньше занимали месяцы, будут выполняться всего за недели.
Результаты исследования можно использовать для разработки более реалистичных и сложных моделей в разумные сроки.
