Как поймать геном рыбы с помощью больших данных
Более 80% морепродуктов в США импортируется. Новое генетическое исследование может помочь сделать аквакультуру более эффективной. Ученые впервые собрали и аннотировали геном рыбы Seriola dorsalis (калифорнийский желтохвост) — ценного вида для индустрии сашими.
Ключевые открытия
- Установлено, что Seriola dorsalis имеет систему определения пола Z-W, где пол потомства определяется яйцеклеткой. Определена хромосома и регион, ответственный за пол.
- Это важно для аквакультуры, так как у молоди нет внешних половых различий. Генетический маркер позволит оптимально формировать стада.
Сборка генома: вычислительный вызов
- Геном размером 685 миллионов пар оснований (685 Мб) был собран из тысяч коротких фрагментов.
- Объем сырых данных секвенирования составил 500 гигабайт.
- Для сборки потребовались суперкомпьютеры с огромной оперативной памятью (RAM), чтобы сравнивать все фрагменты между собой, как гигантский пазл.
Роль суперкомпьютерных ресурсов XSEDE
- Система Blacklight в Pittsburgh Supercomputing Center (PSC) с большой памятью использовалась для сборки генома с помощью ассемблера Maryland Super-Read Celera Assembler.
- Система Stampede в Texas Advanced Computing Center с тысячами вычислительных узлов использовалась для аннотации генов (анализ BLAST), сократив год вычислений до нескольких недель.
- Поддержка Extended Collaborative Support Services (ECSS) XSEDE была ключевой для быстрого старта.
Будущие направления и значение
- Собранный геном — это "базовый чертеж", но остаются пробелы. Технологии длинного чтения (long-read sequencing) помогут их заполнить.
- Выдвинута гипотеза, что делеция в гене, связанном с превращением эстрона в эстроген, может определять пол. Это требует проверки, например, с помощью CRISPR.
- Геном позволит проводить полногеномные ассоциативные исследования (GWAS) для поиска маркеров, связанных с деформациями челюсти у рыб, и селекции против них.
- Исследование демонстрирует, как большие данные и высокопроизводительные вычисления решают задачи устойчивого производства пищи.
Исследование "Insights into teleost sex determination from the Seriola dorsalis genome assembly" опубликовано в январе 2018 года в журнале BMC Genomics.
