Как поймать геном рыбы с помощью больших данных

Более 80% морепродуктов в США импортируется. Новое генетическое исследование может помочь сделать аквакультуру более эффективной. Ученые впервые собрали и аннотировали геном рыбы Seriola dorsalis (калифорнийский желтохвост) — ценного вида для индустрии сашими.

Ключевые открытия

  • Установлено, что Seriola dorsalis имеет систему определения пола Z-W, где пол потомства определяется яйцеклеткой. Определена хромосома и регион, ответственный за пол.
  • Это важно для аквакультуры, так как у молоди нет внешних половых различий. Генетический маркер позволит оптимально формировать стада.

Сборка генома: вычислительный вызов

  • Геном размером 685 миллионов пар оснований (685 Мб) был собран из тысяч коротких фрагментов.
  • Объем сырых данных секвенирования составил 500 гигабайт.
  • Для сборки потребовались суперкомпьютеры с огромной оперативной памятью (RAM), чтобы сравнивать все фрагменты между собой, как гигантский пазл.

Роль суперкомпьютерных ресурсов XSEDE

  • Система Blacklight в Pittsburgh Supercomputing Center (PSC) с большой памятью использовалась для сборки генома с помощью ассемблера Maryland Super-Read Celera Assembler.
  • Система Stampede в Texas Advanced Computing Center с тысячами вычислительных узлов использовалась для аннотации генов (анализ BLAST), сократив год вычислений до нескольких недель.
  • Поддержка Extended Collaborative Support Services (ECSS) XSEDE была ключевой для быстрого старта.

Будущие направления и значение

  • Собранный геном — это "базовый чертеж", но остаются пробелы. Технологии длинного чтения (long-read sequencing) помогут их заполнить.
  • Выдвинута гипотеза, что делеция в гене, связанном с превращением эстрона в эстроген, может определять пол. Это требует проверки, например, с помощью CRISPR.
  • Геном позволит проводить полногеномные ассоциативные исследования (GWAS) для поиска маркеров, связанных с деформациями челюсти у рыб, и селекции против них.
  • Исследование демонстрирует, как большие данные и высокопроизводительные вычисления решают задачи устойчивого производства пищи.

Исследование "Insights into teleost sex determination from the Seriola dorsalis genome assembly" опубликовано в январе 2018 года в журнале BMC Genomics.

2018-04-11