Прорыв в визуализации геномов: более быстрый и менее ресурсоемкий метод
Исследователи Кадир Деде и доктор Энно Олебуш из Университета Ульма (Германия) разработали метод построения субграфов пан-геномов с разной степенью детализации. Он позволяет избежать многочасовых или даже многодневных вычислений, необходимых для обработки всего генома. Теперь ученые смогут создавать визуализации пан-геномов на разных масштабах гораздо быстрее.
Исследование «Dynamic construction in pan-genome structures» опубликовано в открытом журнале De Gruyter Open Computer Science.
Для анализа конкретных участков генома ученым необходимо их «видеть», что требует огромных вычислительных мощностей и времени. Консорциум Computational Pan-Genomics призывает исследователей обеспечивать легкую доступность всей информации в структуре данных для человеческого восприятия с помощью визуализации на разных масштабах. Однако граф пан-генома может содержать от тысяч до миллионов узлов, которые очень сложно визуализировать.
В эксперименте Деде и Олебуш использовали 10 человеческих геномов и вычислили граф, содержащий часть большого повторяющегося центрального экзона гена человека MUC5AC. Ранее исследователям приходилось создавать полную индексную структуру геномов, что занимало около 8,5 часов и требовало 38,5 ГБ памяти. Используя новый метод, ученому достаточно вычислить два битовых вектора (на основе которых строится субграф) и сам субграф.
