Вычислительная биология для аннотации белков
Исследователи из Университета Карлоса III в Мадриде совместно с Национальным центром онкологических исследований Испании применили вычислительные методы для улучшения характеристики белков. Разработанная ими система позволила, например, предсказать связь двух человеческих белков с теломерами, что указывает на их возможную роль в клеточном старении и развитии рака; это требует экспериментальной проверки.
Белки — это молекулы, образованные цепями аминокислот, играющие фундаментальную роль в жизни, поскольку содержат информацию, закодированную в генах. Они выполняют множество функций: иммунологическую (антитела), структурную (составляют основу клеточного материала), биорегуляторную (входят в состав ферментов) и многие другие. Они регулируют тысячи процессов в организме, часто через взаимодействия с другими молекулами.
Профессор Беатрис Гарсия с факультета информатики UC3M объясняет, что анализ сети взаимодействий — сложная задача из-за огромного числа ассоциаций. Экспериментальное определение функциональных связей очень затратно, поэтому учёные применяют вычислительные инструменты для предсказания функций и направления экспериментов. Для этого используются методы искусственного интеллекта, в частности машинного обучения, в рамках междисциплинарной области — биоинформатики или вычислительной биологии.
Данное исследование углубляет аннотацию функций белков — определение того, какой белок или группа белков выполняет конкретную задачу в организме. Учёные сосредоточились на двух проблемах:
- Предсказание функциональных связей между парами белков у бактерии Escherichia coli.
- Расширение известных биологических путей у человека.
Особый интерес представляют предсказания для двух человеческих белков (E3 SUMO-protein ligase и E3 ubiquitin-protein ligase DTX1). Ранее они были связаны с контролируемой деградацией белков, а теперь им предложена новая функция — стабилизация теломер. Это предполагает их возможную роль в клеточном старении и развитии рака, что требует экспериментальной проверки.
Часть этого исследования была опубликована в журнале PLOS ONE. Работа уже имеет практическое значение:
- Результаты по первой задаче интегрированы в сервер предсказаний EcID (E.coli Interaction Database), повышая надёжность предсказаний функциональных связей.
- Методология расширения биологических путей открывает новое направление в биоинформатике, дополняя единственную существующую публикацию в этой области и охватывая больше белков.
По словам Беатрис Гарсии, в области вычислительной биологии остаётся много нерешённых задач, требующих computational-решений. Эта область растёт с развитием технологий, но сталкивается с вызовами, такими как анализ данных секвенирования нового поколения. Необходимы специалисты, интегрирующие биологию и информатику, чтобы углубить знания об организме на молекулярном уровне и помочь в лечении болезней.
