Вычислительная биология для аннотации белков

Исследователи из Университета Карлоса III в Мадриде совместно с Национальным центром онкологических исследований Испании применили вычислительные методы для улучшения характеристики белков. Разработанная ими система позволила, например, предсказать связь двух человеческих белков с теломерами, что указывает на их возможную роль в клеточном старении и развитии рака; это требует экспериментальной проверки.

Белки — это молекулы, образованные цепями аминокислот, играющие фундаментальную роль в жизни, поскольку содержат информацию, закодированную в генах. Они выполняют множество функций: иммунологическую (антитела), структурную (составляют основу клеточного материала), биорегуляторную (входят в состав ферментов) и многие другие. Они регулируют тысячи процессов в организме, часто через взаимодействия с другими молекулами.

Профессор Беатрис Гарсия с факультета информатики UC3M объясняет, что анализ сети взаимодействий — сложная задача из-за огромного числа ассоциаций. Экспериментальное определение функциональных связей очень затратно, поэтому учёные применяют вычислительные инструменты для предсказания функций и направления экспериментов. Для этого используются методы искусственного интеллекта, в частности машинного обучения, в рамках междисциплинарной области — биоинформатики или вычислительной биологии.

Данное исследование углубляет аннотацию функций белков — определение того, какой белок или группа белков выполняет конкретную задачу в организме. Учёные сосредоточились на двух проблемах:

  1. Предсказание функциональных связей между парами белков у бактерии Escherichia coli.
  2. Расширение известных биологических путей у человека.

Особый интерес представляют предсказания для двух человеческих белков (E3 SUMO-protein ligase и E3 ubiquitin-protein ligase DTX1). Ранее они были связаны с контролируемой деградацией белков, а теперь им предложена новая функция — стабилизация теломер. Это предполагает их возможную роль в клеточном старении и развитии рака, что требует экспериментальной проверки.

Часть этого исследования была опубликована в журнале PLOS ONE. Работа уже имеет практическое значение:

  • Результаты по первой задаче интегрированы в сервер предсказаний EcID (E.coli Interaction Database), повышая надёжность предсказаний функциональных связей.
  • Методология расширения биологических путей открывает новое направление в биоинформатике, дополняя единственную существующую публикацию в этой области и охватывая больше белков.

По словам Беатрис Гарсии, в области вычислительной биологии остаётся много нерешённых задач, требующих computational-решений. Эта область растёт с развитием технологий, но сталкивается с вызовами, такими как анализ данных секвенирования нового поколения. Необходимы специалисты, интегрирующие биологию и информатику, чтобы углубить знания об организме на молекулярном уровне и помочь в лечении болезней.

2012-11-26