Машинное обучение раскрывает секреты растений. Растения – главные химики, и исследователи Мичиганского государственного университета раскрыли их секрет производства специализированных метаболитов.

Исследование, опубликованное в последнем выпуске «Трудов Национальной академии наук», объединило биологию растений и машинное обучение для сортировки десятков тысяч генов, чтобы определить, какие гены образуют специализированные метаболиты.

Фото: Мичиганский государственный университет Шин-Хань Шиу – профессор биологии растений в МГУ. Он и его коллеги недавно опубликовали статью в трудах Национальной академии наук. Фото: Г.Л. Кохут.

Некоторые метаболиты привлекают опылителей, другие отталкивают вредителей. Вы никогда не задумывались, почему олени едят тюльпаны, а не нарциссы? Это потому, что у нарциссов есть метаболиты, чтобы отбиваться от тварей, которые на них едят.

Результаты могут потенциально привести к улучшению растений, а также к разработке растительных фармацевтических препаратов и экологически безопасных пестицидов, сказал Шин-Хан Шиу, специалист по вычислительной биологии растений МГУ.

«Растения удивительны – это их собственные мини-фабрики, и мы хотели воссоздать то, что они делают в лаборатории, для производства синтетических химикатов для производства лекарств, устойчивых к болезням сельскохозяйственных культур и даже искусственных ароматизаторов», – сказал Шиу. «Наше исследование показало, что можно выбрать правильный ген, автоматизировав процесс, поскольку машины более способны распознавать мелкие различия между тысячами генов».

Используя подход машинного обучения, междисциплинарная группа биохимиков и вычислительных биологов создала модель, которая рассмотрела более 30 000 генов в Arabidopsis thaliana, небольшом цветущем растении, которое называют «лабораторной крысой науки о растениях».

Модель основана на технологии, используемой электронной коммерцией для прогнозирования поведения потребителей и создания целевой рекламы, такой как реклама на странице человека в Facebook. По сути, эта технология сортирует тысячи объявлений на основе вашего предыдущего поведения в Интернете, чтобы отправлять вам избранные объявления, соответствующие вашим интересам и действиям.

В исследовании растений ученые написали программу, которая сортировала 30 000 генов, чтобы отобрать те, которые связаны с получением специализированных метаболитов.

«Машинное обучение было для нас новым подходом в биологии растений, новым применением инструментов, широко используемых в других областях», – сказал Шиу. «Модель, которую мы создали с помощью машинного обучения, теперь может быть применена к другим видам растений, которые производят лекарственные или промышленные полезные соединения, чтобы ускорить процесс обнаружения генов, ответственных за их производство».

«Мы давно знаем, что растения производят множество полезных, ценных соединений, но эта работа действительно раскрывает этот сундук с сокровищами новыми важными способами», – сказал Клиффорд Вейл, директор программы в Исследовании генома растений Национального научного фонда. Программа, которая финансировала исследования. «Это большой прогресс в том, как и насколько хорошо мы можем исследовать самые креативные биофабрики природы».

Этот проект также подчеркивает пользу междисциплинарных исследований.

«Наша команда биологов и ученых в области вычислительной техники работала вместе, чтобы ответить на вопросы, которые не могут быть решены в каждой отдельной дисциплине», – сказал Шиу. «Различные знания, идеи и культуры сталкиваются, взаимообогащают и приводят к новым захватывающим открытиям».

По материалам phys.org