ИИ-модель научилась понимать генетический «язык» растений
РНК, близкий химический родственник ДНК, — важная молекула во всех организмах. Она отвечает за хранение и передачу генетической информации, закодированной в последовательности ее строительных блоков, нуклеотидов. Структура молекулы РНК подобна слову, составленному из букв: нуклеотиды соединяются в различные комбинации, образуя уникальные «слова» генетического кода.
Команда из Центра Джона Иннеса изучает структуру РНК — сложный «язык» молекул, который позволяет им формировать структуры для управления ростом растений и их реакцией на стресс. Вместе с коллегами из Университета Эксетера ученые разработали модель PlantRNA-FM, обученную на массиве данных, который включал 54 млрд единиц информации РНК, составляющих генетический «алфавит» 1124 видов растений.
При создании PlantRNA-FM ученые использовали подход, аналогичный тому, что применяется для обучения языковых моделей, таких как ChatGPT. ИИ был обучен на обширном массиве данных о РНК различных видов растений, что позволило ему «выучить» язык РНК и понять его структуру.
Подобно тому, как ChatGPT может понимать и генерировать человеческий текст, PlantRNA-FM научилась распознавать и анализировать «грамматику» и «синтаксис» последовательностей и структур РНК.
Исследователи использовали модель для точного прогнозирования функций РНК и идентификации ее специфических функциональных структур в транскриптомах. Эксперименты подтвердили, что структуры РНК, идентифицированные PlantRNA-FM, влияют на эффективность трансляции генетической информации в белок.
«Хотя последовательности РНК могут казаться человеческому глазу случайными, наша модель искусственного интеллекта научилась расшифровывать скрытые в них закономерности», — говорит один из авторов исследования, доктор Хаопэн Юй.
Разработка открывает новые возможности для понимания и программирования растений. Это позволит повысить продуктивность сельского хозяйства.