Новая модель OpenAI GPT-4b micro нацелена на продление жизни
Проект по инженерии белков стартовал год назад, когда Retro Biosciences, компания из Сан-Франциско, занимающаяся исследованиями в области долголетия, обратилась к OpenAI с предложением о сотрудничестве. Эта связь не случайна: Сэм Альтман, генеральный директор OpenAI, лично инвестировал $180 млн в Retro в 2023 году. Стартап ставит перед собой цель увеличить продолжительность жизни человека на 10 лет с помощью факторов Яманаки. Так называют набор белков, которые могут превратить клетку кожи человека в стволовую, способную производить любую ткань организма.
Исследователи из Retro и других компаний рассматривают это явление как возможную отправную точку для омоложения животных, создания человеческих органов или обеспечения запасов замещающих клеток. Однако такое «перепрограммирование» не особо эффективно. Оно занимает несколько недель, и менее 1% клеток, обработанных в лабораторных условиях, завершают процесс омоложения.
Новая модель OpenAI, получившая название GPT-4b micro, была обучена предлагать способы модификации белковых факторов для повышения их функциональности.
Согласно OpenAI, исследователи использовали предложения модели для изменения двух факторов Яманаки, что позволило более чем в 50 раз повысить их эффективность — по крайней мере, согласно предварительным оценкам. «В целом, белки, похоже, работают лучше, чем те, которые ученые смогли получить самостоятельно», — говорит исследователь из OpenAI Джон Халлман.
В отличие от AlphaFold (Google), которая прогнозирует трехмерную структуру белков, новая модель OpenAI работает по другому принципу. В OpenAI поясняют, что факторы Яманаки, будучи необычно гибкими и неструктурированными белками, требовали иного подхода, с которым справляются большие языковые модели. Обучение модели проводилось на основе данных о последовательностях белков различных видов, а также информации об их взаимодействиях. Количество использованных примеров, хотя и велико, несравнимо с тем объемом, на котором обучались флагманские чат-боты OpenAI. Поэтому GPT-4b можно классифицировать скорее как малую языковую модель, ориентированную на узкий набор данных.
Исследователи Retro предоставляли GPT-4b micro ряд примеров белковых последовательностей с известными свойствами, после чего просили предложить модификации для факторов Яманаки. Традиционные методы генетической инженерии позволяют тестировать лишь ограниченное количество вариантов модификаций, поскольку даже белок обычной длины может быть изменен почти бесконечным числом способов (из-за сотен аминокислот, каждая из которых может быть представлена 20 различными вариантами). Модель OpenAI часто предлагала изменения, затрагивающие до трети аминокислот в белках.
Механизм, посредством которого GPT-4b делает выводы, не до конца ясен, что, в целом, свойственно искусственному интеллекту.
Независимые ученые не смогут подтвердить достоверность результатов до их публикации. Разработчики планируют обнародовать данные позже. Модель недоступна для широкого использования — пока это лишь демонстрация, а не официальный запуск продукта.