ИИ-стартап SandboxAQ, выросший из Google и получивший поддержку Nvidia, представил масштабный синтетический набор данных, способный радикально ускорить разработку новых препаратов. Используя экспериментальные данные и моделирование на специализированных чипах, команда SandboxAQ сгенерировала 5,2 миллиона трёхмерных молекул, на которых теперь можно обучать ИИ. Главная цель — научить алгоритмы точно предсказывать, будет ли то или иное соединение связываться с нужным белком в организме человека ещё до лабораторных экспериментов.
По словам Надии Харен, главы направления AI-симуляций в SandboxAQ, речь идёт о принципиально новом подходе: синтетические молекулы генерируются не случайно, а строго в соответствии с проверенными уравнениями молекулярной физики. Это позволяет моделям распознавать закономерности и предсказывать поведение новых соединений — в виртуальной среде, но с точностью, сравнимой с лабораторной. Ранее на это уходили месяцы работы и миллионы долларов. Теперь такие расчёты можно проводить за часы, без потерь в достоверности.
Как работает система
В традиционной фарме процесс подбора молекул для будущих лекарств напоминает поиск иголки в стоге сена. Даже на стадии доклинических исследований приходится вручную проверять сотни и тысячи вариантов. Алгоритмы SandboxAQ позволяют кардинально изменить подход. Модели обучаются на базе миллионов синтетических данных, каждое из которых формируется на основе реальных взаимодействий и дополнительно валидируется. Эти модели способны мгновенно оценивать перспективность соединения, прогнозируя, будет ли оно эффективно взаимодействовать с белком-мишенью.
Харен подчёркивает, что все вычисленные структуры связаны с экспериментальными “истинными” данными. Поэтому, в отличие от многих чисто теоретических симуляций, их синтетический набор позволяет обучать модели ИИ так, как раньше было невозможно.
Модели на основе синтетических данных могут дать фармацевтической отрасли то, к чему она давно стремилась: значительное сокращение времени от идеи до молекулы-кандидата, снижение стоимости исследований и повышение точности. SandboxAQ уже вложила в эту технологию миллионы и привлекла почти миллиард долларов венчурных инвестиций. Теперь она рассчитывает монетизировать разработки, предлагая фармкомпаниям ИИ-инструменты, которые по точности приближаются к лабораторным экспериментам, но работают в цифровом формате и с куда меньшими затратами.
Сами создатели называют свои модели новым инструментом фундаментальной науки и отмечают, что точность таких предсказаний может напрямую влиять на успех не только отдельных исследований, но и целых стратегий в персонализированной медицине.


