BelNET logo

Belarusian Nuclear Education and Training Portal - BelNET

eng

rus

Material of portal nuclear knowledge BelNET
article / document resource request "6784"
2025-11-14
Феноменология от PhyE2E. ИИ для вывода аналитических выражений из экспериментальных данных

Коллективом исследователей из Университета Цинхуа (Центр математических наук Яу, Кафедра математических наук, Кафедра электронной инженерии, Институт исследований индустрии искусственного интеллекта), Пекинского университета (Институт искусственного интеллекта, Факультет наук о Земле и космосе) и Пекинского института математических наук и приложений разработана модель искусственного интеллекта PhyE2E, предназначенная для вывода аналитических выражений непосредственно на основе исходных экспериментальных данных.

Итоги работы опубликованы в статье под названием "A neural symbolic model for space physics" в журнале Nature. Полная версия статьи доступна на arXiv по ссылке.

Модель решает задачу символьной регрессии, которая, будучи ключевым методом обнаружения физических закономерностей, сталкивается с проблемами масштабируемости и интерпретируемости.

Символьная регрессия — это метод машинного обучения, задачей которого является поиск аналитического выражения (математической формулы), оптимально описывающего зависимость в экспериментальных данных. В отличие от традиционной регрессии, где вид модели задаётся априори (например, линейная или полиномиальная), символьная регрессия автоматически определяет как структуру выражения, так и значения числовых констант, перебирая комбинации математических операторов, переменных и параметров. Ключевым преимуществом метода является способность генерировать интерпретируемые результаты, имеющие потенциальное объяснение в терминах фундаментальных законов природы.

Алгоритм PhyE2E декомпозирует основную задачу на подзадачи, используя для этого анализ вторых производных функции, аппроксимированной вспомогательной нейронной сетью, по входным параметрам. Этот подход позволяет выявить структурные компоненты искомых выражений. Для сквозного преобразования числовых данных в символьные формулы применяется архитектура трансформера. Полученные выражения последовательно уточняются с помощью комбинации методов поиска по дереву Монте-Карло и генетического программирования, которые оптимизируют как числовые коэффициенты, так и общую структуру формулы.

Для создания обширного корпуса синтетических выражений, аналогичных реальным физическим законам, используется крупная языковая модель, а система обучается восстанавливать эти формулы непосредственно из данных. Результаты комплексного тестирования демонстрируют, что PhyE2E превосходит современные state-of-the-art методы по ключевым метрикам, включая точность восстановления символьной формы, точность аппроксимации данных и обеспечение размерной согласованности итоговых выражений.

Продолжение читайте ниже, в Подробнее.

Модель была апробирована на пяти задачах в области физики космического пространства: прогнозировании чисел Вольфа, определении угловой скорости солнечного вращения, установлении функций вклада линий излучения, моделировании давления плазмы в околоземном пространстве и идентификации плазменных сигналов лунных приливов. Полученные с помощью искусственного интеллекта аналитические выражения продемонстрировали высокую степень соответствия эмпирическим данным, полученным со спутников и астрономических телескопов. В результате применения модели была модифицирована формула NASA 1993 года, описывающая солнечную активность, и впервые сформулировано явное символическое выражение для долгосрочного цикла солнечной активности. Экспериментально установлено, что спад давления плазмы в околоземном пространстве подчиняется квадратичной зависимости от расстояния до центра Земли; последующие математические выводы, следующие из данной зависимости, были верифицированы независимыми спутниковыми наблюдениями. Кроме того, были выведены формулы, устанавливающие количественную связь между интенсивностью линий излучения в крайней ультрафиолетовой области спектра Солнца и вариациями температуры, плотности электронов и напряженности магнитного поля. Структура и свойства полученных выражений согласуются с теоретическими предположениями, ранее выдвигавшимися в научной литературе.

Отдельно поясним читателям, что разработанная модель представляет собой новый мощный инструмент для автоматического отыскания аналитических выражений, результаты которого, однако, носят феноменологический характер. Получаемые формулы с высокой точностью описывают эмпирические данные, однако их физическая интерпретация и вывод из первых принципов остаются предметом отдельного теоретического исследования. Таким образом, модель не «понимает» физику в человеческом смысле и не выводит законы из фундаментальных аксиом, а выполняет сложнейшую работу по выделению статистически значимых паттернов и их компактному аналитическому представлению.

Sign In