Компания по кибербезопасности OpenZeppelin провела аудит нового ИИ-бенчмарка EVMbench от OpenAI. Эксперты выявили методологические ошибки и «загрязнение» данны Компания по кибербезопасности OpenZeppelin провела аудит нового ИИ-бенчмарка EVMbench от OpenAI. Эксперты выявили методологические ошибки и «загрязнение» данны

В ИИ-бенчмарке OpenAI для проверки блокчейнов обнаружили ошибки

2026/03/03 15:09
2м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

В ИИ-бенчмарке OpenAI для проверки блокчейнов обнаружили ошибки 

Компания по кибербезопасности OpenZeppelin провела аудит нового ИИ-бенчмарка EVMbench от OpenAI. Эксперты выявили методологические ошибки и «загрязнение» данных.

Разработчик ChatGPT запустил EVMbench в середине февраля в партнерстве с инвестфондом Paradigm для оценки способности ИИ-агентов находить, исправлять и эксплуатировать уязвимости в смарт-контрактах. 

Специалисты OpenZeppelin приветствовали инициативу, но решили проверить разработку по тем же стандартам, что и защищаемые протоколы (включая Aave, Lido и Uniswap).

Ключевые недостатки 

Главная проблема связана с «загрязнением» тренировочных данных. EVMbench построен на подборке из 120 уязвимостей, выявленных в ходе аудитов 2024-2025 годов. 

Однако ведущие модели, проходившие тестирование, имеют срез знаний до августа 2025 года. Модели могли «вспоминать» сведения об этих уязвимостях из обучающих данных. Даже при отключенном интернете это ставит под сомнение чистоту эксперимента: неизвестно, способен ли ИИ выявлять действительно новые угрозы.

В OpenZeppelin также указали на фактические ошибки в наборе данных EVMbench. Как минимум четыре уязвимости из категории «высокого риска» оказались неработоспособными. При этом ИИ-агенты получали правильные баллы за якобы верное обнаружение этих проблем. 

Специалисты подтвердили, что искусственный интеллект сыграет ключевую роль в будущем безопасности блокчейнов. Однако они предупредили: спешка с внедрением не должна идти в ущерб качеству данных и тестов.

Напомним, в ноябре эксперты Microsoft представили среду для тестирования ИИ-агентов и выявили уязвимости, присущие современным цифровым помощникам.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Возможности рынка
Логотип AaveToken
AaveToken Курс (AAVE)
$116.42
$116.42$116.42
-5.28%
USD
График цены AaveToken (AAVE) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.