Cloudflare опубликовала подробности крупного сбоя, произошедшего 18 ноября 2025 года и затронувшего значительную часть интернета, включая ChatGPT, X и Downdetector. Компания назвала этот инцидент «самым серьёзным с 2019 года» и объяснила его ошибкой в системе Bot Management.
Сбой возник из-за некорректной настройки запроса в базе данных ClickHouse, которая формирует конфигурационный файл для модели машинного обучения системы Bot Management. Изменение поведения запроса привело к дублированию данных и быстрому росту конфигурационного файла, превысившего лимиты памяти.
В результате вышла из строя основная прокси-система, обрабатывающая трафик клиентов, использующих модуль ботов. Компании, применявшие сгенерированный индикатор ботов в правилах, начали блокировать легитимный трафик, тогда как пользователи, не задействовавшие эту функцию, продолжали работать онлайн.
Cloudflare подчеркнула, что сбой не был связан с DNS, атаками или генеративным ИИ — причина заключалась исключительно во внутренней логике обновления конфигурации Bot Management.
Чтобы избежать повторения подобных инцидентов, компания объявила четыре меры:
1. Усиление проверки конфигурационных файлов, аналогично обработке пользовательского ввода;
2. Расширение числа глобальных «kill switch» для ключевых функций;
3. Предотвращение ситуаций, когда core dump или отчёты об ошибках могут перегружать систему;
4. Пересмотр всех режимов отказа в основных прокси-модулях.
Cloudflare отмечает, что около 20% интернет-трафика проходит через её сеть, поэтому сбои в центральных модулях способны вызвать глобальные последствия.
источник
уникальность