Резервный банк Австралии приоткрыл завесу над серьезным сбоем в октябре, который задержал урегулирование некоторых платежей в режиме реального времени на срок до пяти дней.
Вскрытие инцидента показывает, что в 19:00 12 октября произошла операционная ошибка во время запланированного масштабного изменения банка с использованием программного обеспечения, которое обеспечивает виртуальные серверы РБА.
Ошибка запустила процесс, который произвольно нарушил работу значительного числа серверов в течение приблизительно 25 минут.
«Масштаб затронутых серверов был вызван несоблюдением политики РБА по управлению технологическими изменениями и пробелы в контроле связанные с дизайном решения для виртуальных серверов, способствовали быстрому распространению ошибки. Инцидент затронул несколько систем РБА», — заявляет центральный банк.
«Несмотря на то, что мощные функции резервирования RITS и FSS позволили частям системы продолжать нормально работать, некоторые сервисы стали недоступны и отказоустойчивость системы серьезно ухудшилась. Масштаб и случайный характер сбоев значительно усложнили реагирование на инциденты».
В результате около 500 тыс. уникальных платежей NPP (17% среднедневного объема за среду) отправленных населением, были задержаны, как минимум на четыре часа, а некоторые задержаны более чем на пять дней.
В отчете указывается ряд серьезных недостатков платформы NPP касающихся управления, мониторинга потоков платежей, процедур восстановления и связи.
В заявлении центрального банка говорится: «РБА признает серьезность этого инцидента и приносит искренние извинения участникам отрасли и их клиентам за широкомасштабные последствия, которые он вызвал».
Вскрытие инцидента показывает, что в 19:00 12 октября произошла операционная ошибка во время запланированного масштабного изменения банка с использованием программного обеспечения, которое обеспечивает виртуальные серверы РБА.
Ошибка запустила процесс, который произвольно нарушил работу значительного числа серверов в течение приблизительно 25 минут.
«Масштаб затронутых серверов был вызван несоблюдением политики РБА по управлению технологическими изменениями и пробелы в контроле связанные с дизайном решения для виртуальных серверов, способствовали быстрому распространению ошибки. Инцидент затронул несколько систем РБА», — заявляет центральный банк.
«Несмотря на то, что мощные функции резервирования RITS и FSS позволили частям системы продолжать нормально работать, некоторые сервисы стали недоступны и отказоустойчивость системы серьезно ухудшилась. Масштаб и случайный характер сбоев значительно усложнили реагирование на инциденты».
В результате около 500 тыс. уникальных платежей NPP (17% среднедневного объема за среду) отправленных населением, были задержаны, как минимум на четыре часа, а некоторые задержаны более чем на пять дней.
В отчете указывается ряд серьезных недостатков платформы NPP касающихся управления, мониторинга потоков платежей, процедур восстановления и связи.
В заявлении центрального банка говорится: «РБА признает серьезность этого инцидента и приносит искренние извинения участникам отрасли и их клиентам за широкомасштабные последствия, которые он вызвал».