Главные новости Санкт-Петербурга
Санкт-Петербург
Июль
2024

Решающий сбой: как можно было избежать масштабной проблемы в работе Microsoft

0

Масштабный сбой в работе программных продуктов от компании Microsoft, который произошел 19 июля, был вызван недостатком в обновлении ПО CrowdStrike Falcon Sensor и затрагивает только устройства c ОС Windows, на которых оно было установлено. В нашей стране эта компания не работает, а Microsoft давно не обновляет свою операционную систему у российских пользователей из-за санкций. Из-за некорректной работы цифровой инфраструктуры были отменены или задержаны сотни авиарейсов, с перебоями работали банки и коммуникации в разных частях света. По мнению экспертов, сбоя можно было избежать, если бы компания более корректно провела процедуру тестирования обновления.

Почему произошел массовый сбой

Утром 19 июля по всему миру произошел массовый сбой в работе многочисленных продуктов Microsoft. Среди переставших нормально функционировать сервисов — операционная система Windows и облачная платформа Azure. Поломка стала причиной отмены сотен авиарейсов. Перестали нормально работать банки, коммунальные предприятия, телекоммуникационная инфраструктура и другие организации.

Глобальный сбой произошел из-за некорректного обновления сервиса кибербезопасности CrowdStrike. Проблема затронула только устройства c ОС Windows, на которых было установлено это ПО. В России компания не работает, поэтому сложности возможны только у незначительного количество владельцев устройств с данным программным обеспечением, рассказал «Известиям» руководитель департамента сетевой безопасности компании F.A.C.C.T. Никита Кислицин.

— Примечательно, что это уже вторая подряд проблема с этим сервисом за последнее время: в конце июня возникали схожие трудности. ПО Crowdstrike очень популярно во всем мире, но Россия здесь в безопасности: в нашей стране эта компания не работает, и у нас может быть только незначительное количество устройств с данным ПО, — сказал Никита Кислицин.

Сбоя можно было бы избежать, если бы разработчики более ответственно относились к процедуре тестирования обновления, считает руководитель продукта MaxPatrol VM, Positive Technologies Денис Матюхин. Перед массовой установкой патча или обновления нужно переносить их на рабочие станции, которые не участвуют в критически важных процессах предприятия. При этом необходимо проверить, чтобы патч или обновление не нарушали работу сетевых узлов. И если все хорошо, только после этого устанавливать их массово, добавил он.

— Существует также практика «канареечных обновлений» — сначала обновляется малая доля рабочих станций, не участвующих в процессах компании, после чего посегментно дообновляются все остальные активы. Также не стоит забывать про гигиену в IT: держать все в одном месте и не проводить диверсификацию — очень плохой путь, — сказал эксперт.

CrowdStrike не смогла сама восстановить упавшие компьютеры и серверы, проблему можно было решить только ручными действиями на поврежденных машинах, которые пришлось выполнять администраторам, обслуживающим затронутые организации, рассказал специалист.

В корпоративном секторе программы Microsoft Azure и Office 365 вплоть до начала 2022-го занимали треть рынка, но затем организация приостановила оказание своих услуг в РФ и компании, «досиживающие» ранее оформленную подписку, плавно начали переходить на российские решения, отметил главный редактор сайта Ferra.ru Евгений Харитонов. Например, аэропорты перешли на отечественные Astra Linux.

Как сбой повлиял на российские сервисы

Сообщений о сбоях систем в российских аэропортах в Минцифры не поступало, сообщили «Известиям» в пресс-службе ведомства.

Ситуация с Microsoft в очередной раз показывает значимость импортозамещения иностранного ПО, в первую очередь на объектах критической информационной инфраструктуры, — отметили в ведомстве.

Аэропорты Москвы и Санкт-Петербурга заявили о стабильной работе всех технических систем — рейсы на вылет и прилет российских и иностранных авиакомпаний выполняются по расписанию, отметили в пресс-службе аэропорта.

Не затронул сбой и отечественные сотовые операторы, а также крупнейшие маркетплейсы, которые работают на базе собственных IT-решений.

Сеть «Мегафона» работает в штатном режиме, и никаких проблем со связью или нашей инфраструктурой нет. Однако наши специалисты внимательно следят за ситуацией, — сообщили в пресс-службе оператора.

Какие страны затронул сбой

После того как из Австралии стала поступать первая информация о сбоях в работе Microsoft, по сети распространились фотографии длинных очередей в супермаркетах из-за неполадок кассового оборудования. Некоторые заправки в Канберре были вынуждены закрыться, регистрация на рейсы в аэропорте Мельбурна остановилась. Встала также работа сервиса такси Uber и приложений по доставке еды.

Крупные австралийские ABC, SBS, News Corp Australia, 7 и 9 канал отметили сложности в работе. Сотрудники ABC, в частности, не могли использовать суфлер и воспроизводить графику в студии. Некоторое время не мог выйти в прямой эфир и британский канал Sky News.

Сбои в работе Microsoft затронули работу аэропортов по всему миру. О задержках в отправке рейсов сообщили в аэропорту Хитроу в Лондоне, аэропорту в Дели, Кишиневе, Кракове, Варшаве, Гамбурге и Будапеште. Десятки рейсов были отменены почти во всех аэропортах Испании. О проблемах сообщала и компания Swedavia, управляющая десятью самыми загруженными аэропортами Швеции.

Пользователи соцсети X публикуют видео неработающих информационных экранов в аэропорту Лос-Анджелеса и фото посадочных талонов, заполненных от руки в одном из аэропортов Индии.

О технических неполадках заявили авиакомпании Singapore Airline, Air India, IndiGo, SpiceJet, Akasa Ai, Eurowings, Vueling, Air France, KLM. Немецкая Lufthansa предупредила пассажиров о возможных ограничениях в доступе к личному кабинету и бронированиям.

Была нарушена работа операторов критической инфраструктуры ФРГ, сообщили в МВД страны. Пострадали также морские порты в польском Гданьске и французском Кале, связывающем Великобританию и Францию.

Повлиял сбой и на работу медицинского сектора в Израиле. Университетская клиника в Шлезвиг-Гольштейн (Германия) и две больницы в Нидерландах были вынуждены отменить все хирургические операции. Крупнейшая в Норвегии сеть аптек Apotek1 сообщила о приостановке оформления онлайн-заказов и задержке выполнения уже оформленных.

Технический сбой сказался на работе систем оргкомитета Олимпиады в Париже, а также программного обеспечения МИД ОАЭ.

Сложности в работе констатируют банки Absa и Capitec в ЮАР, KCB в Кении.