Глобальный сбой Meta: что мы знаем и какова вероятная причина?

Вчерашний глобальный сбой Meta, по-видимому, затронул всю сеть компании: пользователи не могли получить доступ к Facebook, Messenger, Instagram, Threads и гарнитурам Quest.

Сбой продолжался от одного до двух часов для большинства пользователей, и хотя сейчас все, кажется, вернулось в норму, естественно возникают вопросы о том, что пошло не так…

Компания была немногословна, просто признав факт сбоя и извинившись за неудобства.

Ранее сегодня техническая проблема вызвала трудности у людей с доступом к некоторым нашим сервисам. Мы как можно быстрее устранили проблему для всех пострадавших и приносим извинения за любые неудобства.

Почти наверняка не более широкая проблема

Было некоторое предположение, что проблема могла быть более масштабной, и Meta была не единственной пострадавшей компанией.

Эксперт по кибербезопасности Мэтью Грин сказал, что сбой, похоже, вышел за рамки Meta. «Ряд сервисов испытывает проблемы как минимум с частью своих систем, особенно с возможностью входа на веб-сайты», — сказал Грин, доцент кафедры информатики и член Института информационной безопасности Университета Джонса Хопкинса. «Это может указывать на общую причину, такую как сбой у крупного поставщика облачных услуг».

Однако, учитывая, что сбой Meta, казалось, был полным, и ни одна другая платформа не испытывала проблем в таком масштабе, это кажется маловероятным. Гораздо более ограниченные проблемы, о которых сообщалось с другими сервисами, могут быть связаны с поврежденными подводными кабелями в Красном море.

Повреждение подводных кабелей в Красном море нарушает работу телекоммуникационных сетей и вынуждает провайдеров перенаправлять до четверти трафика между Азией, Европой и Ближним Востоком, включая интернет-трафик.

Это перенаправление могло привести к перегрузке других частей Интернета.

Кибератака возможна, но маловероятна

Также неизбежно возникли спекуляции о том, что Meta могла подвергнуться кибератаке, особенно потому, что это произошло в «Супер вторник», когда наибольшее количество штатов США проводит свои первичные президентские выборы.

Однако, хотя эксперты по безопасности говорят, что это нельзя исключать, Агентство по кибербезопасности и безопасности инфраструктуры США считает это маловероятным.

На вчерашнем брифинге по безопасности выборов CISA заявило, что «осведомлено об инциденте и его глобальном масштабе», добавив, что вредоносная кибернетическая активность, вероятно, не была вовлечена.

«Мы осведомлены об инциденте и на данный момент не осведомлены о каких-либо конкретных связях с выборами или о какой-либо конкретной связи с вредоносной кибернетической деятельностью, связанной со сбоем», — заявило американское агентство.

Некоторые группы утверждали, что несут ответственность за атаку, но обычно неподтвержденные заявления делают организации, надеющиеся привлечь внимание к своей причине.

Скорее всего, повторение 2021 года

Наиболее вероятным объяснением представляется повторение того, что произошло в 2021 году: ошибка, допущенная кем-то в Meta.

В тот раз это была ошибка, которая, как ни парадоксально, произошла, когда инженеры проверяли доступность сетевой мощности.

Во время одной из этих рутинных работ по техническому обслуживанию была выдана команда с целью оценки доступности глобальной магистральной сети, что непреднамеренно отключило все соединения в нашей магистральной сети, фактически отключив глобально центры обработки данных Facebook. Наши системы разработаны для аудита таких команд, чтобы предотвратить подобные ошибки, но ошибка в этом инструменте аудита не позволила должным образом остановить команду.

Это изменение вызвало полное отключение соединений наших серверов между нашими центрами обработки данных и Интернетом.

Хотя точная причина на этот раз может отличаться (хочется надеяться, что подобная ошибка больше не повторится!), все признаки указывают на еще одну внутреннюю ошибку подобного рода.

Фото: Kelly Sikkema на Unsplash