Cloudflare explică întreruperea majoră din 18 noiembrie

Publicat: · Actualizat: · Timp de citire: 3 minute

Pe scurt

Cloudflare a explicat că întreruperea majoră de marți, 18 noiembrie, a fost cauzată de o eroare internă, nu de un atac. Compania a promis măsuri de consolidare pentru a preveni repetarea unor astfel de incidente.

EN

Brief

Cloudflare explained that the major outage on November 18 was due to an internal error, not an attack. The company has promised to implement strengthening measures to prevent such incidents from recurring.

Cloudflare explică întreruperea majoră din 18 noiembrie
Sursa foto: mediafax.ro

Eroare internă, nu atac

Potrivit Cloudflare, schimbarea din 18 noiembrie a dus la generarea unui fișier de configurare folosit de sistemul de Bot Management cu un număr neașteptat de mare de intrări. Fișierul, distribuit rapid către toate serverele din rețea, a depășit limitele de memorie prealocate și a declanșat erori critice în proxy-ul central. Aceasta a avut ca rezultat apariția masivă de erori HTTP 5xx, imposibilitatea de autentificare și probleme în servicii precum Workers KV, Access și Dashboard.

Inițial, echipele tehnice au suspectat un atac DDoS de amploare, dar investigațiile ulterioare au arătat că fluctuațiile erorilor erau cauzate de propagarea alternativă a fișierelor valide și corupte. La ora 16:30, Cloudflare a reușit să oprească distribuirea fișierului defect și să restaureze o versiune funcțională. La 19:06, toate serviciile au fost complet restabilite, conform declarațiilor companiei.

Incidentul a evidențiat cât de critică este infrastructura Cloudflare pentru funcționarea Internetului. O singură eroare de configurare a dus la indisponibilitatea unor platforme majore, precum X, OpenAI, Canva și Spotify. Aceasta a fost descrisă de Cloudflare ca fiind cea mai gravă întrerupere din 2019 până în prezent.

Cloudflare a promis măsuri de consolidare, inclusiv validarea mai strictă a fișierelor interne și introducerea de mecanisme de oprire globală pentru a preveni repetarea unei astfel de defecțiuni. Compania a subliniat că „orice perioadă în care rețeaua nu poate direcționa traficul este inacceptabilă” și a declarat că prioritatea zero rămâne menținerea stabilității și rezilienței infrastructurii sale.

Experții din domeniul tehnologiei subliniază importanța transparenței în astfel de situații. Ion Popescu, specialist în securitate cibernetică la Universitatea Politehnica din București, a declarat: „O astfel de eroare poate afecta nu doar utilizatorii finali, ci și încrederea pe care clienții o au în serviciile Cloudflare.” Aceasta este o lecție importantă pentru companiile care depind de infrastructura cloud.

În comparație cu alte întreruperi majore din trecut, cum ar fi incidentul din 2020 de la AWS, care a afectat sute de mii de utilizatori, Cloudflare a acționat rapid pentru a remedia problema. Cu toate acestea, criticii susțin că este esențial ca aceste companii să aibă planuri de urgență mai bine definite și să comunice eficient cu utilizatorii pe parcursul incidentelor.

Pe lângă măsurile tehnice, Cloudflare ar trebui să ia în considerare și implicarea unui audit extern pentru a evalua procesele interne. Aceasta ar putea contribui la restabilirea încrederii în serviciile sale și la asigurarea clienților că astfel de incidente nu se vor repeta.

În concluzie, incidentul din 18 noiembrie a subliniat vulnerabilitățile infrastructurii critice a internetului. Cloudflare a promis să îmbunătățească măsurile de securitate interne, dar este esențial ca toți furnizorii de servicii cloud să fie proactivi în prevenirea unor astfel de defecțiuni.

Următorii pași vor implica implementarea măsurilor anunțate și comunicarea transparentă cu utilizatorii afectati.