Problém s interní síti Středa 15th červen 2022 23:17:00


Evidujeme závažný problém v privátní síti mezi všemi servery ES. Problém má za následek výpadky a zhoršenou dostupnost. Na řešení situace intenzivně pracujeme.

V rámci dalšího řešení vzniklé situaci, je potřeba provést aktualizaci všech fyzických serverů ES. S ohledem na provizorní řešení které je pořád v provozu to obnáší výpadek provozu ES. Aktualizaci provedeme dnes, 19.6.2022 ve 23:30. Odhadovaná délka výpadku je cca 10-15minut.

Restart interní sítě byl úspěšně proveden. Teď musíme počkat, jestli se problémy začnou objevovat znovu a nebo ne. Provoz ES je obnoven z provizorního řešení které by již mělo být stabilní.

Jak jsme avizovali, provedeme restart privátní sítě. To bude zahrnovat kompletní výpadek všech služeb ES. Odhadovaný čas výpadku je v rozmezí 10-15minut, k výpadku dojde po 23:15hod.

Řešení se trochu komplikuje. Povedlo se nám provoz ES stabilizovat provizorním řešením, které ještě ladíme. Ze strany HW je v datacentru všechno v pořádku. Aby bylo možné pokračovat v diagnostice na straně systémů v datacentru poskytovatele, je potřeba všechny servery odstavit a provést vyžádanou interní diagnostiku. Tomu se pokusíme vyhnout tím, že dnes v noci provedeme restart privátní sítě / privátní konektivity. Pokud by tento restart problém nevyřešil, budeme muset provést úplnou odstávku všech serverů ES a spustit diagnostiku která je vyžadována pro další postup.

Pořád čekáme na řešení vzniklé situace provozovatele datacentra. Dnes ráno na vyžádání jsme zaslali detailní záznamy problému a čekáme na další postup z jejích strany. Zároveň se snažíme izolovat aktuálně problematické části infrastruktury s cílem zlepšit aktuální dostupnost. ES funguje, ale dochází k mikro výpadkům a delším prodlevám při načtení.

Provoz se nám povedlo částečně obnovit, v "nouzovém režimu". Problém je v privátní síti kterou ES mezi servery využívá na straně datacentra. O dalším vývoji Vás budeme informovat, situaci řešíme s provozovatelem DC.