Provoz stabilně obnoven. Příčinou výpadku bylo několik faktorů: v ranních hodinách došlo k problému na jednom fyzickém serveru s diskovým clusterem který měl za příčinu výpadek jednoho webserveru. Provoz tím nebyl omezen, proxy server směřoval všechny příchozí spojení na jiný webserver který byl funkční. K obnově funkčnosti postiženého serveru byl zapotřebí jeho restart. Server v pořádku najel, včetně zmíněného webserveru. Nicméně po obnovení funkčnosti došlo k problémům s výpadky konektivity na privátní síti přes kterou všechny servery komunikují (databáze, proxy, atd). To mělo za následek omezení HTTP provozu. Prvotní předpoklad byl, že se jedná o problémy u poskytovatele konektivity. Po další analýze, přesunech serverů mezi jednotlivými nody v rámci clusteru a další diagnostika nakonec vedli ke zjištění, že dochází ke kolizím MAC adres jednotlivých virtuálních serverů, co mělo za následek zmíněné problémy s konektivitou privátní sítě. Po opravě byl HTTP provoz obnoven, nicméně pořád docházelo k problémům s HTTPS provozem (dlouhé načítání webu nebo úplná ztráta spojení). Diagnostikou bylo zjištěno, že z důvodu předchozích problémů s privátní sítí a skokovému nárůstu provozu došlo k vyčerpání limitů ve firewallu a ten další spojení blokoval. Po úpravě nastavení firewallu na všech webserverech se provoz povedlo plně obnovit.
Prvotní selhání diskového clusteru na jednom z fyzických serverů bude předmětem dalšího zkoumání. S největší pravděpodobností se jedná o SW problém. Síťové problémy (kolize MAC adres, firewall) byly vyřešeny i do budoucna a stejný problém se již nebude opakovat. Za způsobené komplikace se omlouváme.
Provoz http i https je plně obnoven. Další update bude následovat.
http provoz je obnoven, https v řešení
Problém je na interní síti mezi servery kde dochází k výpadkům spojení