Grosses pannes et erreurs sur le réseau [résolu]
Crashs simultanés de plusieurs serveurs et routeurs
01.11.2007
Suite à un problème probablement lié à une coupure de courant, une cascade des pannes a touché plusieurs de nos serveurs et routeurs ce qui entraîne des perturbations pour tous les appels. Des techniciens sont à l'oeuvre afin de régler ce problème au plus vite. Historique : [00h56] détection de la première panne [01h02] rétablissement temporaire [01h45] début de l’avalanche des problèmes dans le réseau [02h00] le réseau est complètement figé [13h00] Les appels sont rétablis aux environs de 13h. Mais il reste de graves problèmes liés aux réplications de bases de données à travers le réseau. Le réseau fonctionne actuellement dans un état dangereusement vulnérable. Nous aurons peut-être besoin de l'arrêter complètement pour tenter de faire de backups et des synchronisations propres entre tous les composants. [02h00] Tous les problèmes de réplication des données et de synchronisation sont résolus avec succès. Les données sont maintenant cohérentes et synchronisées à travers le réseau.
|