Samedi, une heure du matin, la sonnerie de mon téléphone portable retentit. Mon serveur de supervision m’alerte que le site principal de ma société est en train de perdre un à un tous ses serveurs ! Le genre de message qui
réveille instantanément. Je tente une connexion distante sur ce même serveur, sans résultat. Ayant appelé mes collaborateurs, j’apprends que nous avons subi les conséquences d’une panne d’électricité en Europe. Je me rends donc
sur place. L’analyse de la situation montre que notre groupe électrogène n’a secouru qu’une partie de l’installation. Une fois les batteries des onduleurs vidées, les machines se sont tout simplement arrêtées.Cet incident, survenu un week-end, n’aura eu que très peu de conséquences. Mais il m’a permis d’identifier des dysfonctionnements, notamment lors du redémarrage. Ainsi, je n’ai pas été étonné d’avoir à
restaurer quelques fichiers afin de remettre en service deux des quelques serveurs Windows qui subsistent (applications comptables obligent). En ce qui concerne les machines Linux, des oublis de certaines commandes dans les scripts de démarrage nous
ont porté préjudice.Afin de tirer bénéfice de cet événement, j’ai décidé d’améliorer la sûreté de l’alimentation électrique de la salle informatique. Chaque baie de serveurs sera équipée d’un onduleur raccordé à la seconde
alimentation des machines. En cas de fonctionnement sur batteries, l’onduleur alerte notre serveur de supervision via son interface SNMP. Ainsi, le SMS sera envoyé avant la perte totale d’alimentation. Reste à savoir si nous pouvons
intervenir en moins de 20 minutes. A quand la prochaine coupure électrique pour tester notre réactivité en temps réel ?
(*) MM. Yellow, Red, Green, Blue et Purple sont cadres dans des services informatiques. Chaque semaine, à tour de rôle, ils vous font partager le fruit de leur expérience.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.