Quante volte in una situazione critica abbiamo pensato “ah, se l’avessi saputo prima…”
I maggiori player dei servizi on-line di oggi ci hanno abituato ad un paradigma per niente scontato fino a non troppi anni fa: funzionano sempre. Anzi, i rarissimi episodi di down di applicazioni come Whatsapp o Facebook, hanno scatenato discussioni tecniche in ogni parte del globo. Questo perché ci hanno abituato bene e le aspettative ormai sono altissime.
Però purtroppo le macchine sono macchine e possono rompersi. Al giorno d’oggi però, non possiamo permettercelo.
Dobbiamo conoscere il problema nel momento stesso in cui si verifica, se possibile anche prima. Come fare?
La business continuity
Oggi è fondamentale offrire soluzioni di business continuity, in modo che il lavoro di ogni azienda non si fermi a causa di problematiche esterne, non sempre risolvibili da noi, ma sicuramente gestibili. Elenchiamone alcune e facciamo le dovute valutazioni:
- Offline
Essere offline ormai è come essere senza energia elettrica. Avere soluzioni di backup di connettività non è complicato. La soluzione è ottimale se il failover, ovvero lo switch sulla connettività di backup è automatico. Diventa fondamentale avere evidenza dell’evento. Occorre saperlo; occorre ricevere una notifica.
- Blackout elettrico
Gruppi di continuità e gruppi elettrogeni possono salvaguardare le nostre apparecchiature, mitigando sovra/sotto tensioni, tenendo un determinato numero di apparecchiature attive anche in caso di blackout prolungato. Sono episodi di cui dobbiamo essere messi al corrente, occorre saperlo, occorre ricevere una notifica.
- Dispositivi non più raggiungibili
Firewall, switch, server fisici e virtuali con servizi prioritari; sono tutti dispositivi che se non funzionano possono rendere molto complicato o addirittura impossibile le attività aziendali. È possibile avere sistemi di clusterizzazione per ogni dispositivo, per cui se il problema è relativo ad un dispositivo del cluster, il servizio viene mantenuto attivo dal componente secondario.
Anche in questo caso, abbiamo trovato una soluzione per garantire continuità ai servizi, ma è un episodio di cui occorre esserne messi a conoscenza, occorre ricevere una notifica. - Sistemi con carichi anomali di risorse
Innumerevoli fattori possono rendere inutilizzabili i nostri sistemi. Un processo in errore può saturare cpu e ram, o cominciare a scrivere log in modo talmente pedante da esaurire lo spazio disco. Se impostiamo soglie di warning, possiamo mitigare questi problemi, e risolverli prima che facciano diventare instabili i nostri sistemi. Sono misurazioni che vanno effettuate da un sistema che possa avvisarci in tempo, che possa inviarci notifiche.
- Traffico e attività anomale
Sul vostro firewall arriva molto traffico da IP geo localizzati in paesi stranieri con cui non avete rapporti commerciali? Il vostro file server sta effettuando un numero importante di scritture su disco? Se foste avvisati da un sistema di notifiche adeguato, potreste saperlo e chiudere sul nascere attacchi hacker o altri potenziali attacchi. Saperlo il prima possibile, è fondamentale.
- Log anomali
Dai log dei nostri domain controller abbiamo evidenza di utenti che stanno tentando accesso a tutte le condivisioni del nostro file server. Sempre dai log, emerge che certi utenti stanno effettuando molte operazioni, su più sistemi in contemporanea, di cui la maggior parte genera errori o failure. L’analisi dei log è la base del “buon amministratore di sistema”. Un sistema automatico che avvisa e manda notifiche rende tutto più semplice.
Ho elencato un numero importante di attività che possono portare evidenti benefici se riusciamo a configurare dei sistemi automatici di analisi e di relativo invio notifiche. Così facendo possiamo evitare, impedire o eliminare sul nascere problematiche importanti.
Il nostro obiettivo come Integra è garantire ai nostri clienti l’operatività dei loro servizi. Per cui è fondamentale costruire sistemi che possano assicurare una business continuity, ma è ancora più importante avere sotto controllo ogni anomalia, ricevendo le opportune notifiche.
Per risolvere un problema occorre conoscerlo, in tempo.
“A saperlo prima… “