Ghid de supravietuire in IT – necesitatea redundantei

Probabil niciunul dintre noi nu ne urcam in masina fara sa avem o roata de rezerva in portbagaj. Multi dintre noi avem un set de chei extra de la apartament sau casa dat in grija unei persoane de incredere pentru situatia in care le pierdem pe ale noastre. Facem rezerve de hartie igienica, doar asa, pentru orice eventualitate 🙂 Avioanele de linie sunt construite cu doua sau patru motoare, tocmai pentru a continua sa zboare in cazul in care unul (sau mai multe) se defecteaza.

Avem destule exemple in viata de zi cu zi in care ne asiguram ca dispunem de resurse suplimentare in cazul in care avem nevoie de ele. De ce in IT ar fi altfel? Daca vrem ca activitatea organizatiei sa se desfasoare fara downtime si perturbari, atunci avem nevoie de cel putin doua elemente din aproape orice.

Legea lui Murphy spune ca daca ceva poate sa mearga prost, atunci cu siguranta va merge prost. Redundanta este o masura de contracarare a acestei legi, menita sa ne ofere linistea si increderea ca putem trece peste orice problema.

Redundanta este atunci cand avem mai mult decat ne trebuie la un moment de timp.
In mediul de business extrem de competitiv de astazi, timpul inseamna bani si orice minut in care organizatia nu isi poate desfasura activitatea se traduce in pierderi financiare.

De aceea, infrastructura IT trebuie sa fie formata din elemente care sa isi poata prelua functiile unele de la celelalte fara a afecta activitatea companiei. Cu alte, redundanta trebuie sa elimine acele puncte de defectare din ecosistemul IT. Un punct de defectare este o componenta care va opri intregul sistem atunci cand se va strica. Si reprezinta calcaiul lui Ahile pentru departamentul IT.

Este de prisos sa spunem ca orice element se va strica. Hard-disk-urile se pot corupe, conexiunile devin inutilizabile, bazele de date nu mai pot fi accesate. Este o chestiune de timp si nu stim exact cand se va intampla acest lucru. Un nivel de redundanta suficient de ridicat va face ca defectarea unei componente, a unui sistem sau a unei locatii sa nu duca la oprirea business-ului sau la afectarea operatiunilor organizatiei.

Redundanta se poate implementa pe mai multe nivele, in functie de specificul fiecarei organizatii si de business case.

Redundanta se poate implementa la nivel de serviciu. De exemplu:

  • contractarea a doi furnizori diferiti pentru asigurarea accesului la Internet
  • replicarea bazelor de date pe servere aflate off premises
  • backup periodic si replicare pentru server-ul de email
  • arhitectura redundanta pentru Domain Controller-e de Windows
  • doua router-e care pot avea rolul de default gateway in LAN-ul clientilor
  • folosirea a cel putin doua server-e de autentificare (LDAP/RADIUS) pentru a permite user-ilor accesul in retea si la resurse

Redundanta se poate implementa la nivel de echipament. De exemplu:

  • doua router-e care asigura conectivitatea la Internet
  • switch-uri care pot folosi tehnologii de stack-are sau de clustering
  • doua servere fizice pe care sa se instaleze hypervizorul folosit la virtualizare
  • doua firewall-uri in pereche care sa termine tunelele VPN de tip IPsec sau SSL

Redundanta se poate implementa si la nivel de conexiune. De exemplu:

  • trasee redundante de fibra trase intre cladiri care urmeaza cai fizice total separate
  • folosirea tehnologiilor de agregare a link-urilor (LACP) atat pentru redundanta, cat si pentru un boost de performanta
  • folosirea unui numar de access point-uri suficient de mare pentru a avea o redundanta din punct de vedere radio si un nivel decent de semnal pentru conexiunile wireless LAN
  • link-uri de WAN de backup pe tehnologii radio – WiMAX/4G

Redundanta se poate implementa la nivel de componenta hardware. De exemplu:

  • surse de alimentare de tip hot swappable si FRU (field replaceable unit)
  • ventilatoare de racire redundante
  • folosirea mediilor de stocare intr-o configuratie redundanta (RAID)
  • folosirea de supervizoare redundante (pentru echipamentele de retea)

Activarea componentei redundante se intampla atunci cand componenta primara este compromisa, iar aceasta activare trebuie facuta fara interventia omului.

Automatizarea imbunatateste gradul de incredere si performantele infrastructurii si sistemelor IT.
In mod traditional, departamentul IT monitorizeaza echipamentele de infrastructura, link-urile si server-ele pentru a identifica anumite probleme si sa inlocuiasca elementele defecte sau sa faca un failover manual catre elementele redundante. Folosind tehnologii de automatizare si AI/ML, comutarea pe elementele redundante se poate face mai precis, mai eficient si proactiv, inainte ca business-ul sa fie afectat.

Redundanta poate fi implementata si la nivel de site/locatie. Cand un dezastru loveste, un numar impredictibil de elemente si sisteme pot fi afectate sau inutilizabile. Organizatia trebuie sa aiba un plan de continuitate bine pus la punct care sa permita continuarea business-ului cat se poate de repede. Cele mai bune arhitecturi IT sunt astazi self-healing. Un plan de continuitate bine gandit va profita de cele mai noi inovatii tehnologice pentru a restaura serviciile necesare utilizatorilor cu un downtime care tinde spre zero, chiar daca intr-o alta locatie lucrurile par sa se duca de rapa.

Orice business are nevoie de o infrastructura IT, si orice infrastructura IT are nevoie de redundanta. Gradul de redundanta si nivelul la care aceasta se implementeaza depinde atat de probabilitatea ca o defectare sa se intample, cat si de costul financiar asociat cu eliminare acelei defectari prin tehnologie, oameni si procese. De aceea, inainte de a asigura redundanta unui sistem, o analiza risc versus cost trebuie facuta cat mai pragmatic si mai obiectiv cu putinta pentru a justifica investitia si pentru a obtine maxim de beneficii. Cu toate acestea, lipsa sau incapacitatea de a implementa redundanta va fi imediat vizibila angajatilor, clientilor si partenerilor, iar pierderea increderii in companie, ca si pierderile financiare semnificative vor eclipsa orice cost necesar implementarii elementelor redundante necesare organizatiei.

Mihai Dumitrascu, Sr Systems Engineer