Congestiile din rețelele FC SAN vă dau bătăi de cap? Cu tehnologia Cisco DIRL scăpați de ele gratis și rapid
5 min read
Dynamic Ingress Rate Limiting (DIRL) este o tehnologie inovatoare, care permite depistarea rapidă a echipamentelor care cauzează congestii, remedierea acestora putând fi realizată fără a fi necesară eliminarea dispozitivelor respective din rețea. Pentru mai multe informații despre cum funcționează tehnologia DIRL vă invit să citiți articolul de mai jos și să urmăriți acest clip.
Odată cu accelerarea procesului de transformare digitală, centrele de date se confruntă cu o creștere masivă a volumelor de date, a numărului de aplicații și de servere.
Efectele sunt vizibile mai ales la nivelul rețelelor FC SAN (Fibre Channel Storage Area Networks), care asigură conectivitatea între servere și echipamentele de stocare și care trebuie să funcționeze la capacitate maximă 24 de ore pe zi, 365 de zile pe an. Motivul – congestiile apărute la nivelul rețelelor FC SAN generează scăderi cvasi-instantanee ale performanței aplicațiilor și calității serviciilor. De aceea, prioritatea oricărui administrator IT este de a depista cât mai rapid echipamentele de rețea afectate de fenomenul de „Slow Drain“ – echipamentele care nu pot „ține pasul“ cu frecvența frame-urilor transmise/recepționate – și de a rezolva problema.
Echipamentele „Slow Drain“ cauzează – mai ales în cazul rețelelor FC care nu sunt dotate cu mecanisme de tip „Frame buffer “ – probleme la nivelul porturilor switch-urilor de rețea (generând efectul de „Buffer starvation“) și o supraîncărcare a link-urilor Inter-Switch (ISLs), care transportă traficul între diverse echipamente din rețea. Perturbațiile la nivel ISLs afectează la rândul lor și alte echipamente din rețea, rezultatul final fiind că fluxul de trafic este grav afectat din cauză că aplicațiile se confruntă cu probleme majore de latență sau nu mai răspund deloc.
De-a lungul timpului, au apărut mai multe soluții pentru contracararea acestor fenomene care afectează rețelele FC SAN. Nici una dintre ele nu este însă perfectă, fiecare soluție oferind rezolvări parțiale, valabile doar pentru un număr limitat de situații, dar ineficiente în alte cazuri.
Cisco a reușit să dezvolte o tehnologie proprie – Dynamic Ingress Rate Limiting (DIRL) –, care vine cu o altă abordare și permite depistarea rapidă a echipamentelor „Slow Drain“ ce generează probleme, remedierea acestora putând fi realizată fără a fi necesară eliminarea dispozitivelor respective din rețea. DIRL este disponibilă gratuit ca funcționalitate integrată în noua versiune NX-OS 8.5(1) pentru switch-urile MDS 9000 Fibre Channel.
Cu ajutorul DIRL, transmisia datelor este monitorizată, măsurată și ajustată incremental, astfel încât rata de intrare să se coreleze cu capacitatea echipamentului care cauzează congestia, reducerea volumului de date realizându-se prin scăderea numărului de comenzi SCSI/NVMe Read (venite de la dispozitivele „host“, gazdă) sau frame-uri XFR_RDYs (trimise de dispozitivele „targets“, destinație).
Pentru aceasta, DIRL combină ingenios:
- capacitatea de limitare a ratei de intrare – disponibilă de mai mulți ani pe switch-urile MDS 9000
- versiunea îmbunătățită a funcționalității de detecție Port Monitor, care utilizează contoarele Tx-datarate, Tx-datarate-burst și TxWait pentru a detecta atingerea anumitor valori limită
- algoritmul inteligent de Fabric Performance Monitor (FPM).
Astfel, folosind tehnologia DIRL, switch-urile MDS 9000 pot limita rata de utilizare a unei interfețe de la aproximativ 0,01% la 100% și o pot ajusta incremental în funcție de parametrii congestiei detectate.
DIRL realizează modificări dinamice ale ratei de intrare a frame-urilor și funcționează în două regimuri de viteză – rapid (de ordinul secundelor), pentru reducerea ratei de intrare cu 50%, și lent (de ordinul minutelor), pentru creșterea ei cu 25%.
Cronometrele, pragurile și valorile incrementale au fost configurate și optimizate de specialiștii Cisco prin realizarea de teste și probe în rețele FC SAN reale, însă pot fi personalizate pentru a răspunde cerințelor specifice fiecărei companii.
Pentru a fi mai clar, iată un exemplu despre cum poate funcționa DIRL într-un scenariu de lucru uzual
Să zicem că un port al unui switch MDS 9000 conectat la un echipament host detectează o cantitate mare de date primită în urma unei comenzi SCSI Read și să mai considerăm că funcționalitatea Port Monitor utilizează un contor TxWait configurat cu două valori-limită:
- Pragul de creștere, de 30% – este pragul superior și definește nivelul de la care MDS 9000 ia măsuri pentru a reduce rata de intrare.
- Pragul de scădere, de 10% – este pragul inferior și definește nivelul de la care MDS 9000 recuperează treptat portul prin creșterea ratei de intrare.
În zona dintre cele două praguri, DIRL nu face nicio modificare și lasă valoarea ratei de intrare așa cum este.
Depășirea pragului de creștere TxWait indică faptul că echipamentul host este lent și că frame-urile așteaptă în bufferele de ieșire MDS 9000 mai mult decât de obicei, ceea ce înseamnă că dispozitivul nu este capabil să gestioneze întregul flux de date direcționat către el.
Iată cum arată cronologia operațiunii de remediere declanșate de MDS 9000 prin intermediul DIRL:
- T0: traficul decurge normal.
- T1: pragul TxWait este depășit, DIRL declanșează acțiunea de reducere a ratei de intrare cu 50%.
- T1 + 1 secundă: rata de intrare este redusă cu 50%, rata de trimitere este redusă și ea cu o anumită valoare, contorul TxWait indică încă o valoare peste pragul stabilit.
- T1 + 2 secunde: rata de intrare este redusă cu încă 50%, rata de trimitere este redusă și ea cu o anumită valoare, contorul TxWait a ajuns acum la 0, congestia a fost eliminată.
- T5: portul nu mai prezintă indicii de congestie, rata de intrare este crescută cu 10%, rata de ieșire crește și ea cu o anumită valoare, TxWait rămâne la 0.
- T5 + 1 minut: portul nu prezintă niciun indiciu de congestie, rata de intrare este crescută cu încă 10%, rata de ieșire crește și ea cu o anumită valoare, TxWait rămâne încă la 0.
- T5 + 2 minute: portul nu prezintă niciun indiciu de congestie, rata de intrare este crescută cu încă 10%, rata de ieșire crește și ea cu o anumită valoare. TxWait crește cu 8%, dar este încă sub valoarea pragului de scădere.
- T5 + 3 minute: portul nu prezintă niciun indiciu de congestie, rata de intrare este crescută cu încă 10%, cea de ieșire crește și ea cu o anumită valoare. TxWait face un salt de 20%, valoarea se situează acum între cele două praguri – la acest nivel acțiunea de remediere este stopată și se menține rata curentă de intrare.
- T5 + 4 minute: rata de intrare nu se schimbă, cea de ieșire înregistrează o modificare minoră, dar valoarea depistată de TxWait sare peste pragul de creștere indicând că a reapărut congestia, iar acțiunea de remediere este declanșată din nou.
DIRL este o soluție inovatoare de prevenire și remediere a fenomenelor de tip „Slow Drain“ și supraîncărcare în rețelele FC, care minimizează efectele perturbatoare la nivelul echipamentelor afectate și impactul asupra celorlalte dispozitive din rețeaua FC SAN. Folosind tehnologia Cisco nu mai este necesară nicio schimbare la nivel de echipamente host sau target, indiferent de producătorul acestora sau de versiunea lor.
DIRL este o tehnologie agentless, cu o abordare fabric-centric, totul fiind guvernat și controlat de inteligență integrată în switch-urile MDS 9000. Companiile pot alege să activeze funcționalitatea pe un singur switch sau la nivelul întregii infrastructuri și poate fi utilizată atât cu protocolul SCSI, cât și cu NVMe.
Conform analizei de performanță realizate de evaluatorul independent Miercom, avantajele competitive ale tehnologiei DIRL constau în:
- Capacitatea de a depista și remedia rapid congestiile din rețelele FC SAN cauzate de efectul „Slow Drain“ și suprautilizarea link-urilor Inter-Switch.
- Izolarea cauzelor congestiei fără a altera performanța altor echipamente din rețea.
- Impact minim asupra echipamentelor afectate de congestie prin adaptarea rapidă a traficului.
- Tehnologie independentă de vendor și topologia folosită (Single-switch fabric, Edge-core fabrics sau Edge-core-edge fabrics).
- Nu necesită upgrade-ul echipamentelor terminale.
Dacă doriți să aflați mai multe detalii despre tehnologia DIRL disponibilă gratuit prin noua versiune NX-OS 8.5(1) pentru switch-urile MDS 9000 Fibre Channel vă invităm să ne contactați la solutiicisco@cisco.com