Monitorimi Nga Gjashtë Vendndodhje Gjeografike Njëkohësisht dhe Nëse Vetëm Një Dështon Unë Di Saktësisht Ku Është Problemi
Mëngjesi filloi me një biletë mbështetjeje nga një klient në Singapor që tha se faqja interneti ishte pusi. Tabela e kontrollit të monitorimit, e cila vepron nga një server i vetëm në Frankfurt, shfaqi gjithçka në gjendje të mirë. Të gjithë kontrollet kaluan. Kohërat e përgjigjes normale. Sajti ishte aktiv. Përveç se nuk ishte aktiv, të paktën jo për këdo që drejtohet përmes disa rrugëve rrjeti aziatike. Problemi doli të ishte një çështje e rrugëzimit rajonal në një ofrues në përpara që prek trafikun nga Juglindja Aziatike ndërsa lë aksesin evropian dhe nord-amerikan plotësisht të pashëmtuar. Sistemi i monitorimit, duke kontrolluar besnikërisht nga një pikë vantage e tij në Gjermani, nuk kishte asnjë mënyrë të zbulonte një problem që nuk mund ta shihte nga ajo pozitë.
Ky incident, dhe disa të ngjashëm që pasuan gjatë vitit të ardhshëm, demonstruan një kufizim themelor të monitorimit të vendndodhjes së vetme që duket i qartë me përpikëri por është shkarueshëm i lehtë për t'u lënë pas dore. Interneti nuk është një rrjet uniform ku të gjithë rrugët çojnë në të njëjtën destinacion përmes të njëjtës infrastrukture. Zyra elektronike e sistemeve autonome të ndërlidhura, marrëveshjeve të partnershipit, nyjeve të skajeve CDN dhe zgjidhësve DNS që krijojnë përvoja të ndryshme për përdoruesit në rajone të ndryshme gjeografike. Një faqe interneti mund të jetë në përputhje të plotë të arritshme nga Evropa ndërkohë që të nuk mund të arrihet njëkohësisht nga pjesëmarrja e Azisë, funksionon plotësisht nga Amerika e Veriut ndërkohë që përjeton humbje pakete nga Amerika Juglindore, dhe e shpejt nga një qytet ndërkohë që të ngadalë nga një qytet tjetër në të njëjtën vend.
Zgjidhja që zbaton uptime.yeb.to është monitorimi njëkohës nga gjashtë vendndodhje gjeografike të shpërndara në kontinente të shumta. Secilit kontroll ekzekutohet nga të gjashtë vendndodhje brenda të njëjtës dritare kohe, dhe rezultatet krahasohen për të përcaktuar nëse një çështje është globale apo rajonale. Kur të gjashtë vendndodhje raportohen një dështim, sajti është vërtet poshtë diku. Kur një apo dy vendndodhje raportohen një dështim ndërkohë që të tjerat shfaqin sukses, problemi është rajonal, dhe vendndodhjet në dështim menjëherë përcaktojnë se ku ndodhet çështja. Kjo trekëndëzim gjeografik transformon monitorimin nga një sinjal binar "lart apo poshtë" në një hartë të hollë të disponibilitetit që pasqyron se si interneti në të vërtetë funksionon.
Pse Monitorimi i Vendndodhjes së Vetme Krijon Pika Të Rrezikshme Të Pamet
Shumica e shërbimeve të monitorimit të kohës së punës, duke përfshirë shumë që janë të njohur mirë, parazgjedhin kontrollimin nga një vendndodhje e vetme apo lejojnë përdoruesit të zgjidhin një rajon të vetëm monitorimi. Ky qasje funksionon në mënyrë të përsosur për zbulimin e ndërprerjeve të plota kur serveri i origjinës është pusi dhe askush askund nuk mund të aksesohet faqja. Për këto dështime katastrofale, një probe e vetme është e mjaftueshme sepse problemi është universal. Por dështimi i kompletimit të serverit është vetëm një kategori e ndërprerjes, dhe gjithnjë e më shumë nuk është madje e më e zakonshme. Infrastruktura e rrjetit modern, me shtresat e saj të CDN-ve, balancuesve të ngarkesës, DNS failover, dhe ruajtjes të skajeve, ka bërë ndërprerje të plota të rralla ndërkohë që bëjnë dështime të pjesshëm, rajonale dhe të ndërmjetshëm më të shpeshtë.
Çështjet e lidhura me CDN janë burimi më i zakonshëm i mospërputhjeve rajonale. Rrjetet e shpërndarjes së përmbajtjes punojnë duke ruajtur përmbajtje në serverë të skajeve të shpërndara rreth botës, dhe secilit server skaji shërben vizitorëve që janë gjeografikisht më të afërt atij. Kur një nxë e skajeve të CDN-it në një rajon të veçantë përjeton probleme, qoftë dështim harduer, keqkonfigurimit apo mbingarkesës së kapacitetit, vizitorët e rrugëzuar në atë nxë të skajeve përjetojnë performance të degraduar apo padisponibilitet të plotë ndërkohë që vizitorët e rrugëzuar në nxë të skajeve të shëndetshme nuk shohin nuk çështje. Një monitor vendndodhje të vetme që rastësisht rrugëzohet në nxë të skajeve të shëndetshme do të raportohet gjithçka si normale ndërkohë që një rajon e tërë të vizitorëve përjeton.
Çështje të përhapjes DNS kriojnë një klasë tjetër të dështimeve rajonale. Kur rekordhet e DNS ndryshojnë, ndryshimet përhapen përmes infrastrukture globale të DNS në shpejtësi të ndryshme në varësi të vlerave të TTL, sjelljes së ruajtjes të zgjidhësit, dhe rrugën përkatëse të rezolucioni secilit rajon ndjek. Gjatë dritares së përhapur, disa rajone mund të zgjidhin domenën në adresën IP të vjetër ndërkohë që të tjerat zgjedhin në atë të re. Nëse IP-ja e vjetër nuk shërben më trafikun, rajonet ende të drejtuar në të përjetojnë një ndërprerje që rajonet tashmë të drejtuar në IP-në e re nuk do ta shikojnë kurrë. Një sistem monitorimi multi-rajon zbulon këtë menjëherë sepse disa probe do të dështojnë ndërkohë që të tjerat do të shohin sukses, duke krijuar një model që është karakteristik i çështjeve të përhapur të DNS-it dhe të ndryshëm nga problemet në nivelin e serverit.
Gjashtë Probe dhe Çfarë Secilit Modelim Dështimi Zbulon
Fuqia e gjashtë probe njëkohjes qëndron jo vetëm në zbulimin e dështimeve por në diagnostikim atyre. Modelimet e ndryshëm të dështimit korrespondojnë me kategori të ndryshëm të problemeve, dhe një operator i përvojës mund shpesh ta identifikohen rrënjën shkakare nga modeli i monitorimit vetëm para se t'a hape madje dritaren e terminalit. Kur të gjashtë probe dështojnë njëkohësisht me gabime kohore të lidhjes, serveri i origjinës apo rrjeti i tij ndoshta nuk mund të arrihen, duke sugjeruar një rrëzim serveri, ndërprerje të ofruesit të hosting apo çështje të nivelit të rrjetit në qendrën e të dhënave. Kur të gjashtë probe dështojnë me përgjigje të gabimit HTTP si 502 apo 503, serveri mund të arrihet por aplikimi është i thyer, duke sugjeruar një gabim brenda, dështim baze të dhënash apo rrëzim të nivelit të aplikimit.
Kur një apo dy probe dështojnë ndërkohë që të tjerat shohin sukses, modeli tregon një historinë rajonale. Nëse probe dështuese janë të dyja në Azi ndërkohë që probe evropiane dhe nord-amerikane shohin sukses, çështja është pothuajse sigurore në rrugën e rrjetit ndërmjet Azisë dhe serverit të origjinës, qoftë në një skaj të CDN-it, një ofrues transit apo një zgjidhës DNS rajonal. Nëse probe dështuese është në të njëjtën rajon si serveri i origjinës ndërkohë që probe të largëta shohin sukses, problemi mund të jetë në nivelin e rrjetit të ofruesit të hosting, me probe të largëta të shërbyera nga një ruajtje CDN që është përulur dështimin e origjinës. Secilit model nghesin fushën e diagnostikimit dhe përshpejton kohën në zgjidhje.
Variacionet e kohës së përgjigjes përmes probe të sigurojnë një sinjal më delikat por njëlloj të vlefshëm. Nëse të gjashtë probe shfaqin përgjigje të suksesshme por koha e përgjigjes të rajon ka dyfi krahasuar me linjën bazë të saj historike, rajoni përjeton degradim që ende nuk ka përparuar në një dështim të plotë. Kapja e degradimit para se të bëhet një ndërprerje është një nga aftësitë më të vlefshme të monitorimit multi-rajon, sepse jep operatorit një dritare kohe për të hetuar dhe ndërhyrë para se përdoruesit në atë rajon të fillojnë të dorëzojnë biletë mbështetjeje. Tabela e kontrollit të monitorimit shfaqin kohërat e përgjigjes për të gjashtë vendndodhje në një cronologjie të vetme, duke bërë modelimet e degradimit rajonal të dukshme në një blic.
Rrugëzimi Gjeografik dhe Problemet Që Ai Fsheh
Infrastruktura e rrjetit modern përdor rrugëzimin gjeografik në mënyrë të gjerë, duke drejtuar përdoruesit në serverin më të afërt ose të skajit CDN në bazë të vendndodhjes së tyre. Ky rrugëzim në përgjithësi është i përfitshëm sepse zvogëlon latencën dhe përmirëson performancën për shumica e përdoruesve. Por kjo do të thotë gjithashtu se rruga që një kërkesë merr nga pika A në pikën B varion dramatikisht në varësi të vendndodhjes ku pika A është. Një probe monitorimi në Nju Jork dhe një probe monitorimi në Tokio do ta marrin rrugë shumë të ndryshme të rrjetit për të arritur të njëjtën faqe interneti, duke kaluar përmes ofruesve të ndryshëm të ISP, shkëmbimeve të ndryshme të partneritit dhe skajeve të ndryshëm të CDN. Një pengesë me vend përgjatë një rruge mund të jetë e padukshme nga tjetra.
Rrugëzimi Anycast, i përdorur nga shumica e CDN-ve dhe ofruesve të DNS të mëdhenj, shton një shtresë tjetër të kompleksitetit. Me anycast, e njëjta adresë IP shpallet nga vendndodhje të shumta gjeografike, dhe infrastruktura e rrugëzimit të internetit drejton secilit kërkesa në vendndodhjen më të afërt të shpalljes. Kjo do të thotë se një zgjidhje DNS apo kërkesa CDN nga Evropa arrin në një server evropian ndërkohë që e njëjta kërkesë nga Azia arrin në një server aziatik, madje pse adresa IP në të dyja rastet është identike. Nëse nxja anycast aziatike ka një problem, probe aziatike e zbulojnë atë ndërkohë që probe evropiane nuk mund, sepse kërkesa e tyre nuk arrin kurrë madje në serverin fizik të njëjtë.
Ndryshimet e rrugëzimit BGP mund të shkaktojnë çështje të përkohshme apo të zgjatura të arritshëmshmërisë për rajone të veçanta. Kur një rrugë e protokolit të portës kufitare është e tërhequr apo ndryshuar, trafikun që më parë flonte përmes një rruge direkte mund të rrugëzohet përmes rrugësh më të gjata, potencialisht të mbingarkuara, duke rritur latencën dhe ndonjëherë duke shkaktuar humbje pakete. Këto ngjarje BGP janë të zakonshme, ndodhen mijëra herë në ditë në mbarë botën, dhe ndikimi i tyre është në mënyrë të ngushte rajonal. Një sistem monitorimi multi-rajon përjeton këto ngjarje drejtpërdrejtë përmes probe të shpërndarë, duke zbuluar ndikimin në secilit rajon në mënyrë të pavarur sesa mbështetet në një pikë vantage të vetme që mund apo nuk mund të jetë e prekur.
Nga Zbulimi në Veprim dhe Duke Ditur Çfarë të Korrigjohet
Zbulim pa informacione të veprimit është vetëm një alarm që bën zhurmë pa treguar drejt një zgjidhjeje. Vlera e monitorimit multi-rajon shkon përtej njoftimit se diçka është e gabuar. Kjo ju tregon se ku është e gabuar dhe, përmes modelit dështim, sugjeron lloj i gabuar që është. Ky kontekst diagnostik transformon procesin e përgjigjes me incident nga një kërkesë marrëzi përmes regjistrimeve dhe tabelave në një hetim të synuar që fillon me një hipotezë të fortë për shkakun rrënjësor.
Kur sinjalet e monitorimit shfaqin se një rajon i vetëm ka dështuar ndërkohë që të tjerët mbeten të shëndetshëm, operatori mund menjëherë të fokusojnë hetimin e tij në rrugën e rrjetit të atij rajoni. A ka nxja skaj CDN në atë rajon në raportin e çështjeve? A ka një incident aktiv BGP që prek ofruesit transit në atë zonë? A ka zgjidhësi DNS për atë rajon ruajtur një rekord të vjetër apo të pasaktë? Secilit këto pyetje mund të përgjigjet shpejt, dhe përgjigjet çojnë në veprime të veçanta të ndrequrjes: pastro ruajtjen CDN për atë rajon, kontakto ofruesin transit apo force refresh të DNS. Pa kontekstin gjeografik dhënë nga monitorimi multi-rajon, operatori do të hetojë në terr, duke kontrolluar çdo pikë të mundshme dështimi sesa ato më të mundshme për të qenë përgjegjëse.
Platforma e monitorimit të kohës së punës kombinon rezultatet e kontrollit multi-rajon me të dhëna historike që shtohen konteksti kohës në kontekstin hapësinor. Nëse e njëjta rajon ka përjetuar dështime në të njëjtën ora të ditës në rastet e mëparshme, kjo sugjeron një çështje të përsëritur si një dritare e mirëmbajtje të planifikuar në një ofrues transit apo një model të parashikueshëm të trafikut që shkakton probleme të kapacitetit gjatë orëve të pikut. Nëse dështimi është një ndodhje e parë pa asnjë precedent historik, është më i mundshëm një incident akut që kërkon vëmendje të menjëhershme. Kombinimi i kontekstit gjeografik dhe kohës jep operatorit figurën më të plotë të mundshme të asaj që ndodh, ku ndodh, dhe nëse ndodh më parë.
Pyetjet e Shpeshta
Cilat gjashtë vendndodhje përdoren për monitorim
Platforma e monitorimit përdor vendndodhje probe të shpërndarë përmes Amerikës së Veriut, Evropës dhe Azisë për të dhënë mbulim global. Vendndodhjet specifike zgjidhen për të përfaqësuar qendrat kryesore të rrugëzimit të internetit ku rrjedh shumica e trafikut botëror të rrjetit.
Çfarë ndodh kur vetëm një vendndodhje zbulon një dështim
Një dështim të vendndodhje të vetme aktivizojnë një paralajmërim që tregon një çështje rajonale sesa një ndërprerje globale. Paralajmërimet përfshijnë vendndodhjen specifike që dështu dhe detalet e përgjigjes, duke ndihmuar operatorin të përcaktojë nëse çështja është në një skaj CDN, një ofrues transit apo një zgjidhës DNS që shërben atë rajon.
A mund të zbulojnë monitorimi multi-rajon performancën e ngadaltë përpara një ndërprerje të plotë
Po. Monitorimi i kohës së përgjigjes përmes të gjashtë vendndodhje zbulon degradim në rajone të veçanta madje edhe kur sajti mbetet teknikisht i arritshëm. Një kohë përgjigje që ka dyfi nga linja e saj bazë në një rajon ndërkohë që mbetet stabile në të tjerët është një sinjal këshillimi të hershëm që lejon operatorin të hetojë para se përdoruesit përjetojnë një dështim të plotë.
Sa shpesh funksionojnë kontrollet nga secilit vendndodhje
Shpeshtësia e kontrollit është e konfiguruar sipas planit të monitorimit. Çdo interval kontrolli aktivizojnë probe njëkohës nga të gjashtë vendndodhje, duke siguruar se çdo kontroll sigurojnë një pamje të plotë gjeografike sesa një vëzhgim të vetëm pikash.
A funksionon monitorimi multi-rajon me sajte pas Cloudflare apo CDN të tjerë
Po, dhe sajte të brendshme të CDN janë në të vërtetë ku monitorimi multi-rajon sigurojnë vlerën më të madhe. Çështje skaj CDN janë në mënyrë të ngushte rajonale, dhe vetëm monitorimi multi-rajon mund të zbulojnë kur një skaj CDN i veçantë është degraduar ndërkohë që të tjerët mbeten të shëndetshëm.
A është kjo e dobishme për sajte me trafikun vetëm nga një vend
Madje edhe sajte me trafikun të përqendruar gjeografikisht përfitim nga monitorimi multi-rajon sepse çështje rrugë rrjeti mund të prekin çdo rrugë. Përveç kësaj, kërcyesit e motorit të kërkimit aksesin sajte nga rajone të shumta, kështu që një ndërpjerje rajonale që bllokon Googlebot nga kërcimi prekin SEO madje nëse vizitorët njerëzor në tregje parësore janë të pashëmtuar.