Každý příběh monitorování má začátek a konec, a dělící čára je vždy stejná: výpadek, který trval příliš dlouho, protože nikdo hlídal. Před monitorováním jsou problémy se serverem objeveny náhodou. Kolega zmíní, že stránka vypadá pomalu. Zákazník pošle rozladěný e-mail. Vývojář se pokusí nasadit aktualizaci a zjistí, že server je nedostupný již několik hodin. Toto schéma se depresi konzistentně opakuje u organizací všech velikostí. Po zavedení monitorování stejný problém se serverem produkuje zásadně jiný zážitek. Server jde dolů. O tři sekundy později dorazí e-mail. Někdo začíná vyšetřovat do minuty. Oprava je nasazena dříve, než si to případně všimne většina uživatelů. Rozdíl mezi těmito dvěma scénáři není otázkou štěstí nebo počtu zaměstnanců. Je to přítomnost nebo nepřítomnost automatizovaného systému, který nepřetržitě hlídá a okamžitě si vezme slovo, když se něco pokazí.

Tradiční přístup ke sledování serveru byl postaven pro týmy operací s vyhrazeným rozpočtem na infrastrukturu. Nástroje jako Nagios, Zabbix a Prometheus jsou výkonné, ale vyžadují značné odborné znalosti k nastavení a údržbě. Běží na vlastních serverech, což vytváří filozofický problém: kdo monitoruje monitor? Pro jednotlivé vývojáře, malé agentury a bootstrapované startupy je režie provozu samoobslužného monitorovacího stacku často větší než režie příležitostného odhalieného výpadku, což znamená, že monitorování se trvale odsouvá na "později" a později nikdy nepřijde. Model cloudového monitorování eliminuje tuto režii zcela. Žádné servery k údržbě. Žádné konfigurační soubory ke správě. Žádná infrastruktura monitorování k opatrování. Přidejte koncový bod, nakonfigurujte předvolby upozornění a systém převezme kontrolu odtud.

Co dělá uptime.yeb.to je prostý v konceptu a pečlivý v provádění. Každý monitorovaný koncový bod je zkontrolován v pravidelných intervalech přes čtyři různé dimenze: základní dosažitelnost sítě pomocí ping, úplné dokončení požadavku HTTPS, platnost certifikátu SSL a časová osa vypršení, a měření doby odezvy. Každá dimenze zachycuje jinou kategorii selhání a dohromady poskytují komplexní obrázek o tom, zda služba není jen online, ale skutečně zdravá a funguje dobře. Server, který reaguje na ping, ale selže HTTPS kontroly, má problém s webovým serverem. Server, který prochází všemi kontrolami, ale vykazuje postupně rostoucí dobu odezvy, se chystá zhroutit. Server s platným certifikátem SSL, který končí za tři dny, se chystá spustit upozornění v prohlížeči, která budou odpuzovat návštěvníky. Každý z těchto scénářů vyžaduje jinou odpověď, a každý z nich je bez aktivního monitorování neviditelný.