Her izleme hikayesinin bir başlangıcı ve sonu vardır ve bölüm çizgisi her zaman aynıdır: kimse izlemeyen için çok uzun süren kesinti. İzlemeden önce, sunucu sorunları tesadüfen keşfedilir. Bir meslektaş sitenin yavaş göründüğünü söyler. Bir müşteri öfkeli bir e-posta gönderir. Bir geliştirici bir güncelleme dağıtmaya çalışır ve sunucunun saatlerdir erişilemez olduğunu keşfeder. Model, her boyuttaki kuruluşlarda utanç verici bir şekilde tutarlıdır. İzlemeden sonra, aynı sunucu sorunu temelde farklı bir deneyim üretir. Sunucu kapanır. Üç saniye sonra, bir e-posta gelir. Birisi bir dakika içinde araştırma yapmaya başlar. Düzeltme, çoğu kullanıcı hiçbir şey fark etmeden önce dağıtılır. Bu iki senaryo arasındaki fark şans veya personel seviyeleri değildir. Sürekli izleyen ve bir şeyler ters gittiği anda söz söyleyen otomatik bir sistemin varlığı veya yokluğudur.

Sunucu izlemenin geleneksel yaklaşımı, özel altyapı bütçelerine sahip operasyon ekipleri için oluşturulmuştur. Nagios, Zabbix ve Prometheus gibi araçlar güçlüdür ancak yapılandırma ve bakım için önemli uzmanlık gerektirir. Kendi sunucularında çalışırlar, bu da felsefi bir sorunu yaratır: kim monitörü izler? Bireysel geliştiriciler, küçük ajanslar ve kendine yetebilen startuplar için, kendi kendine barındırılan izleme yığınını çalıştırmanın ek yükü sık sık ayrı ayrı tespit edilen kesintinin ek yüküne aşıyor, bu da izlemenin kalıcı olarak "daha sonra" e ertelenmesi anlamına gelir ve daha sonra hiçbir zaman gelmez. Bulut tabanlı izleme modeli bu ek yükü tamamen ortadan kaldırır. Bakılacak sunucu yok. Yönetilecek yapılandırma dosyası yok. Çocuk bakacak izleme altyapısı yok. Bir bitiş noktası ekleyin, uyarı tercihlerini yapılandırın ve sistem oradan devralır.

uptime.yeb.to yapıtığı şey kavram olarak basit ve yürütümde titizdir. İzlenen her bitiş noktası dört farklı boyut arasında düzenli aralıklarla kontrol edilir: ping aracılığıyla temel ağ ulaşılabilirliği, tam HTTPS istek tamamlanması, SSL sertifikası geçerliliği ve son kullanma tarihi zaman çizelgesi, yanıt süresi ölçüm. Her boyut, başarısızlığın farklı bir kategorisini yakalar ve birlikte bir hizmetin çevrimiçi olup olmadığını değil, aslında sağlıklı olup olmadığını ve iyi performans gösterip göstermediğini kapsamlı bir şekilde resim sağlarlar. Ping'e yanıt veren ancak HTTPS kontrolleri başarısız olan bir sunucu, bir web sunucusu sorunu vardır. Tüm kontroller geçen ancak yanıt sürelerinin istikrarlı bir şekilde artan bir sunucu, çöküşe doğru ilerliyordur. Geçerli bir SSL sertifikasına sahip ancak üç gün içinde sona eren bir sunucu, ziyaretçileri uzaklaştıracak tarayıcı uyarılarını tetikleme üzere olup. Her bir senaryo farklı bir yanıt gerektirir ve etkin izleme olmadan her biri görünmezdir.

İzleyicinin Aslında Neyi Kontrol Ettiği ve Neden Her Katman Önemlidir

Ping izlemesi en temel katmandır ve aynı zamanda en sık yanlış anlaşılan katmandır. Başarılı bir ping yanıtı, sunucudaki işletim sisteminin çalışır durumda olduğu ve izleme araştırması ile sunucu arasındaki ağ yolunun açık olduğu anlamına gelir. Web sunucusunun çalışır durumda olduğu anlamına gelmez. Uygulamanın işlev gördüğü anlamına gelmez. Kullanıcıların aslında bir sayfa yükleyebileceği anlamına gelmez. Ping, temel, yaşamın minimum uygulanabilir işareti ve her şey onun üzerine inşa edilir. Ping kontrolü başarısız olduğunda, sorun şiddetlidir: sunucu tamamen çevrimdışıdır veya makinaye trafik ulaşmasını önleyen temel bir ağ sorunu vardır. Bunlar, sadece web trafiğini değil, aynı zamanda SSH erişimini, veritabanı bağlantılarını, e-posta iletimini ve bu makinede çalışan diğer tüm hizmetleri etkileyen kesintilerdir.

HTTPS izlemesi, ping'in ıskalaştığı kritik katmanı ekler. Bir HTTPS kontrolü, tam bir web isteği, bir kullanıcı bir web sitesini ziyaret ettiğinde tarayıcının yaptığı türde bir istektir. Denetim, web sunucusunun bağlantıları kabul ettiğini, SSL el sıkışmasının başarıyla tamamlandığını, sunucunun geçerli bir HTTP yanıtı döndürdüğünü ve tüm işlemin makul bir zaman çerçevesi içinde tamamlandığını doğrular. Bu, ping'in tespit edemediği geniş bir sorun kategorisini yakalar: çökmüş web sunucusu işlemleri, yanlış yapılandırılmış SSL sertifikaları, HTTP 500 durum kodları döndüren uygulama hataları ve sitenin teknik olarak "çevrimiçi" olmasına rağmen etkili bir şekilde kullanılmaz hale getiren performans bozulması. Sunucuya ulaşılabilir olması ile bir web sitesinin kullanılabilir olması arasındaki ayrım, HTTPS izlemesinin doldurduğu boşluğun tam olmasıdır.

SSL sertifikası izlemesi, hemen hemen her web sitesi operatörünü en az bir kez salyagılayan bir sorunu ele alır. Sertifikalar sona erer. Let's Encrypt'ten ücretsiz sertifikalar 90 gün sürer. Ücretli sertifikalar genellikle bir yıl sürer. Her iki durumda da, sona erme tarihi kesinlik ile gelir ve yine de sertifika yenilemeleri dikkat çekici bir sıklıkla kaçırılır. Sebep basittir: yerleşik bir anımsatma sistemi yoktur. Sertifika yetkililerı her zaman yenileme bildirimleri göndermez. Otomatik yenileme betikleri bazen sessizce başarısız olur. Süresi dolmuş bir sertifikanın sonuçları acil ve katıdır. Tarayıcılar tam sayfa güvenlik uyarıları gösterir. Arama motorları siteyi işaretler. Bu uyarıları gören kullanıcılar nadiren devam ederler ve sertifika yenilendikten sonra bile sık sık geri dönmezler. Sertifika sona erme tarihini izlemek ve son tarihten iyi önce uyarı göndermek, bu tüm kategoriyi önlenebilir olaylardan ortadan kaldırır.

Yanıt süresi izlemesi, henüz kesinti haline gelmemiş ancak o yöne giden sorunlar için erken uyarı sistemidir. Sağlıklı bir web sunucusu 100 ila 300 milisaniye içinde yanıt verir. Yanıt süreleri 500, sonra 800, sonra 1500 milisaniyeye tırmanmaya başladığında, bir şeyler yanlıştır. Veritabanı sorguları, tablo boyutları büyüdüğü için yavaş çalışabilir. Bellek, bir işlem sızıntısı tarafından tüketiliyor olabilir. Disk G/Ç, kayıt veya yedekleme işlemleri tarafından doyurulabilir. Bu sorunlar ping başarısızlıklarını veya HTTPS hatalarını tetiklemez, ancak sıçrama oranlarını, dönüştürme oranlarını ve arama motoru sıralamalarını doğrudan etkileyen şekillerde kullanıcı deneyimini bozarlar. Günler ve haftalar boyunca yanıt sürelerini izleyerek, trendler tam kesintiye dönüşmeden çok önce görünür hale gelir.

Uyarı Sistemi ve Neden Üç Saniye Her Şeyi Değiştirir

Algılama hızı, kesinti etkisini en aza indirmede en önemli tek değişkendir. Matematik basittir: toplam hasar = dakika başına etki x dakika sayısı. Algılama süresini beş saatten üç saniyeye düşürmek, dakika başına etkiyi değiştirmez, ancak dakika sayısını çarpıcı bir şekilde azaltır. Kesintiye uğrayan ve on dakika içinde düzeltilen bir sunucu, gün için kabaca 0,002% kesinti yaşar. Aynı sunucu beş saat sonra keşfedilir ve düzeltme aynı on dakika sürerse bile 0,35% kesinti yaşar. Bir ay boyunca, bu sayılar "dört dokuz" güvenilirlik ile müşteri hiç kimsenin durum sayfasında görmek istemediği utanç verici bir uptime yüzdesine bileşke içinde.

Uyarı iletişim mekanizması, algılama hızı kadar önemlidir. Kimse izlemeyeceği bir panoya gelen uyarı, hiç uyarı gelmemesine eşdeğerdir. E-posta, çoğu operatör için en güvenilir bildirim kanalı olmaya devam eder çünkü e-posta her zaman açık, her cihazdan her zaman erişilebilir ve başka bir uygulama yüklemeyi veya başka bir arayüzü kontrol etmeyi gerektirmez. uptime.yeb.to bir başarısızlık algıladığında, e-posta bildirimi tüm ilgili bağlam ile derhal gönderilir: hangi bitiş noktası başarısız oldu, kontrolü belirleyen başarısızlık türü, tam zaman damgası ve alınan yanıt (veya oluşan hata). Bu, alıcının İzleme panosuna giriş yapmadan önce e-postanın kendisinden sorunu tanılamaya başlayabileceği anlamına gelir.

Kurtarma bildirimleri eşit derecede önemlidir ve sık sık göz ardı edilir. Bir sunucunun ne zaman çevrimiçi geldiğini bilmek, ne zaman kapandığını bilmek kadar değerlidir. Kurtarma uyarıları, kesinti süresinin toplamını içerir ve bu, olay sonrası analiz ve raporlamaya doğrudan besler. Ayrıca, bir uyarı alındı ancak sorun kendiliğinden çözüldükten sonra hiçbir takip gönderilmediğinde oluşan gereksiz yükseltmeyi de önlerler. Kurtarma bildirimleri olmadan, her uyarı, daha üretken bir iş için harcanabilecek zaman ve dikkati tüketen manuel doğrulama gerektiren açık bir döngü oluşturur.

Günlük Özet, Haftalık Raporlar ve Uzun Görünüm

Gerçek zamanlı uyarılar acil sorunları ele alır. Özet diğer her şeyi ele alır. Bir günlük özet e-postası her sabah önceki 24 saatin tam bir özeti ile gelir: izlenen her bitiş noktası için uptime yüzdeleri, ortalama ve zirve yanıt süreleri, oluşan ve sürelerine ilişkin olaylar ve tüm HTTPS bitiş noktaları için sertifika sona erme durumu. Bu e-posta tarama için yaklaşık 30 saniye gerektirir ve herhangi bir pano girişi veya herhangi bir manuel denetim gerektirmeden "her şey sağlıklı mı?" sorusuna anında bir yanıt sağlar.

Haftalık özet daha da uzaklaşır ve günlük düzeyde görünmez olan trendleri ortaya çıkarır. Haftanın her günü 100% uptime koruyan ancak yanıt sürelerinin her gün 50 milisaniye arttığını gösteren bir sunucu, günlük özeti belirgin olmayabilir ancak haftalık trend grafiği kaçınılmaz hale getiren bir sorunu geliştiren bir sunucudur. Benzer şekilde, haftanın farklı günlerinde iki kısa kesinti yaşayan bir sunucu, birlikte görüldüğünde bir model ortaya çıkarabilir: her iki kesinti de otomatik yedekleme penceresinde saat 3'te meydana geldi, bu da yedekleme işleminin çok fazla kaynak tükettiğini ve optimize edilmesi veya yeniden zamanlanması gerektiğini gösteriyor. Bu modeller, yalnızca veriler zaman içinde toplandığında ortaya çıkar ve haftalık özet, tam olarak bu öngörüleri ortaya çıkarmak için tasarlanmıştır.

Olay geçmişi, özet oluşturduğu ayrıntılı adli kaydı sağlar. Algılanan her kesinti, başlangıç saati, bitiş saati, süresi, etkilenen kontroller ve başarısızlığı belirten yanıt verileri ile günlüğe kaydedilir. Bu geçmiş birden çok amaca hizmet eder. Olay sonrası incelemeler ve kök neden analizi için gereken verileri sağlar. Barındırma sağlayıcıları ile SLA uyumluluğu hakkında muhasebeleştirme oluşturur. Durum sayfaları ve müşteri raporları için gereken uptime istatistikleri oluşturur. Ve belirli bir barındırma sağlayıcısının güvenilirlik vaatlerini karşılayıp karşılamadığını veya geçişin vadesi gelip gelmediğini bilgilendirmek için kullanılabilecek long-term bir kayıt oluşturur.

Çok Bölgeli Araştırmacılar ve Tek Konum İzlemesinin Kör Noktaları

Bir sunucu Frankfurt'tan mükemmel bir şekilde erişilebilir ve aynı anda Tokyo'dan tamamen erişilemez olabilir. Ağ yönlendirmesi küresel olarak düzgün değildir. İnternet servis sağlayıcıları, diğerlerini tamamen etkilenmez bırakırken belirli coğrafi koridorları etkileyen bölgesel bağlantı sorunları oluşturabilen yönlendirme kararları alır. DNS yayılması gecikmesi, sunucu geçişinin bir kıtada tamamlanıp doğrulanırken, başka bir kıtada kullanıcıların hala eski, muhtemelen çevrimdışı sunucuya yönlendirilmesi anlamına gelebilir. CDN yanlış konfigürasyonları, diğer bölgeler doğru, güncel sayfalar alırken belirli bölgelere eski veya hata içeriği sunabilir.

Tek konumlu izleme, bu senaryoların tümüne karşı körüdür. İzleme araştırması sunucuyla aynı veri merkezi bölgesindeyse, küresel kullanıcı tabanının yarısı siteye erişemez iken 100% uptime bildirecektir. Coğrafi olarak dağılmış altı konumdan çok bölgeli izleme, tasarım gereği bu tutarsızlıkları yakalar. Bir denetim bir bölgeden başarısız ancak diğerlerinden geçtiğinde, uyarı, sorunu sunucu taraflı başarısızlıktan ziyade bölgesel bir yönlendirme sorununa hemen daraltmak için coğrafi bağlamı içerir. Bu ayrım, teşhis ve yanıt için muazzam bir şekilde önemlidir: sunucu taraflı bir sorun hizmetleri yeniden başlatmayı veya barındırma sağlayıcısına iletişim kurmayı gerektirirken, bölgesel bir yönlendirme sorunu DNS, CDN yapılandırması veya ISP düzeyindeki sorunları araştırmayı gerektiriyor.

Altı izleme konumu, dünya çapında büyük nüfus ve trafik merkezlerini kaplamak için seçilmiştir. Bu, Kuzey Amerika, Avrupa ve Asya'daki müşterilere hizmet veren bir web sitesinin, tek bir araştırmanın oluşturduğu izleme illüzyonu yerine gerçek kapsam sağlayan her bölgede veya yakınında araştırmacıları yaptığı anlamına gelir. Küresel kullanılabilirliğe bağlı olan işletmeler için, bu çok bölgeli yaklaşım isteğe bağlı bir geliştirme değildir. Bu, coğrafi olarak dağılmış kullanıcı tabanının deneyimini doğru bir şekilde temsil edebilecek minimum uygulanabilir izleme yapılandırmasıdır. Başlangıçtan itibaren çok bölgeli yetenek ile uptime.yeb.to oluşturmak, izlemenin koruyuşu kadar kapsamlı olmasını sağlar.

Sıkça Sorulan Sorular

Uptime izleyici, kesinti algıladıktan sonra ne kadar hızlı bir uyarı gönderiyor

Uyarı e-postası, onaylanan bir başarısızlıktan sonra saniye cinsinden gönderilir. Tam zaman, bitiş noktası için yapılandırılan kontrol aralığına bağlıdır, ancak başarısız bir denetim algılandığında ve onaylandığında, bildirim hemen gönderilir. Bu, toplam algılama-to-bildirim zamanı saniye cinsinden ölçüldüğü anlamına gelir ve operatörlerin çoğu kullanıcı hiçbir şey fark etmeden önce araştırmaya başlamasını sağlar.

Araç hangi tür izleme yapıyor

Dört tür izlenen her bitiş noktası için kontrol edilir. Ping izlemesi temel ağ ulaşılabilirliğini doğrular. HTTPS izlemesi, sitenin sayfaları doğru bir şekilde sunduğundan emin olmak için tam bir web isteği gerçekleştirir. SSL sertifikası izlemesi geçerliliği ve sona erme tarihlerini kontrol eder. Yanıt süresi izlemesi, taleplerin tamamlanmasının ne kadar sürdüğünü takip eder ve tam kesintiye dönüşmeden önce bozulmayı işaretler. Birlikte, bu dört denetim ortak sunucu ve web sitesi başarısızlıklarının tam yelpazesini kapsar.

Gerçekten işe yarayan bedava bir uptime monitor var mı

Birçok bedava izleme aracı vardır, ancak tipik olarak kontrol sıklığı, izlenen bitiş noktası sayısı veya uyarı iletişim yöntemlerine katı sınırlamalar getirirler. uptime.yeb.to, önemli özellikleri premium seviyelerin arkasına kilitlemek yerine, kaç bitiş noktasının kapsama ihtiyacı olduğundan bağımsız olarak ölçeklendirilmiş planlarla kuruluş bütçesi gerektirmeden anlamlı izleme sağlamak için tasarlanmıştır.

Günlük özet e-postasında ne var

Günlük özet, önceki 24 saati tüm izlenen bitiş noktaları arasında özetler. Uptime yüzdeleri, ortalama ve zirve yanıt süreleri, sürelerine sahip olaylar ve SSL sertifikası son kullanma uyarılarını içerir. E-posta, bir dakikadan az bir süre içinde taranmak için tasarlanmış ve herhangi bir altyapı sorununun o gün dikkat gerektirip gerektirmediğine ilişkin anında bir yanıt sağlar.

İzleyici, dünyanın birden çok konumundan web sitelerini kontrol edebilir mi

Evet. Çok bölgeli izleme, küresel olarak büyük trafik merkezlerini kapsayan coğrafi olarak dağılmış altı konumdan kontrol gönderir. Bu, tek konumlu izlemenin tamamen kaçıracağı bölgesel bağlantı sorunlarını, DNS yayılması gecikmelerini ve CDN yanlış konfigürasyonlarını yakalar. Bir başarısızlık bir bölgeden algılandığında ancak diğerlerinden algılanmadığında, uyarı, sorunun sunucu taraflı mı yoksa ağ taraflı mı olduğunu teşhis etmeye yardımcı olmak için coğrafi bağlam içerir.

İzleyici SSL sertifikası sona erme tarihlerini takip ediyor mu

SSL sertifikası izlemesi, her denetim döngüsü ile çalışan yerleşik bir özelliktir. Sertifikanın şu anda geçerli olduğunu doğrular ve son kullanma süresine kadar olan gün sayısını hesaplar. Uyarılar, tarayıcı güvenlik uyarıları veya arama motoru cezalarını riske atmadan yenileme için yeterli zaman veren son tarihten iyi önce gönderilir. Bu, otomatik yenilemenin sessizce başarısız olduğu ve sertifikanın ziyaretçiler uyarı sayfaları görmeye başlayana kadar kimse fark etmeden sona erdiği şaşırtıcı derecede yaygın senaryoyu önler.