Detekce změn webu
Detekce změn webu
Sledujte klíčové stránky na změny HTML, změny stavu a dostupnost robots/sitemap
- Upozornění obsahují status, latenci a request ID pro ladění
- Hashované diffy snižují šum ze změn layoutu
Jak to funguje
Co získáte
Historie změn: snapshoty a diffy uložené pro každé URL
Emailová upozornění: stručný souhrn s request ID
Transparentnost chyb: selhání se zaznamenávají, neskrývají
Fetch s rate limity: chrání cíle a vyhýbá se špičkám
Co monitorujeme
Titulek, meta description, text H1 (přes HTML hash)
Robots.txt a dostupnost sitemap při přidání jako URL
Status kódy, redirecty a latence
HTML těla hashovaná pro snížení šumu
Případy použití
SEO monitoring: detekce změn title/meta/H1 na klíčových stránkách
Content governance: zachycení nechtěných úprav nebo mazání
Compliance: sledování změn privacy/terms v čase
Release QA: ověření obsahu a redirectů po nasazení
Dostupnost: detekce 4xx/5xx a regresí statusu
Deterministicke HTML/DOM diffy vs. screenshot monitoring
Proč na tom záleží
Když se obsah změní, dopad bývá často okamžitý: SEO, přesnost cen, compliance a důvěra. Jasná historie diffů plus request ID usnadňují ověření změn a řešení incidentů
FAQ
Crawlujete celé weby?
Ne. URL přidáváte výslovně.
Co se počítá jako změna?
Změna hashe normalizovaného HTML pro dané URL
Jak moc je to hlučné?
Hashování snižuje šum; jemné ignorovací pravidla jsou plánovaná
Co se děje při chybách?
Chyby se ukládají jako snapshoty s request ID; některé chyby nespouští alert
Mohu monitorovat robots nebo sitemap?
Ano, přidejte tyto URL přímo
Je povolen HTTP?
HTTPS je výchozí; HTTP lze povolit přes env v řízených prostředích
Co se stane při překročení limitů?
Stávající monitory pokračují; nové monitory jsou blokovány do upgradu
Jak se ukládají data?
Snapshoty se ukládají pro historii; ukládání payloadů je konfigurovatelné
Zdroje
Monitorujte JS-renderované stránky s deterministickým čekáním a diffy renderovaného DOMu, když jednoduchý fetch nestačí.
Číst dokumentaci