Co je rozšíření Scraping Camel?#

Scraping Camel je rozšíření, které automaticky a průběžně prochází (crawluje) webové stránky, stahuje z nich informace a tato data ukládá do strojově čitelného datového feedu (CSV) nebo je poskytuje přes API jiným rozšířením (např. Mergado Marketing Buddy). Funguje jako serverový scraper, který běží nonstop, což znamená, že data jsou neustále aktualizována bez nutnosti spouštět software na lokálním počítači.

Rozšíření je ideální pro získávání dat, která nejsou dostupná v běžných produktových feedech, jako jsou informace z kategorií, blogů, statických stránek nebo z webů, které žádné feedy nemají.

Pro koho je vhodné:

  • PPC specialisté – Pro tvorbu automatizovaných kampaní (např. DSA nebo Performance Max) na základě dat z celého webu.
  • SEO specialisté – Pro průběžný monitoring stránek, SEO audity a analýzy klíčových slov v reálném čase.
  • Majitelé e-shopů – Kteří potřebují vytvořit produktové feedy tam, kde je jejich systém nenabízí, nebo chtějí feedy doplnit o chybějící data (např. parametry, skladovost, obrázky).
  • Weby bez košíku – Jako jsou katalogy služeb, magazíny, firemní prezentace či velkoobchodní katalogy, kterým Scraping Camel umožní vstoupit do světa feed marketingu.
  • Content specialisté a management – Pro kontrolu výsledků práce a získání přehledu o obsahu a struktuře webových stránek.

Cena a fakturace#

Cena rozšíření je:

  • 986 Kč za měsíc při měsíční fakturaci,
  • 788,80 Kč za měsíc při roční fakturaci.

Cena je stanovena pro jeden e-shop (v Mergadu) a je fixní, bez ohledu na počet vytvořených projektů (webových stránek) nebo analýz klíčových slov.

Vzhledem k technické návaznosti je rozšíření fakturováno v souladu se zvolenou frekvencí fakturace v Mergado Editoru. Pro jednotlivé služby nelze zvolit různé frekvence fakturace.

Rozšíření Scraping Camel30denní zkušební dobu zdarma.

Je možné Scraping Camel zapnout i bez Mergada?#

Scraping Camel je možné používat i bez placeného projektu v Mergadu. Je však nutné vytvořit si v Mergadu účet pro autorizaci uživatelů a fakturaci a e-shop pro správu přístupů uživatelů. Obojí lze v Mergado vytvořit zdarma i bez placeného projektu.

Základní pojmy spojené s rozšířením Scraping Camel#

  • Scraper (Crawler) – Automatizovaný robot, který běží nonstop na serveru, prochází HTML kód stránek a extrahuje z něj data do strojově čitelné podoby.
  • Klíčové slovo – Výraz nebo slovní spojení automaticky generované Scraping Camelem přímo z textu webové stránky. Klíčová slova charakterizují obsah stránky a její hlavní téma.
  • Element – Konkrétní datové pole nesoucí informace, které Scraping Camel z webu stahuje. Elementy se dělí na:
    • Systémové – Předdefinované běžné SEO prvky (Title, H1, Meta Description atd.).
    • Vlastní – Uživatelem definovaná pole (např. cena, skladovost).
    • AI elementy – Pole generovaná umělou inteligencí bez nutnosti manuálního nastavení (klíčová slova, detekce jazyka, počet slov).
  • Hromadné elementy – Speciální typ elementů, u kterých se Scraping Camel nezastaví u prvního nálezu, ale uloží všechny výskyty na dané stránce.
  • Validátor – Podmínka nebo pravidlo, které automaticky a nonstop kontroluje stav webu a upozorňuje na technické či SEO chyby.
  • Inverzní export – Speciální typ výstupního CSV souboru pro klíčová slova, kde je primárním klíčem URL adresa, ke které jsou přiřazena všechna nalezená klíčová slova (vhodné pro PPC kampaně).
  • Skóre – Číselná hodnota vyjadřující míru významu (relevanci) klíčového slova pro konkrétní webovou stránku.
  • Fráze – Slovní spojení dvou a více slov, která uživatel definuje, aby byla při analýze zpracovávána jako jeden celek (jedno klíčové slovo).
  • Stop slova – Seznam slov, která mají být při generování klíčových slov ignorována (např. spojky, předložky nebo vlastní brand), aby byl výsledek čistší.
  • Štítky – Nástroj pro organizaci a klastrování klíčových slov do tematických skupin, například podle produktových kategorií.

Co je potřeba pro spuštění rozšíření Scraping Camel#

  • Účet v Mergado Editoru a v něm vytvořený e-shop.
  • Prokázání vztahu k doméně – Scraping Camel není určen pro scrapování cizích webů či konkurence. Proto je nutné ověřit vlastnictví domény, aby nedocházelo k neoprávněnému scrapování cizích webů.
  • Vložení a ověření sitemap.xml – Soubor sitemap je pro fungování rozšíření nezbytný, protože z něj Scraping Camel čerpá URL adresy ke stažení. Pokud rozšíření sitemapu automaticky nenalezne, je nutné její adresu vložit ručně.

Hlavní funkce#

1. Získávání libovolných dat z HTML webové stránky#

Scraping Camel dokáže z webu získat jakékoliv informace, které standardní feedy neobsahují. Web průběžně prochází a stahuje informace přímo ze zdrojového kódu stránek, které následně ukládá do strojově čitelného CSV feedu. Sesbíraná data ukládá do elementů:

  • Systémové elementy – Předdefinované prvky, které lze aktivovat jedním kliknutím. Patří sem desítky SEO parametrů jako TITLE, H1, META_DESCRIPTION, HTTP_STATUS, informace o microformátech (Open Graph, Twitter cards) nebo ID měřicích kódů (GTM, GA).
  • Vlastní elementy – Umožňují získat specifická data, která systémové elementy nepokrývají (např. cena, skladovost, parametry, autor článku či drobečková navigace). Definujete si je sami buď pomocí regulárních výrazů, nebo zadáním textu „před a za“ požadovanou hodnotou.
  • Scraping Camel AI – Elementy generované umělou inteligencí, které automaticky analyzují obsah bez nutnosti manuálního nastavení. Na rozdíl od běžných elementů tedy neurčujete jejich obsah vy, ale rozšíření jej získá automaticky díky umělé inteligenci. Scraping Camel tak sám odhalí jazyk (SC_DETECTED_LANGUAGE), počet slov na stránce (SC_NUMBER_OF_WORDS), vygeneruje hlavní titulek stránky (SC_MAIN_TITLE) a také klíčová slova pro danou stránku (SC_WORDS_COUNT, SC_WORDS_TUPLES_COUNT, SC_WORDS_AGG_MIN_FREQ_3). Zjistěte více informací o AI elementech.

⚠️ Scraping Camel nevykresluje JavaScript, funguje pouze na bázi HTML. Pokud je obsah skryt za skripty, rozšíření jej nedokáže vyjmout.

2. Hromadné elementy#

Na rozdíl od běžných elementů, které uloží pouze první výskyt v kódu, hromadné elementy uloží všechny výskyty na dané stránce. Díky tomu můžete získat:

  • Zpětné odkazy – Získáte seznam všech odkazů na stránce včetně jejich textu a HTTP kódu cílové URL. Snadno tak odhalíte například nefunkční odkazy.
  • Obrázky – Získáte adresy všech obrázků na stránce, jejich alternativní texty (alt), velikost souboru a typ obsahu. Tato funkce je klíčová pro odhalování nefunkčních odkazů (chyba 404) nebo příliš velkých obrázků, které zpomalují web.

3. Průběžná SEO validace a monitoring#

Scraping Camel funguje jako SEO audit, který běží nonstop na serveru. Obsahuje 35 systémových validátorů, které neustále kontrolují technický stav webu (např. chybějící H1, příliš dlouhé titulky, URL zakázané v robots.txt) a upozorňují na chyby. Můžete si také vytvářet vlastní validátory pro specifické kontroly, jako je například přítomnost měřicích kódů (GTM, GA) nebo ověření unikátnosti obsahu.

4. Automatizovaná analýza klíčových slov#

Scraping Camel umožňuje vytvářet komplexní analýzy klíčových slov z obsahu webu, které se samy aktualizují při každé změně na stránkách.

5. Pokročilé řízení scrapování#

Ve Scraping Camelu máte plnou kontrolu nad tím, jak a co se má z vašeho webu stahovat.

  • Filtrování URL – Můžete vyloučit určité části webu (např. blog) a scrapovat tak pouze vybrané sekce (např. kategorie), což šetří výkon serveru a zpřehledňuje výstupní feed.
  • Limitování požadavků – Určíte frekvenci a rychlost stahování, aby nedošlo k přetížení webu nebo zablokování scraperu ochranou Anti-DDoS.
  • Plánování aktualizací – Zvolíte, jak často má Scraping Camel kontrolovat změny na již stažených stránkách (jednou, denně, každé tři dny, týdně, měsíčně).

6. Univerzální výstupy a API#

Všechna získaná data jsou dostupná v univerzálním CSV souboru, který lze nahrát do Mergado Editoru jako samostatný feed nebo jej připojit k existujícímu projektu pomocí pravidla Import datového souboru. Data jsou rovněž přístupná přes API, což umožňuje jejich využití v AI nástrojích, jako je například Mergado Marketing Buddy.

Příklady využití v praxi#

  • Automatizace PPC kampaní (DSA a PMax) – Scraping Camel vytváří ideální podklady pro dynamické reklamy ve vyhledávání (DSA) a kampaně Performance Max. Poskytuje seznamy URL s jejich obsahem (tzv. page feedy) a „inverzní exporty“ s nejrelevantnějšími klíčovými slovy pro každou stránku.
  • Tvorba feedů pro weby bez košíku – Umožňuje zapojit do feed marketingu i katalogy, magazíny nebo realitní portály, které běžně produktové feedy nemají. Scraping Camel vytvoří datový soubor přímo z jejich HTML kódu.
  • Doplnění chybějících dat do stávajících feedů – Pokud váš e-shopový systém neexportuje do feedu důležité parametry (např. barvu, materiál, podrobnou skladovost nebo produktová čísla), Scraping Camel je vytáhne přímo z webu a následně je můžete v Mergado Editoru do feedu doplnit.
  • Příprava category feedů – Pomáhá PPC specialistům vytvářet specifické kampaně cílené na kategorie webu, pro které e-shopy feedy standardně negenerují.
  • Nepřetržitý on-page SEO audit – Místo jednorázových kontrol Scraping Camel automaticky a nepřetržitě hlídá například stav titulků, nadpisů H1 či meta popisků. Upozorní na jejich absenci, duplicity nebo nevhodnou délku.
  • Data-driven SEO a byznysové reporty – Umožňuje specialistům propojovat technické SEO parametry (např. skóre klíčových slov) s byznysovými informacemi (cena, marže, prodeje) pro strategické rozhodování.
  • Kontrola kvality obsahu – Pomocí AI odhaluje stránky s příliš malým počtem slov, automaticky detekuje jazyk stránky (např. nepřeložené produkty od zahraničního dodavatele) a generuje klíčová slova vystihující téma stránky.
  • Audit odkazů a obrázků – Prostřednictvím hromadných elementů identifikuje nefunkční odkazy a obrázky (chyba 404), chybějící alternativní texty (alt) nebo příliš velké soubory obrázků, které zpomalují web.
  • Monitoring technických elementů a měřicích kódů – Ověřuje přítomnost ID pro Google Analytics nebo Google Tag Manager na všech podstránkách, aby nedocházelo k výpadkům v měření dat.
  • Sledování změn a nových stránek – Díky elementu DISCOVERED umožňuje vyfiltrovat stránky, které na webu přibyly za poslední týden či měsíc, což je užitečné pro přehled o rozvoji velkých projektů.

Proč je nutné ověřit vlastnictví domény#

Ověření domény je nezbytným bezpečnostním krokem, který musíte provést předtím, než Scraping Camel začne stahovat data z vašeho webu. Hlavním důvodem je, že toto rozšíření je určeno výhradně pro zpracování vlastních webových stránek, případně stránek vašich klientů či partnerů.

Proč je toto opatření zavedeno?#

  • Zamezení scrapování konkurence – Cílem rozšíření není umožnit vytěžování cizích databází nebo sledování konkurenčních webů.
  • Právní a etické hledisko – Vytěžování cizích dat bez souhlasu majitele nemusí být legální a majitel webu by s takovým dataminingem nemusel souhlasit. Pokud však se scrapováním souhlasí (např. váš velkoobchodní dodavatel), může doménu ověřit a tím vám přístup umožnit.
  • Ochrana soukromí a dat – Scraping Camel zpracovává pouze data z domén, ke kterým uživatel prokázal vztah, což zajišťuje, že s nastavením rozšíření pracuje vždy oprávněná osoba z vašeho týmu nebo agentury.
  • Správa přístupů – Díky vazbě na e-shop v Mergadu je možné snadno spravovat uživatelská oprávnění a v případě ukončení spolupráce předat nastavení i s nascrapovanými daty klientovi.

Jak doménu ověřit?#

V průvodci založením nové stránky si můžete vybrat jednu ze čtyř metod, která vám nejvíce vyhovuje:

  1. Google Search Console (GSC) – Nejjednodušší a nejrychlejší metoda, zejména pro marketingové specialisty a agentury. Pokud již máte k doméně v GSC přístup, Scraping Camel se přes API spojí se službou Google a ověří, zda máte oprávnění s doménou pracovat.
  2. DNS TXT záznam – Do nastavení DNS u vašeho správce domény vložíte specifický textový řetězec, který vám Scraping Camel vygeneruje. Tato metoda je trvalá a nezávislá na změnách v kódu webu, je však nutné dát pozor na správné nastavení subdomén (např. www vs. bez www). Více podrobností najdete v článku Jak ověřit vlastnictví domény ve Scraping Camel pomocí DNS.
  3. Meta značka – Do hlavičky zdrojového kódu webu (mezi značky a ) vložíte krátký kód. Tento způsob je ideální pro uživatele platforem Shoptet a WordPress.
  4. HTML soubor – Na server vašeho webu (do kořenového adresáře) nahrajete vygenerovaný HTML soubor. Scraping Camel si následně existenci tohoto souboru na vaší URL adrese ověří.

Práce v Scraping Camel#

Aktivaci rozšíření provede v Mergado Storu: Chci aktivovatvyberte e-shop, pro který chcete rozšíření zapnout → Zapnout.

V rozhraní rozšíření Scraping Camel uvidíte v menu dvě hlavní sekce:

  • Webové stránky
  • Klíčová slova

Webové stránky#

Tato část je primárním místem pro správu vašich projektů (webových stránek). Uvidíte zde seznam všech vytvořených webových stránek, přičemž jedna položka v seznamu odpovídá datům z jedné konkrétní domény. Počet domén, které můžete v jedné instanci (jednom spuštění) rozšíření zpracovávat, není omezen. V případě agentur však doporučujeme používat rozšíření odděleně – vždy pro jednoho klienta jednu instanci Scraping Camela.

V horní části této sekce se najdete tlačítko Nová stránka, kterým spustíte průvodce pro přidání nového webu. Veškerá nastavení, která provedete v průvodci, můžete následně editovat v jednotlivých záložkách v rámci konkrétního vytvořeného projektu.

Pro efektivní správu, zejména pokud spravujete desítky domén, můžete využít filtrování, například podle data vytvoření (vhodné pro monitoring změn za poslední týden) nebo podle stavu zpracování stránky. Filtry můžete využívat také na jednotlivých záložkách v rámci konkrétního projektu.

Kliknutím na konkrétní projekt (webovou stránku) se pak zobrazí přehledné rozhraní s několika záložkami – Přehled, Export souborů, Stránky, Elementy, Hromadné elementy, Validace, Nastavení.

1. Přehled#

Tato stránka slouží jako úvodní obrazovka projektu s nejdůležitějšími údaji. Uvidíte zde adresy výstupních feedů (exporty do CSV) a možnost jejich stažení.

Můžete zde také sledovat stav stahování. Jelikož Scraping Camel prochází web ohleduplně, aby jej nepřetížil nebo nebyl zablokován Anti-DDoS ochranou, stahování tisíců stránek trvá určitou dobu v závislosti na vašem nastavení limitů.

2. Export souborů#

Zde spravujete výstupní data, která rozšíření z webu získalo. Můžete vytvořit libovolné množství exportů (kliknutím na tlačítko Vytvořte nový exportní soubor) s různými názvy pro různé účely (např. feed pro DSA kampaně nebo SEO analýzu). V nastavení exportu si sami zvolíte, které elementy má výsledné CSV obsahovat, a určíte jejich přesné pořadí.

3. Stránky#

Seznam všech konkrétních URL adres, které Scraping Camel na vašem webu objevil. Po kliknutí na konkrétní adresu uvidíte přehled všech elementů s jejich konkrétními hodnotami, které se na dané stránce podařilo stáhnout.

4. Elementy#

Na této stránce najdete seznam elementů, které jste definovali v průvodci při tvorbě nové webové stránky. Jedná se o elementy, které má Scraping Camel na webu hledat. Kliknutím na každý konkrétní element zobrazíte hodnoty daného elementu pro jednotlivé stránky.

Kliknutím na Editovat elementy je můžete upravovat. Vlevo se vám pak zobrazí seznam elementů a vpravo uvidíte náhled HTML kódu stránky. Zda se elementy budou stahovat nebo ne určíte jejich zakliknutím v seznamu vlevo.

Elementy jsou zde rozděleny do kategorií:

  • Nalezené elementy – Systémové elementy, které se Scraping Camelu v HTML kódu podařilo najít.
  • Nenalezené elementy – Systémové elementy, které se Scraping Camelu v HTML kódu nepodařilo najít.
  • AI elementy – Elementy generované umělou inteligencí. Více informací v článku Co je Scraping Camel AI?
  • Vlastní elementy – V této části vytváříte vlastní elementy, jejichž hodnoty definujete buďto regulárními výrazy nebo jako „text před/za“.

5. Hromadné elementy#

Speciální elementy určené pro stahování dat, kterých se na jedné stránce vyskytuje více. Na rozdíl od běžných elementů se Scraping Camel u prvního nálezu nezastaví, ale uloží všechny výskyty na dané stránce. Jedná se o elementy:

  • IMAGES (Obrázky) – Obsahuje informace o URL obrázku, jeho alternativním textu, velikosti souboru a typu (např. image, jpg).
    💡 V přehledu na stránce Hromadné elementy se velikost obrázků zobrazuje v kilobajtech (KB), v nastavení validačního pravidla se však používají bajty (B).
  • LINKS (Zpětné odkazy) – Obsahuje informace o cílové URL, textu uvnitř odkazu a HTTP stavovém kódu cílové adresy.

Extrakce těchto dat je výkonově náročná, proto je nutné jejich stahování spouštět ručně tlačítkem Spustit extrahování.

Nad hromadnými elementy lze spouštět systémové i vlastní validátory. Snadno tak získáte seznamy nefunkčních obrázků (chyba 404), obrázků bez popisu nebo příliš velkých souborů, které zpomalují načítání webu.

6. Validace#

Stránka slouží jako nepřetržitý a komplexní SEO audit vašeho webu, který běží přímo na serveru. Na rozdíl od klasických desktopových nástrojů, které musíte spouštět ručně, Scraping Camel kontroluje stav webu automaticky v souladu s vaším plánem aktualizace dat. Vzhledem k tomu, že funguje online, k aktuálním výsledkům validací může mít přístup více členů týmu najednou.

Aktivujete zde až 35 systémových validátorů pokrývajících klíčové SEO oblasti (např. chybějící H1, příliš dlouhé titulky, chybějící meta description, nefunkční stránky apod.). Tyto validátory je možné zapínat/vypínat a upravovat podle svých potřeb (tlačítko Upravit výchozí validátory).

Kromě toho můžete také vytvářet vlastní validátory pro specifické potřeby (tlačítko Nový vlastní validátor). Díky nim snadno pohlídáte například přítomnost měřicích kódů (GTM, GA), ověříte unikátnost obsahu nebo zkontrolujete specifické parametry, jako je autor článku nebo kategorie.

Výsledky validací uvidíte v přehledné tabulce, kde jsou řazeny podle závažnosti a označeny barevnými ikonami. Po rozkliknutí příslušného validátoru se vypíše seznam všech URL, kterých se chyba/varování/upozornění týká.

  • 🔴 Červená ikona (Vážná chyba): Kritické nedostatky, které vyžadují okamžitou pozornost (např. nefunkční URL 404 nebo chybějící TITLE).
  • 🟠 Oranžová ikona (Varování): Chyby, které by měly být opraveny, ale web je funkční (např. příliš dlouhý Meta Description).
  • 🔘 Šedá ikona (Upozornění/Informace): Méně závažné stavy nebo doporučení k vylepšení.
  • 🟢 Zelené ikony (V pořádku): Zobrazují se u validátorů, kde žádná z kontrolovaných položek nesplňuje chybovou podmínku.

Aby byla validace dat úspěšná, musí být na záložce Elementy aktivovány (zaškrtnuty) ty elementy, které má validátor kontrolovat (např. pokud chcete validovat H1, musí být element H1 aktivní pro stahování). Rychlost aktualizace validačních výsledků se odvíjí od nastavené frekvence stahování stránek na záložce Nastavení.

7. Nastavení#

Na jednotlivých záložkách zde můžete upravovat technické parametry scrapování.

a. Nastavení stránek

Změna názvu projektu nebo domény.

b. Limitování požadavků

Můžete změnit frekvenci a rychlost s jakou bude Scraping Camel přistupovat k vašemu webu. Tyto parametry jsou klíčové pro to, aby byl web zpracován v rozumném čase, ale zároveň nedošlo k jeho přetížení nebo k zablokování scraperu ochranou Anti-DDoS.

  • Frekvence stahování stránek – Jak často má Scraping Camel kontrolovat změny na stránkách, které již jednou úspěšně stáhl a zná je. Zatímco nové stránky (které se v sitemapě objevily poprvé) se rozšíření snaží stáhnout co nejdříve (zpravidla každý den), u známých stránek si můžete vybrat z intervalů – pouze jednou (a již nikdy neaktualizovat), denně, každé tři dny, týdně nebo měsíčně.
  • Počet stažení stránek v daném intervalu – Definuje velikost dávky, tedy kolik stránek se má zpracovávat naráz v rámci jednoho časového úseku. Pokud do tohoto pole zadáte například hodnotu 5, znamená to, že rozšíření v každém určeném časovém úseku vyšle požadavek na stažení 5 URL adres.
  • Interval stažení stránek – Určuje časovou prodlevu mezi jednotlivými dávkami stažení. Pokud tedy nastavíte interval například na 500 ms, rozšíření se každé půl sekundy pokusí stáhnout stanovený počet stránek (který jsme určili v kolonce Počet stažení stránek v daném intervalu).

c. Nastavení AI

Správa parametrů pro generování klíčových slov a seznamů stop-slov. Můžete zde definovat například minimální délku klíčových slov, práh skóre (minimální procentuální význam, který musí slovo mít, aby se dostalo do výběru klíčových slov), pravidla pro zpracování číslic, stanovit tzv. stop slova (výrazy, které má AI pro tvorbu klíčových slov zcela ignorovat) nebo definovat fráze (víceslovná spojení, která má algoritmus zpracovávat dohromady jako jedno klíčové slovo). Více informací v článku Co je Scraping Camel AI?.

d. Pravidla zpracování stránek

Pomocí pravidel určíte, které stránky mají být stahovány (vše ostatní bude ignorováno) nebo naopak vyloučeny ze stahování (vše kromě nich se stáhne). Můžete například stahovat pouze kategorie a naopak vyloučit stránky blogu. Výrazně to ušetří výkon vašeho serveru, zkrátí dobu aktualizace dat a pročistí výstupní CSV feed od nepotřebných dat.

Podmínky pro výběr URL můžete definovat dvěma způsoby:

  • Řetězcem z URL – Zadáte část adresy (např. /blog/ nebo /produkt/).
  • Regulárním výrazem – Pro pokročilejší a přesnější filtrování (např. pro URL končící určitým číslem).

Stránky, které neodpovídají vašim pravidlům, se v seznamu na záložce Stránky sice objeví (aby byl přehled o obsahu sitemapy kompletní), ale budou označeny červeným symbolem. Tyto stránky se nebudou scrapovat ani exportovat do výstupních souborů.

Klíčová slova#

Tato část slouží k automatickému generování a správě datových feedů s klíčovými slovy nalezenými přímo na vašich webových stránkách. Na rozdíl od sekce Webové stránky, kde je primárním klíčem URL adresa, v této agendě je výchozím prvkem konkrétní klíčové slovo, ke kterému jsou přiřazeny relevantní stránky a metriky.

Na této stránce uvidíte seznam všech vytvořených analýz klíčových slov. Novou analýzu vytvoříte tlačítkem Nová analýza klíčových slov, kde zvolíte doménu (jednu nebo i více), ze které se mají data čerpat.

Po rozkliknutí konkrétní analýzy se zobrazí přehledné rozhraní s několika záložkami – Přehled, Export souborů, Štítky, Varianty, Diagnostika, Validace a Nastavení.

1. Přehled#

Najdete zde seznam všech nalezených klíčových slov. Pro každé klíčové slovo v tabulce uvidíte:

  • jeho znění (element KEYWORD),
  • URL vstupní stránky, která má pro dané slovo nejvyšší naměřenou relevanci, tj. nejvyšší skóre (element URL),
  • číselnou hodnotu vyjadřující nejvyšší skóre relevance pro vstupní stránku k danému slovu (element TOP_SCORE),
  • počet všech stránek na webu, na kterých se toto slovo dostalo mezi top klíčová slova, tzn. překročilo nastavenou hranici významu (element PAGES_COUNT),
  • údaje o hledanosti a CPC (ceně za proklik), pokud jsou pro dané slovo dostupné,
  • status, tzn. zda je klíčové slovo aktivní nebo ne,
  • zda jsou k němu přiřazeny štítky,
  • datum a čas prvního nálezu.

Se seznamu se lze prokliknout přímo do SERP Google, abyste si ověřili reálné výsledky vyhledávání pro daný výraz. Jednotlivá slova můžete v seznamu aktivovat nebo deaktivovat, což se následně projeví v exportu. Po kliknutí na klíčové slovo se zobrazí seznam všech stránek relevantních pro dané klíčové slovo.

2. Export souborů#

V této části můžete spravovat a exportovat CSV soubory pro analýzu klíčových slov. Pro export vyberete elementy, které mají být v souboru obsaženy, a zvolíte jejich pořadí. Na výběr máte dva typy exportů:

  • Klasický export (tlačítko Vytvořit klasický exportní soubor) – Tabulka, kde je každému klíčovému slovu věnován jeden řádek se zvolenými doplňujícími informacemi.
  • Inverzní export (tlačítko Vytvořit inverzní exportní soubor) – Speciální formát, který data „otočí“. Primárním klíčem je URL adresa, ke které jsou v dalším sloupci přiřazena všechna relevantní klíčová slova. Tento formát je ideální pro tvorbu DSA kampaní nebo Performance Max kampaní v Google Ads.

3. Štítky#

Slouží k organizaci klíčových slov do tematických skupin. U e-shopů se nejčastěji využívají pro rozdělení slov podle produktových kategorií (např. štítek „ledničky“, „pračky“ apod.). Štítky lze ke slovům přiřazovat hromadně nebo jednotlivě v detailu klíčového slova.

Po rozkliknutí štítku se zobrazí seznam k němu přiřazených klíčových slov.

4. Varianty#

Tato záložka slouží k ručnímu sjednocování různých tvarů stejného slova. Scraping Camel se sice automaticky snaží poznat, že například slova jako „pračka“, „pračky“ nebo „pračkou“ k sobě patří, ale občas mu nějaký složitější tvar nebo skloňování unikne.

V této sekci můžete systému ručně napovědět a spojit tyto výrazy pod jedno hlavní slovo. Například určit, že slovo „agentur“ má být započítáno jako varianta slova „agentura“. Výsledkem je mnohem čistší a přehlednější analýza, ve které se data netříští do mnoha podobných řádků.

5. Diagnostika#

Diagnostika vám pomůže odhalit, zda texty na vašich stránkách skutečně mluví o tom, co prodáváte, nebo zda jsou zahlceny nerelevantními slovy, které zkreslují výsledky analýzy.

Scraping Camel vezme všechna nalezená klíčová slova (včetně víceslovných frází), rozdělí je na jednotlivá slova a spočítá, kolikrát se které z nich na celém webu vyskytuje. Díky tomu okamžitě uvidíte, jaká slova na vašem webu dominují.

Pokud zjistíte, že nejčastějším slovem na vašem e-shopu je například „DPH“, „cookies“ nebo „skladem“, je to pro vás důležitý signál. Znamená to, že tato technická nebo obecná slova v analýze „přebíjejí“ důležitá klíčová slova, která skutečně vystihují vaše produkty. Jakmile v diagnostice takové výrazy odhalíte, můžete je v záložce Validace přidat mezi stop slova. Tím analýzu vyčistíte a v přehledu vám zůstanou jen ta slova, která mají pro váš marketing skutečný význam.

6. Validace#

Záložka Validace slouží k automatickému pročišťování, organizaci a zvyšování kvality celého vašeho datasetu klíčových slov. Můžete zde nastavit validační pravidla (validátory), díky kterým zajistíte, že výsledný export klíčových slov bude maximálně relevantní pro váš marketing a nebude obsahovat zbytečná data. Díky validátorům se dataset čistí průběžně a automaticky na pozadí, takže zůstává kvalitní bez nutnosti neustálých ručních zásahů.

Pomocí validačních pravidel můžete hromadně nastavit například:

  • Zakázání slov (stop slova) – Pokud v analýze identifikujete slova, která pro vás nejsou přínosná (např. obecné výrazy jako „DPH“, „skladem“, „košík“ nebo váš vlastní brand, který přebíjí unikátní klíčová slova), můžete zde nastavit pravidla pro jejich trvalé vyloučení z analýzy.
  • Spojování do frází – Můžete definovat pravidla, která spojí dvě a více slov do jednoho celku (fráze), např. „Bidding Fox“ nebo „Google Analytics“. Scraping Camel pak s těmito frázemi pracuje jako s jedním klíčovým slovem, což zvyšuje přesnost scoringu a relevanci výsledků.
  • Automatické štítkování – Pomocí validátorů můžete také automaticky přiřazovat štítky ke klíčovým slovům na základě definovaných podmínek. To je zásadní pro tzv. klastrování, tedy seskupování slov do logických celků, například podle produktových skupin (ledničky, pračky, mobilní telefony).

7. Nastavení#

V Nastavení upravíte základní parametry analýzy, jako je její název nebo seznam ignorovaných znaků. Tato funkce je klíčová pro odstranění nežádoucích prvků z textů, ze kterých se klíčová slova generují. Umožňuje definovat seznam konkrétních symbolů a znaků, které má Scraping Camel při analýze zcela přehlížet. Zajistíte tak větší čistotu dat a zabráníte vytváření nerelevantních klíčových slov.

Veškeré zde uvedené parametry nastavujete v průvodci při zakládání nové analýzy. V tu chvíli volíte také jednu nebo více webových stránek, ze kterých se mají data čerpat. Toto nastavení je platné navždy a nelze jej v záložce Nastavení později změnit. Pokud potřebujete analyzovat jinou doménu, musíte vytvořit zcela novou analýzu.

Ochrana soukromí a nakládání s daty#

Scraping Camel zpracovává výhradně data z veřejně dostupných webových stránek, u kterých uživatel prokazatelně ověřil své vlastnictví nebo vztah k doméně. Veškerá získaná data jsou považována za soukromá, nejsou poskytována žádným třetím stranám a uživatel má jejich rozsah plně pod kontrolou přímo v administraci rozšíření. V případě smazání projektu jsou všechna související data do 14 dnů definitivně odstraněna i ze záložních systémů, které slouží pouze pro obnovu rozšíření při technických poruchách.

FAQ#

Co je Scraping Camel a k čemu slouží?#

Scraping Camel je rozšíření, které automaticky a průběžně prochází webové stránky, stahuje z nich data a ukládá je do CSV feedu nebo je poskytuje přes API. Běží nonstop na serveru, takže data jsou neustále aktualizována bez nutnosti ručně spouštět software na vašem počítači. Hodí se všude tam, kde potřebujete získat data, která nejsou dostupná v běžných produktových feedech.

Pro koho je Scraping Camel vhodný?#

Využijí ho především PPC a SEO specialisté, majitelé e-shopů, správci webů bez košíku (katalogy, magazíny, firemní weby) i content manažeři. Nástroj je univerzální – pomůže s automatizovanou tvorbou kampaní, SEO audity, analýzou klíčových slov i kontrolou kvality obsahu.

Kolik Scraping Camel stojí?#

Cena je 986 Kč měsíčně při měsíční fakturaci nebo 788,80 Kč měsíčně při roční fakturaci. Cena je fixní pro jeden e-shop bez ohledu na počet vytvořených projektů (webových stránek) nebo analýz klíčových slov. K dispozici je 30denní zkušební doba zdarma.

Musím mít placený projekt v Mergadu, aby mi Scraping Camel fungoval?#

Ne. Scraping Camel lze používat i bez placeného projektu v Mergadu. Stačí si zdarma vytvořit Mergado účet a v něm e-shop kvůli přihlášení, fakturaci a správě přístupů.

Jaké jsou podmínky pro spuštění Scraping Camelu?#

Potřebujete tři věci – Mergado účet s e-shopem, ověřené vlastnictví domény, kterou chcete scrapovat, a funkční soubor sitemap.xml, ze kterého rozšíření čerpá seznam URL adres.

Proč musím ověřovat vlastnictví domény?#

Scraping Camel je určen výhradně pro zpracování vlastních webů nebo webů vašich klientů. Ověření domény brání zneužití nástroje ke scrapování cizích či konkurenčních webů a zajišťuje, že s daty pracuje vždy oprávněná osoba.

Jak mohu doménu ověřit?#

Jsou k dispozici čtyři metody: přes Google Search Console (nejrychlejší varianta pro agentury), přes DNS TXT záznam (trvalá metoda nezávislá na kódu webu), vložením meta značky do hlavičky webu (vhodné pro Shoptet a WordPress) nebo nahráním HTML souboru na server.

Funguje Scraping Camel i na webech postavených na JavaScriptu?#

Ne. Rozšíření pracuje pouze s HTML kódem stránek a JavaScript nevykresluje. Pokud je jakýkoliv obsah stránky závislý na JavaScriptu, Scraping Camel jej nedokáže extrahovat.

Jaká data lze pomocí Scraping Camelu získat?#

Prakticky cokoliv, co je obsaženo v HTML kódu stránky. Data se pak ukládají buď do předdefinovaných systémových elementů (Title, H1, Meta Description, HTTP status, GTM/GA kódy aj.), vlastních elementů definovaných regulárním výrazem nebo textem „před a za“ nebo do automaticky generovaných AI elementů (klíčová slova, jazyk stránky, počet slov, titulek stránky).

Co jsou hromadné elementy a jak se liší od běžných?#

Do běžného elementu se uloží první výskyt dané hodnoty na stránce. Hromadné elementy uloží všechny výskyty. Konkrétně ukládají kompletní seznam všech obrázků (včetně alt textů a velikosti souboru) nebo všech odkazů (včetně HTTP stavových kódů) na dané stránce. Stahování informací do těchto elementů se spouští ručně, protože je výkonově náročnější.

Jak funguje SEO validace ve Scraping Camelu?#

Scraping Camel obsahuje 35 systémových validátorů, které nepřetržitě kontrolují technický stav webu a upozorňují na chyby jako chybějící H1, příliš dlouhé titulky nebo nefunkční stránky. Výsledky jsou barevně rozlišeny podle závažnosti a jsou přístupné online. Vedle systémových validátorů si můžete vytvářet i vlastní.

Jak Scraping Camel pomůže s PPC kampaněmi?#

Vytváří page feedy s URL adresami a jejich obsahem, které jsou ideální pro DSA kampaně a Performance Max. Je možné získat také inverzní exporty klíčových slov – CSV soubory, kde je primárním klíčem URL adresa a k ní jsou přiřazena všechna relevantní klíčová slova.

Mohu scrapovat jen část webu, například jen kategorie?#

Ano. V nastavení pravidel zpracování stránek určíte, které části webu se mají scrapovat a které ignorovat — například vyloučíte blog a zpracujete jen kategorie. Podmínky lze definovat řetězcem z URL nebo regulárním výrazem.

Jak rychle Scraping Camel data aktualizuje?#

Nové stránky, které se poprvé objeví v sitemapě, se rozšíření snaží stáhnout zpravidla každý den. U již známých stránek si sami zvolíte frekvenci – jednou, denně, každé tři dny, týdně nebo měsíčně. Rychlost lze dále ovlivnit nastavením počtu stažení v dávce a intervalu mezi dávkami.

V jakém formátu jsou dostupná výstupní data?#

Data jsou exportována jako CSV soubor, který lze nahrát do Mergado Editoru jako samostatný feed nebo připojit k existujícímu projektu pomocí pravidla Import datového souboru. Data jsou přístupná také přes API, například pro rozšíření Mergado Marketing Buddy.

Můžu v rámci jednoho spuštění rozšíření scrapovat více webů?#

Ano, počet domén v rámci jednoho spuštění není omezen. Pro agentury spravující weby více klientů se ale doporučuje spustit pro každého klienta samostatnou instanci rozšíření – usnadní to správu přístupů a předání dat při ukončení spolupráce.

Co se stane s mými daty, pokud projekt smažu?#

Po smazání projektu jsou všechna související data do 14 dnů trvale odstraněna i ze záložních systémů. Scraping Camel zpracovává výhradně data z veřejně dostupných stránek s ověřeným vlastnictvím a neposkytuje je žádným třetím stranám.

Jak funguje analýza klíčových slov ve Scraping Camelu?#

V sekci Klíčová slova vytvoříte analýzu pro jednu nebo více domén. Scraping Camel automaticky generuje klíčová slova z obsahu stránek, přiřazuje jim skóre relevance a průběžně je aktualizuje. Data lze třídit pomocí štítků, sjednocovat různé tvary slov přes varianty, čistit pomocí stop slov a exportovat jako klasický nebo inverzní CSV soubor.

Jak poznám, že moje analýza klíčových slov obsahuje nerelevantní slova?#

K tomu slouží záložka Diagnostika. Scraping Camel v ní zobrazí, která slova se na vašem webu vyskytují nejčastěji. Pokud mezi nimi dominují obecné výrazy jako „DPH" nebo „cookies", je to signál, že tato slova přebíjejí relevantní klíčová slova a měla by být přidána na seznam tzv. stop slov.

Byl tento článek užitečný?