Co je Scraping Camel AI?#
Technologie Scraping Camel AI je jednou z funkcí rozšíření Scraping Camel, která slouží k automatizovanému zpracování a analýze obsahu webových stránek pomocí umělé inteligence. Namísto ručního definování pravidel pro každý prvek využívá tento systém chytré algoritmy k samostatnému vyhodnocení textu a generování hodnot přímo do systémových AI elementů. Parametry funkce Scraping Camel AI jsou nastaveny automaticky, pro elementy generující klíčová slova je však možné tyto parametry upravit.
Přehled AI elementů ve Scraping Camel#
Ve Scraping Camelu existuje šest AI elementů. Jejich generování je možné aktivovat nebo deaktivovat v rámci konkrétního projektu (webové stránky), kdy v záložce Elementy kliknete na Editovat elementy a následně je zaškrtnutím (nebo odškrtnutím) zapnete (nebo vypnete).
SC_NUMBER_OF_WORDS (Počet slov na stránce)#
Element SC_NUMBER_OF_WORDS obsahuje číselnou hodnotu vyjadřující počet slov, které algoritmus na stránce našel po odstranění HTML kódu a nepodstatného obsahu. Pomáhá identifikovat stránky s velmi nízkým počtem slov (např. pod 50 slov), které mohou být chybné nebo kvůli tomu mohou být vyhledávači považovány za nekvalitní a podezřelé. Ukáže také stránky s naopak velmi vysokým počtem slov, kde mohlo dojít například k chybnému importu nebo zpracování textu.
SC_MAIN_TITLE (Strojově generovaný titulek)#
Element SC_MAIN_TITLE obsahuje krátký textový popis stránky vygenerovaný na základě více signálů z obsahu. Je podobný elementům H1 a TITLE, ale je psán malými písmeny, neměl by obsahovat brand webu, měl by vypovídat o dané stránce a být vždy uveden. V porovnání s H1 je odolnější vůči technickým chybám a nevalidnímu obsahu. Má být unikátní pro danou stránku a neobsahovat texty společné pro celý web.
SC_DETECTED_LANGUAGE (Detekovaný jazyk)#
Element SC_DETECTED_LANGUAGE obsahuje kód jazyka (např. cs, sk, pl), ve kterém je text stránky psaný. Pomáhá odhalit chyby v lokalizaci, například nepřeložené produkty od zahraničních dodavatelů nebo chyby po tvorbě nové jazykové verze stránky.
Elementy generující klíčová slova#
Parametry elementů generujících klíčová slova je možné upravovat na stránce Nastavení → Nastavení AI. Zde definujete například maximální počet generovaných klíčových slov, určíte práh skóre (minimální procentuální význam, který musí slovo mít, aby se dostalo do výběru klíčových slov), minimální délku klíčových slov, pravidla pro zpracování nadpisů a čísel, stanovíte tzv. stop slova (výrazy, které má AI pro tvorbu klíčových slov zcela ignorovat) nebo definujete fráze (víceslovná spojení, která má algoritmus zpracovávat dohromady jako jedno klíčové slovo).
SC_WORDS_COUNT#
Seznam jednoslovných klíčových slov oddělených čárkou. Informují o obsahu stránky.
SC_WORDS_TUPLES_COUNT#
Seznam dvojslovných klíčových slov (např. „PPC reklama“) oddělených čárkou. Lépe zachycují konkrétní téma stránky.
SC_WORDS_AGG_MIN_FREQ_3#
Nejpokročilejší a nejpřesnější metoda, která kombinuje výsledky předchozích analýz a několika dalších interních metod a generuje ty nejrelevantnější jednoslovné i víceslovné výrazy.
Využití dat z AI elementů#
Hodnoty AI elementů jsou dostupné ve výstupním CSV feedu, který lze dále zpracovávat v dalších nástrojích. V Mergadu lze data procházet podrobněji, tvořit nad nimi výběry, využít je pro data-driven SEO a tvorbu reportů nebo je začlenit přímo do PPC kampaní. Díky API jsou data dostupná také pro nástroje jako Mergado Marketing Buddy.
FAQ#
Co je Scraping Camel AI?#
Jde o sadu funkcí rozšíření Scraping Camel, která pomocí umělé inteligence automaticky analyzuje obsah webových stránek a generuje data do předdefinovaných AI elementů – bez nutnosti ručně nastavovat pravidla nebo definovat, co má rozšíření hledat.
Co všechno Scraping Camel AI dokáže z webu zjistit?#
Automaticky detekuje jazyk stránky, spočítá počet slov na stránce a vygeneruje strojový titulek vystihující obsah stránky. Zároveň extrahuje klíčová slova – jednoslovná, dvojslovná i jejich nejrelevantnější kombinaci.
Jak AI elementy zapnu nebo vypnu?#
V záložce Elementy v rámci konkrétního projektu klikněte na Editovat elementy a jednotlivé AI elementy zaškrtnutím nebo odškrtnutím aktivujte či deaktivujte.
K čemu slouží element SC_NUMBER_OF_WORDS?#
Obsahuje počet slov na stránce po odstranění HTML kódu a nepodstatného obsahu. Pomáhá odhalit stránky s příliš nízkým počtem slov, které mohou být vyhledávači považovány za nekvalitní, ale i stránky s neobvykle vysokým počtem slov, kde mohlo dojít k chybnému importu textu.
Co je SC_MAIN_TITLE a čím se liší od H1 nebo TITLE?#
Je to strojově generovaný titulek stránky vycházející z více signálů z obsahu. Na rozdíl od H1 a TITLE je vždy psán malými písmeny, neobsahuje brand webu a je odolnější vůči technickým chybám a nevalidnímu obsahu. Měl by být unikátní pro každou stránku.
K čemu slouží element SC_DETECTED_LANGUAGE?#
Automaticky detekuje jazyk textu na stránce a vrací jeho kód (např. cs, sk, pl). Pomáhá odhalit chyby v lokalizaci, například nepřeložené produkty od zahraničního dodavatele nebo stránky, které zůstaly v původním jazyce po spuštění nové jazykové verze webu.
Jaký je rozdíl mezi SC_WORDS_COUNT, SC_WORDS_TUPLES_COUNT a SC_WORDS_AGG_MIN_FREQ_3?#
SC_WORDS_COUNT generuje seznam jednoslovných klíčových slov, SC_WORDS_TUPLES_COUNT seznam dvojslovných spojení, která lépe vystihují konkrétní téma stránky. SC_WORDS_AGG_MIN_FREQ_3 je nejpokročilejší metoda – kombinuje výsledky předchozích analýz i dalších interních metod a vybírá pouze nejrelevantnější jednoslovné i víceslovné výrazy.
Který element klíčových slov mám použít?#
Pro většinu případů doporučujeme SC_WORDS_AGG_MIN_FREQ_3, protože poskytuje nejčistší a nejrelevantnější výsledky. Ostatní dva elementy jsou vhodné tehdy, když potřebujete pracovat odděleně s jednoslovnými nebo dvojslovnými výrazy.
Mohu parametry AI elementů nějak upravit?#
Parametry lze upravovat pro elementy generující klíčová slova v sekci Nastavení → Nastavení AI. Zde nastavíte například maximální počet generovaných klíčových slov, práh skóre, minimální délku slov, stop slova nebo fráze. Elementy SC_NUMBER_OF_WORDS, SC_MAIN_TITLE a SC_DETECTED_LANGUAGE se konfigurují automaticky a jejich parametry upravovat nelze.
Kde najdu data z AI elementů a jak je mohu využít?#
Data jsou dostupná ve výstupním CSV feedu. V Mergadu je můžete dále procházet, tvořit nad nimi výběry, využít pro data-driven SEO a tvorbu reportů nebo je začlenit do PPC kampaní. Přes API jsou data dostupná také pro nástroje jako Mergado Marketing Buddy.