Blending Bull pravidlo: Smazat XML značku i s obsahem#
Pravidlo Smazat XML značku i s obsahem slouží k jednoduchému a rychlému odstranění celých elementů z XML souboru. Jelikož Blending Bull pracuje na nízkoúrovňové bázi (úroveň znaků), je toto pravidlo navrženo tak, aby spolehlivě identifikovalo a odstranilo XML elementy bez ohledu na jejich konkrétní zápis.
K čemu pravidlo slouží?#
Hlavním cílem je zjednodušit čištění XML souborů od nepotřebných informací. Je ideální pro situace, kdy:
-
Potřebujete z feedu odstranit celé sekce dat, které nevyužijete (např. parametry, popisy v jiných jazycích nebo technické značky).
-
Chcete zmenšit velikost souboru před dalším zpracováním.
-
Potřebujete odstranit nevalidní nebo poškozené bloky dat, které způsobují chyby v jiných nástrojích.
Jak pravidlo funguje?#
Blending Bull při zpracování využívá logiku podobnou regulárním výrazům, aby našel začátek značky <ELEMENT> a její odpovídající konec </ELEMENT>. Pravidlo si dokáže poradit s různými variantami zápisu elementů:
1. Text na jednom řádku#
Pravidlo odstraní element, kde je všechen text na jednom řádku bez zlomů (např. i po aplikaci pravidla Zarovnat XML do tabulky).
Příklad:
<ELEMENT>Libovolný text</ELEMENT>2. Text na více řádcích#
Pravidlo si poradí i se zápisem, který obsahuje řádkové zlomy nebo bílé znaky (mezery, tabulátory).
Příklad:
<ELEMENT>
Libovolný text
</ELEMENT>3. Zanořené elementy#
Pravidlo smaže také všechny zanořené elementy, které jsou obsaženy v elementu určeném k odstranění. Pokud tedy k odstranění zvolíte ELEMENT, pravidlem bude smazán také SUBELEMENT1 a SUBELEMENT2.
Příklad:
<ELEMENT>
<SUBELEMENT1>Libovolný text</SUBELEMENT1>
<SUBELEMENT2>Jiný text</SUBELEMENT2>
</ELEMENT>4. Elementy s parametry#
Pravidlo spolehlivě identifikuje a smaže i elementy, které obsahují doplňující parametry.
Příklad:
<ELEMENT parameter_1="abc" parameter_2="def">Libovolný text</ELEMENT>Jak pravidlo nastavit?#
-
V rozhraní vybraného souboru v záložce Upravit soubor klikněte na tlačítko Vytvořit nové pravidlo.
-
Vyplňte Název pravidla.
-
Jako Typ pravidla vyberte Smazat XML značku i s obsahem.
-
Do příslušného pole vyplňte název elementu, který chcete odstranit (např.
DESCRIPTION,PARAMapod.). -
Klikněte na Uložit.
Výhody použití#
Díky tomu, že Blending Bull neukládá data do databáze, ale zpracovává je přímo jako proud znaků, je odstranění elementů mimořádně rychlé i u velmi objemných feedů. Na rozdíl od pravidel Najít a nahradit nebo Smazat text nemusíte řešit, co přesně je obsahem elementu, pravidlo jej jednoduše vymaže celý od začátku až do konce.
FAQ#
Co přesně pravidlo Smazat XML značku i s obsahem dělá?#
Odstraní z XML souboru celý vybraný element včetně veškerého jeho obsahu. Tedy jak text uvnitř, tak případné zanořené elementy. Stačí zadat název elementu a pravidlo se postará o zbytek.
Pro jaký formát dat je pravidlo určeno?#
Pravidlo je určeno pro datové zdroje ve formátu XML. Na jiné formáty jako CSV nebo JSON se nevztahuje.
Poradí si pravidlo s elementem rozepsaným přes více řádků?#
Ano. Pravidlo funguje bez ohledu na to, zda je element na jednom řádku nebo rozepsaný přes více řádků včetně mezer a tabulátorů.
Smaže pravidlo i elementy zanořené uvnitř odstraňovaného elementu?#
Ano. Pokud element obsahuje další zanořené elementy, budou odstraněny spolu s ním. Není tedy potřeba mazat každý zanořený element zvlášť.
Zvládne pravidlo elementy s doplňujícími parametry?#
Ano. Pravidlo spolehlivě identifikuje a odstraní i elementy, které obsahují doplňující parametry, například <ELEMENT parameter_1="abc">.
V čem je použití tohoto pravidla výhodné?#
Protože nemusíte znát ani řešit obsah elementu. Pravidlo element jednoduše celý vymaže od začátku do konce, bez ohledu na to, co je uvnitř. Navíc Blending Bull zpracovává data jako proud znaků bez zápisu do databáze, takže je odstranění mimořádně rychlé i u velmi objemných feedů.
Kde v Blending Bullu pravidlo nastavím?#
V rozhraní vybraného souboru přejděte na záložku Upravit soubor, klikněte na Vytvořit nové pravidlo, jako typ vyberte Smazat XML značku i s obsahem, zadejte název elementu, který chcete odstranit, a uložte.