utorok, 03 október 2017 12:00

Čisté a jednotné dáta, ľahko a rýchlo s Talend Data Preparation

Dáta musia byť plne prístupné širokému spektru používateľov a zároveň prispôsobiteľné akémukoľvek kontextu. Súčasné podnikateľské prostredie sa veľmi rýchlo vyvíja a spoločnosti sa potrebujú s daným tempom čo najrýchlejšie zladiť.

„Samoobslužné služby sú správnym prístupom v digitalizácii každého pracoviska. Dáta musia byť plne prístupné širokému spektru používateľov a zároveň prispôsobiteľné akémukoľvek kontextu. Zároveň musí v rovnakom čase spĺňať štandardy dátovej kvality a byť odolné voči chybám.“

Jean-Michel Franco, produktový manažér Talend

V čase, keď spoločnosti začínajú objavovať benefity tzv. „dátovo riadenej kultúry“, vyžadujú použitie čo najefektívnejších a časovo nenáročných postupov pri získavaní informácií ukrytých v podnikových dátach. Medzi prostriedky nevyhnutné pre využitie interného know-how patria samoobslužné analytické nástroje. Umožňujú sprístupnenie dát väčšiemu počtu zamestnancov v spoločnosti spolu s možnosťou objavovania súvislostí medzi rôznymi dátovými zdrojmi.

Samozrejme to neznamená, že by sme mali samoobslužný nástroj považovať za konečné „urob si sám“ riešenie. Ide o prostriedok na zavedenie nového typu spolupráce s IT oddeleniami, ktoré nebudú zaťažované úlohami pri samotnej tvorbe analytických vstupov (datasetov) pre analytické jednotky.

"Zavedenie samoobslužných analytických nástrojov vytvára situáciu win-win, kedy môžu pracovníci získavať z dát užitočné informácie operatívne a flexibilne, pri zachovaní kontroly nad administráciou dát zo strany IT oddelení."

 

DP time saving


Súčasné podnikateľské prostredie sa rapídne vyvíja a spoločnosti sa musia čo najrýchlejšie prispôsobovať. Známym príkladom úspešného nasadenia samoobslužných nástrojov je spoločnosť Yahoo. Jej zamestnanci museli čakať mesiace na každý komplexnejší report, vďaka zaužívanému procesu ich spracovania centrálnym analytickým oddelením. Keď spoločnosť prešla na model samoobslužných analýz pomocou nástrojov s jednoduchou obsluhou, ukázalo sa, že zamestnanci dokážu samostatne vytvárať rovnaké reporty vo veľmi krátkom čase. Samozrejme ide len o jeden prípad z množstva spoločností, ktoré objavili benefity skryté v samoobslužných systémoch. Ako však zabezpečiť potrebné dočistenie a prípravu dát pre tieto analýzy?

Nezabúdať na administráciu

Jedným z hlavných benefitov je zvýšenie samostatnosti zamestnancov pri vyhodnocovaní dát, čím sa rozvíja ich analytické myslenie v rámci zverenej oblasti pri hľadaní odpovedí na otázky „čo ak“. Je potrebné zabezpečiť správu dát tak, aby nedochádzalo k zbytočnej, duplicitnej tvorbe rôznych náhľadov na rovnaké skúmané skutočnosti. Náhle uvedenie zamestnancov do sveta samoobslužných analýz by s veľkou pravdepodobnosťou spôsobilo produkovanie veľkého množstva analýz a reportov s nejasnou logikou. Keďže sa nepredpokladá súkromné analyzovanie „mimo záznam“. Poverený zamestnanec by mal vedieť svoje analýzy zdieľať cez pridelený priečinok v intranete, no len po jasnom popísaní metodiky jeho vytvorenia a jej odsúhlasení centrálnym BI oddelením. Bez centrálneho schválenia je možné takéto výsledky brať len ako predbežné, resp. „pracovné“.

Úlohou IT oddelenia ostáva dbať na administráciu dát tak, aby na jednej strane mohli byť poskytnuté prístupy zamestnancom pre získanie požadovaných datasetov, na strane druhej centralizovať a zjednocovať ich verzie, aby sa nezgrupovali v tzv. dátových silách.

Práve tvorba samostatných decentralizovaných síl je deštruktívna pre každú dátovo orientovanú organizáciu.

Riadenie a administrácia dát je nevyhnutná pre jednoznačnosť samoobslužných analýz

Samoobslužné analýzy sú závislé ako na čistote a jednotnosti dátových súborov, tak aj na jednoduchosti a funkčnosti, ktorej sa vie prispôsobiť prevažná väčšina používateľov. Mnohé spoločnosti sa musia pri zvýšenej fluktuácii vysporiadať s nekonzistenciou dát vkladaných, či spravovaných nedostatočne zaškolenými zamestnancami, prípadne absenciou analytickej logiky po odchádzajúcich špecialistoch.

Nástroj TALEND Data Preparation pre vstupnú úpravu a zjednocovanie dátových zdrojov zlučuje v jednom riešení intuitívne webové grafické prostredie s vizuálnymi prvkami tabuľkových procesorov, ako je MS Excel. Využíva teda používateľsky známe prostredie s automatizovanými funkciami potrebnými pre okamžité čistenie a úpravu dát. Napríklad pre mnohých známa funkcia vlookup na spájanie záznamov, alebo zlúčenie dvoch skupín dát je vykonateľná na niekoľko kliknutí bez potreby upravovať zloženie vzorca a to nad mnohonásobne väčším objemom dát než umožňuje MS Excel.

DP screen


Jednotlivé funkcie je možné dopĺňať a upravovať podľa potreby používateľa. Nástroj ponúka možnosť okamžitej analýzy dát, z hľadiska početnosti výskytov formátov, platných a neplatných formátov, prázdnych miest, pattern analýzy, prípadne aj s vykreslením v geomapách.

Často zdĺhavá a náročná úprava dát, ktorú nad veľkými súbormi zvládne len pokročilý používateľ Excelu (prípadne je obmedzený počtom riadkov), sa tak pre priemerného používateľa stáva jednoduchou úlohou zvládnuteľnou za pár minút.

Jednotlivé kroky úpravy dát je možné v aplikácii zaznamenávať a ukladať do postupu – tzv. „Receptu“, ktorý je následne možné vložiť priamo do procesov dátových integrácií. Ide teda nielen o prvok ukladania logiky úpravy a čistenia datasetov pre dátovú integráciu, ale vzniká aj variabilný postup prístupný ostatným zainteresovaným stranám, ktorých logika má byť uplatnená nad jedným datasetom. Sekundárni používatelia zase môžu nahliadať do celkovej logiky spracovania a zároveň odfiltrovať pre nich nepotrebné kroky dátovej úpravy priamo z postupu (receptu) a vyčleniť si len pre nich užitočné informácie.

Data preparation môžeme označiť za nástroj reprezentujúci nový smer vo vývoji business intelligence prenášajúci individuálne znalosti zamestnancov pracujúcich s dátami (vlastníkmi dát) do spracovania a čistenia vstupných dát pre analýzy.

Získajte optimálne MIM riešenie pre Vaše dáta s využitím Talend Data Preparation.

 

***

Autor: Ivan Stríček

Kontakt: Táto e-mailová adresa je chránená pred spamovacími robotmi. Na jej zobrazenie potrebujete mať nainštalovaný JavaScript.

Ivan Stríček