Katalogizácia dát - Data Catalog
Kedy sa zaoberať riešením Katalogizácia dát?
✓ V spoločnosti existuje vysoký počet neprepojených dátových zdrojov (databázy, súbory, systémy) žijúcich „vlastným životom“
✓ Systémy obsahujú dáta v odlišných štruktúrach, kvalite
✓ Pre zamestnancov je komplikované zistiť pôvod dát v dátových skladoch určených pre strategické analýzy
✓ Pre zamestnancov je komplikované určiť zmeny v dátach, kroky ich transformácie od ich vzniku až po cieľové využitie
✓ Vznikajú nadbytočné náklady pre udržiavanie zdrojov s duplicitnými a nekvalitnými dátami
✓ Pre nejednoznačnosť dát vznikajú škody, ako sú napríklad chybné plánovanie produkcie, nesprávne strategické rozhodnutia, či nevhodne
zvolený manažment zákazníka
✓ Dátové zdroje začínajú byť neprehľadné a nemožno vyradiť nadbytočné systémy pre udržiavanie len skutočne potrebnej množiny dát
✓ Úprava dát je komplikovaná pre ich nesúrodosť a nemožnosť identifikácie následkov zmeny
✓ Neexistujú pracovné postupy pre riadenie prístupu k dátam a manažovanie práce s nimi
Ako riešenie Katalogizácia dát pomôže Vášmu podnikaniu?
Riešenie Katalogizácie dát Vám umožní skonsolidovať všetky dátové zdroje vo Vašej spoločnosti. Prepojením s funkčnosťami pre dátovú integráciu a dátovú kvalitu je možné automaticky mapovať dátové toky a transformačné operácie nad dátami (napr. zmena dátových typov, agregácie, mapovanie a konsolidácia tabuliek a iné) a tým vytvoriť komplexný obraz procesu spracovania dát v spoločnosti.
Pre analytické jednotky v spoločnosti už nebude problém sledovať celý proces vzniku dát, ich pôvod, kvalitu a dôveryhodnosť pre rýchle a presné analýzy. Riešenie analytickým jednotkám uľahčí vyhľadávanie a tvorbu nových dátových zdrojov čím umožní flexibilnejšiu reakciu podľa aktuálnych biznis požiadaviek spoločnosti. Katalogizácia prináša rovnaké benefity aj pre IT oddelenia a dátových kurátorov, kde pomáha zlepšovať sledovanie dát, ich manažovanie a kvalitu. Zachytáva a prenáša do vizuálnej podoby všetky metadáta z analytických nástrojov ako Tabelau alebo Power BI, integračných nástrojov ako Talend alebo Informatica , aplikácií Salesforce, SAP, SQL query a modelovacích nástrojov.
Vyše 80% informácií spojených s dátami môže byť riešením katalogizácie dát automaticky dokumentované a aktualizované na základe „smart“ vzťahových relácií a machine learning algoritmom.
Hlavné výhody
+ Vytváranie a správa kmeňových údajov spoločnosti
+ Budovanie pracovných postupov
+ Administrácia pod vlastnou strechou
+ Podpora silnej open komunity vývojárov
+ Jednoduché plánovanie nákladov na integrácie
+ Zbavenie sa závislosti od dodávateľov tretích strán a parciálnych systémov
+ Vytvorenie Jednotnej pravdy a jednoznačnej údajovej základne v celej spoločnosti
+ Zapojenie dátových stewardov pre stotožňovanie rovnakých záznamov z rôznych zdrojov
+ Intuitívne grafické prostredie pre prístup a správu kmeňových údajov biznis používateľmi
+ Flexibilná a prehľadná licenčná politika bez dodatočných poplatkov za objemy dát a počty integrácií
+ Možnosť kombinovať všetky riešenia pre Dátovú integráciu, Dátovú kvalitu, Integrácie aplikácií a Big Data v rámci jedného produktu
Komplexné riešenie Data Fabric pozostáva z týchto funkčných oblastí:
Okrem často používaného on-premise typu inštalácie, Talend ponúka aj hybridnú alebo cloud inštaláciu o ktorej sa môžete viac dočítať tu.