pondelok, 01 apríl 2019 12:00

Tri dôvody prečo použiť grafovú NoSQL databázu vo firemnom BI

Digitalizácia sveta okolo nás prináša jednu zaujímavú skutočnosť - dát je spravidla v každej firme viac ako sú prostriedky interného BI (Business Intelligence) schopné spracovať a ako manažéri vedia využiť pri rozhodovaní. S nárastom objemu údajov prichádza aj fenomén vzťahových údajov. Údaje sú pekne štruktúrované v tabuľkách, ale pre ich pochopenie je potrebné pracovať so vzťahmi medzi jednotlivými časťami údajov.

Napríklad pri analýze obchodných tímov sa zameriavame na údaje o výkonnosti tímu, napr. počet podpísaných objednávok a ich sumárnu finančnú hodnotu pre firmu, ale aj na kvalitatívne ukazovatele ako je počet vykonaných telefonátov, počet stretnutí, počet reklamácií a pod. Všetky tieto firemné údaje sú bežne dostupné - v menších firmách sú údaje roztratené v exceloch,  vo  väčších spoločnostiach zvyčajne uložené v dátovom sklade a prezentované pomocou reportov s tabuľkami a grafmi.

Problém s bežným BI riešením nastane, keď manažér povie, že pre ďalšie zvýšenie efektivity potrebuje lepšie pochopiť, prečo je jeden obchodník „superstar“ a iný má horšie výsledky, aj keď údaje hovoria, že na to nie je zjavný dôvod. Šiesty zmysel manažérovi napovedá, že je to tým ako obchodník komunikuje, dokáže ľudí prepájať, vie odhadnúť, čo zákazník potrebuje skôr ako je to vyslovené, má prirodzenú autoritu a silnú neformálnu pozíciu vo firme.

Dá sa takéto niečo odmerať? Je možné z dát zistiť, či je nový obchodník na ceste stať sa novou „superstar“? Vedieť o tom, že sa spôsob komunikácie top obchodníka výrazne zmenil môže byť na nezaplatenie, najmä ak ide o zástupcu firmy, ktorý pravidelne komunikuje s najdôležitejšími zákazníkmi. Dá sa  identifikovať zmena správania v tejto rovine?

Riešenie ponúkajú grafové NoSQL databázy, ktoré dokážu z existujúcich údajov vyťažiť novú vedomosť tým, že sa zameriavajú na vzťahy, ktoré sú skryté v údajoch zobrazených v tabuľkách a stĺpcoch.

Graf je vo svojej podstate jednoduchá štruktúra skladajúca sa z uzlov a vzťahov medzi nimi. Nasledujúci graf je zložený zo štyroch uzlov - tomto prípade štyroch zamestnancov firmy a vzťahov (šípky medzi uzlami), ktoré vyjadrujú početnosť telefonátov medzi dvoma zamestnancami. Čim je vzťah hrubší a červenší, tým viac hovorov bolo v sledovanom období uskutočnených medzi danou dvojicou. Smer vzťahu vyjadruje kto koho kontaktoval.

obrazok 1
DÔVODY PREČO POUŽIŤ GRAFOVÚ NoSQL DATABÁZU VO FIREMNOM BI?

1. Dôvod: Intuitívnosť použitia aj pri veľmi zložitých údajoch

Grafové databázy veľmi efektívne imitujú spôsob, akým ľudia rozmýšľajú, akým spôsobom si náš mozog ukladá a triedi údaje. Teória grafov vznikla okolo roku 1750 a za jej zakladateľa sa považuje švajčiarsky matematik Leonhard Euler (1707-1783), ktorý prvé stavebné prvky teórie použil pri výpočte algoritmu na  prechod všetkých mostov v Königsbergu v Nemecku, pričom podmienkou bolo cez každý most prejsť iba jeden krát. Teoretická časť prešla odvtedy zásadným vývojom ale jedno zostalo nemenné - pri riešení grafového problému sa veľa kreslí. Grafy vo forme uzlov a vzťahov sú najrozšírenejšou formou komunikácie zložitých problémov. Určite to poznáte, keď sa v tíme rieši problém, tak väčšinou sa niekto postaví a nakreslí na tabuľu základné stavebné bloky preberaného problému a vzťahy, ktoré vyjadrujú ako jednotlivé časti spolu súvisia. Takýto typ obrázkov sa dá použiť aj pri prezentácii automatizovane extrahovaných grafov z údajov nahromadených v dátových skladoch. Ak ku tomu pridáme možnosť interaktívnej manipulácie s grafom tak dostaneme ideálny nástroj používaný napríklad na odhaľovanie poistných podvodov, alebo na odhaľovanie schém prania špinavých peňazí.

2. Dôvod: Pomocou grafu dokážete z existujúcich dát veľmi rýchlo získať novú pridanú hodnotu

Použitie grafu vo firemnom BI riešení umožní z existujúcich údajov získať úplne nové pohľady a poznatky. Pre grafy platí zásada, že čím viac údajov použijeme, tým sú vzory správania viditeľnejšie a ľahšie identifikovateľné. V nasledujúcom príklade ukážeme ako je možné z obyčajných výpisov služobných telefónov, ktoré dnes zdarma poskytujú všetci mobilní operátori, dostať obrázok o komunikácii vo firme. Tento obraz má zásadne inú hodnotu, ako pohľad cez čísla v tabuľke, pretože sa nezameriava na vyhodnotenie jednotlivca alebo osamotených dvojíc, ale poskytuje celkový obraz o komunikácii, z ktorej je možné ľahko usúdiť, či niečo nápadne vyčnieva alebo naopak, či je daná komunikácia v predpokladaných hraniciach. Detekcia výnimočných situácií , alebo zmien v správaní sa v takomto grafickom vyjadrení stáva hračkou aj pre netechnického človeka.

3. Dôvod: Grafové technológie sa za posledných 5 rokov stali dostupnými pre malé aj stredné firmy

Nebudeme si nič nahovárať, pri použití novej technológie vo firme musia sedieť aj čísla. Žiadna zmena nebude odsúhlasená, ak bude celková cena zavedenia a udržiavania projektu vysoká a návratnosť v rozsahu niekoľkých rokov. Teória grafov bola vždy súčasťou matematiky a jej praktické použitie bolo spravidla veľmi drahé, najmä kvôli výpočtovej náročnosti algoritmov. Zvýšenie dostupnosti a vyspelosti grafových technológií posúva cenu zavedenia násobne nižšie a návratnosť sa dá počítať v týždňoch, maximálne mesiacoch. Výsledok je ľahko pozorovateľný na vzostupe záujmu o grafové NoSQL databázy v rebríčku DB-engines.com.

Praktický príklad Grafovej vizualizácie firemnej komunikácie

Na praktickom príklade v závere článku sa pokúsime ukázať, že použitie moderných grafových riešení je rýchlejšie a lacnejšie, ako by sa mohlo na prvý pohľad zdať.

Demonštrácia všetkých troch dôvodov sa dá ľahko realizovať v každej  spoločnosti napríklad na využívaní  služobných mobilných telefónov. Na ukážku postačujú:

  • výpisy služobných mobilných telefónov - potrebujeme iba dáta kto koho kontaktoval.  Z dôvodu zachovania súkromia osôb nie je potrebné mať k dispozícií iné údaje
  • grafová NoSQL databáza - výpisy transformujeme do podoby grafu uloženého v grafovej databáze.  Pre daný príklad sme použijeme najrozšírenejšiu databázu Neo4j, ktorá ponúka komunitnú verziu zdarma.
  • vizualizačný nástroj - údaje z databázy zobrazíme slovenskou aplikáciu Graphlytic.biz, ktorú je možné na databázu Neo4j ľahko pripojiť, pomocou ktorej vieme údaje pohodlne vizualizovať a s výsledným grafom intuitívne pracovať.


Nasledujúci obrázok prestavuje grafovú vizualizáciu komunikácie medzi jednotlivými oddeleniami:

Graphlytic


Výsledok je pomerne prekvapujúci. Po krátkom ladení údajov a nastavení vizualizácie sme schopní vidieť dynamiku komunikácie v rámci každého oddelenia. Napríklad informáciu, s ktorým členom tímu ľudia najviac komunikujú, ktoré osoby pôsobia ako prepájači oddelení, teda kto má najviac komunikácie s ostatnými tímami vo firme. Toto všetko pohodlne a jednoducho zistíme pohľadom na celkový graf, ktorého údaje je možné navyše pohodlne filtrovať v čase, alebo podľa ďalších kritérií ako je priemerná dĺžka komunikácií, príslušnosť ku oddeleniu alebo podľa pozície vo firme.

O bezplatnú ukážku môžete požiadať na Táto e-mailová adresa je chránená pred spamovacími robotmi. Na jej zobrazenie potrebujete mať nainštalovaný JavaScript. a my Vám radi predstavíme, čo sa dá pomocou grafov zistiť z Vašich údajov.

  

***

Autor: Michal Habala

Kontakt: Táto e-mailová adresa je chránená pred spamovacími robotmi. Na jej zobrazenie potrebujete mať nainštalovaný JavaScript.