OLAP systémy. Systémy OLAP Základné koncepty, na ktorých fungujú technológie olap

Účel správy

Táto správa sa zameria na jednu z kategórií inteligentných technológií, ktoré sú vhodným analytickým nástrojom – technológie OLAP.

Účel správy: odhaliť a zdôrazniť 2 problémy: 1) koncept OLAP a ich aplikovaný význam vo finančnom manažmente; 2) implementácia funkcionality OLAP v softvérových riešeniach: rozdiely, príležitosti, výhody, nevýhody.

Chcem hneď poznamenať, že OLAP je univerzálny nástroj, ktorý možno použiť v akejkoľvek oblasti použitia, a to nielen vo financiách (ako je zrejmé z názvu správy), čo si vyžaduje analýzu údajov. rôzne metódy.

Finančné riadenie

Finančný manažment je oblasť, v ktorej je analýza dôležitejšia ako ktorákoľvek iná. Akékoľvek finančné a manažérske rozhodnutie vzniká ako výsledok určitých analytických postupov. Finančný manažment dnes nadobúda dôležitú úlohu pre úspešné fungovanie podniku. Napriek tomu, že finančný manažment je pomocný proces v podniku, vyžaduje si osobitnú pozornosť, pretože chybné finančné a manažérske rozhodnutia môžu viesť k veľkým stratám.

Finančné riadenie má za cieľ poskytnúť podniku finančné prostriedky v požadovanom množstve, v správnom čase a na správnom mieste s cieľom dosiahnuť maximálny efekt z ich použitia optimálnou distribúciou.

Možno je ťažké určiť úroveň „maximálnej efektívnosti využívania zdrojov“, ale v každom prípade

CFO by mal vždy vedieť:

  • koľko finančných prostriedkov je k dispozícii?
  • Odkiaľ budú financie a koľko?
  • kam investovať efektívnejšie a prečo?
  • A v akom časovom bode to treba urobiť?
  • koľko je potrebné na zabezpečenie normálnej prevádzky podniku?

Na získanie rozumných odpovedí na tieto otázky je potrebné mať, analyzovať a vedieť analyzovať dostatočne veľké množstvo ukazovateľov výkonnosti. Okrem toho FI pokrýva obrovské množstvo oblastí: analýza peňažných tokov (pohyby Peniaze), analýza aktív a pasív, analýza ziskovosti, marginálna analýza, analýza ziskovosti, analýza sortimentu.

Vedomosti

Preto kľúčovým faktorom efektívnosti procesu finančného riadenia je znalosť:

  • Osobné znalosti v danej oblasti (možno povedať teoretické a metodologické), vrátane skúseností, intuícia finančníka / finančného riaditeľa
  • Všeobecné (podnikové) znalosti alebo systematizované informácie o skutočnostiach finančných transakcií v podniku (t. j. informácie o minulom, súčasnom a budúcom stave podniku, prezentované v rôznych ukazovateľoch a meraniach)

Ak ten prvý leží v pôsobisku tohto finančníka (resp. HR riaditeľa, ktorý tohto zamestnanca prijal), tak druhý by mal byť cielene vytvorený v podniku spoločným úsilím pracovníkov finančných a informačných služieb.

Čo je teraz

Teraz je však v podnikoch typická paradoxná situácia: informácií je, je ich veľa, priveľa. Ale je v chaotickom stave: neštruktúrovaný, nekonzistentný, roztrieštený, nie vždy spoľahlivý a často chybný, je takmer nemožné ho nájsť a prijať. Vytvára sa zdĺhavé a často zbytočné generovanie hôr účtovných závierok, čo je pre finančnú analýzu nepohodlné, ťažko pochopiteľné, keďže sa nevytvára na interné riadenie, ale na predloženie externým regulačným orgánom.

Vyplýva to zo štúdie vykonanej firmou Reuters spomedzi 1 300 medzinárodných manažérov 38 % opýtaných uviedlo, že trávi veľa času hľadaním informácií, ktoré potrebujú. Ukazuje sa, že vysokokvalifikovaný špecialista trávi vysoko platený čas nie analýzou údajov, ale zhromažďovaním, vyhľadávaním a systematizáciou informácií potrebných na túto analýzu. Manažéri zároveň zažívajú veľké zaťaženie dát, často nepodstatných pre prípad, čo opäť znižuje ich efektivitu. Dôvod tejto situácie: prebytok informácií a nedostatok vedomostí.

Čo robiť

Informácie sa musia premeniť na vedomosti. Pre moderné podnikanie sú cenné informácie, ich systematické získavanie, syntéza, výmena, používanie akýmsi platidlom, no na ich prijímanie je potrebné informácie ako každý obchodný proces riadiť.

Kľúčom k manažmentu informácií je poskytovanie správnych informácií správnym spôsobom správnym ľuďom v organizácii v správnom čase. Účelom tohto manažmentu je pomôcť ľuďom lepšie spolupracovať pomocou čoraz väčšieho množstva informácií.

Informačné technológie v tomto prípade fungujú ako prostriedok, pomocou ktorého by bolo možné systematizovať informácie v podniku, poskytnúť k nim určitým používateľom prístup a poskytnúť im nástroje na premenu týchto informácií na znalosti.

Základné pojmy technológií OLAP

OLAP-technológie (z anglického On-Line Analytical Processing) nie je názov konkrétneho produktu, ale celej technológie na operatívnu analýzu viacrozmerných dát nahromadených v úložisku. Aby sme pochopili podstatu OLAP, je potrebné zvážiť tradičný proces získavania informácií pre rozhodovanie.

Tradičný systém na podporu rozhodovania

Aj tu môže byť samozrejme veľa možností: úplný informačný chaos alebo najtypickejšia situácia, keď má podnik operačné systémy, ktoré zaznamenávajú fakty o určitých operáciách a ukladajú ich do databáz. Na extrakciu údajov z databáz na analytické účely bol vybudovaný systém dopytov na určité vzorky údajov.

Tento spôsob podpory rozhodovania však nemá flexibilitu a má mnoho nevýhod:

  • používa zanedbateľné množstvo údajov, ktoré môžu byť užitočné pri rozhodovaní
  • niekedy sa vytvárajú zložité viacstranové správy, z ktorých sa skutočne používajú 1-2 riadky (zvyšok je len pre každý prípad) - preťaženie informáciami
  • pomalá reakcia procesu na zmeny: ak je potrebná nová reprezentácia údajov, potom musí programátor požiadavku formálne opísať a zakódovať a až potom vykonať. Čakacia doba: hodiny, dni. A možno je potrebné rozhodnutie hneď, okamžite. Ale po prijatí nových informácií sa objaví nová otázka (objasňujúca)

Ak sú zostavy dotazov prezentované v jednorozmernom formáte, obchodné problémy sú zvyčajne viacrozmerné a mnohostranné. Ak chcete získať jasný obraz o podnikaní spoločnosti, musíte analyzovať údaje v rôznych sekciách.

Mnoho spoločností vytvára skvelé relačné databázy dokonalým triedením cez hory nepoužitých informácií, čo samo osebe neposkytuje rýchlu ani adekvátnu reakciu na udalosti na trhu. ÁNO - relačné databázy boli, sú a budú najvhodnejšou technológiou na uchovávanie firemných dát. Nejde o to Nová technológia DB, ale skôr o nástrojov analytické systémy, ktoré dopĺňajú funkcie existujúcich DBMS a sú dostatočne flexibilné na to, aby poskytovali a automatizovali rôzne typy intelektuálnych analýz, ktoré sú súčasťou OLAP.

Pochopenie OLAP

Čo dáva OLAP?

  • Pokročilé nástroje na prístup k údajom v úložisku
  • Dynamická interaktívna manipulácia s údajmi (rotácia, konsolidácia alebo hĺbková analýza)
  • Jasné vizuálne zobrazenie údajov
  • Rýchla - analýza sa vykonáva v reálnom čase
  • Multidimenzionálna prezentácia dát – simultánna analýza množstva ukazovateľov vo viacerých dimenziách

Na dosiahnutie efektu používania technológií OLAP je potrebné: ​​1) pochopiť podstatu samotných technológií a ich schopností; 2) jasne definovať, aké procesy je potrebné analyzovať, akými ukazovateľmi sa budú vyznačovať a v akých dimenziách je vhodné ich vidieť, t.j. vytvoriť analytický model.

Základné koncepty, na ktorých fungujú technológie OLAP, sú nasledovné:

Viacrozmernosť

Aby sme pochopili viacrozmernosť údajov, mali by sme najprv predložiť tabuľku zobrazujúcu napríklad výkonnosť podnikových nákladov podľa ekonomických prvkov a obchodných jednotiek.

Tieto údaje sú prezentované v dvoch dimenziách:

  • článok
  • obchodná jednotka

Táto tabuľka nie je informatívna, pretože zobrazuje predaje za určité časové obdobie. Pre rôzne časové obdobia budú musieť analytici porovnať niekoľko tabuliek (pre každé časové obdobie):

Obrázok ukazuje 3. dimenziu, čas, okrem prvých dvoch. (článok, obchodná jednotka)

Ďalším spôsobom, ako zobraziť viacrozmerné údaje, je znázorniť ich vo forme kocky:

Kocky OLAP umožňujú analytikom získať údaje v rôznych častiach, aby odpovedali na otázky, ktoré si firma kladie:

  • Ktoré náklady sú rozhodujúce v ktorých obchodných jednotkách?
  • Ako sa menia jednotkové náklady v čase?
  • Ako sa menia nákladové položky v čase?

Odpovede na takéto otázky sú nevyhnutné pre rozhodovanie manažmentu: o znižovaní niektorých nákladových položiek, ovplyvňovaní ich štruktúry, zisťovaní príčin zmien nákladov v čase, odchýlok od plánu a ich odstraňovaní – optimalizácii ich štruktúry.

V tomto príklade sa berú do úvahy iba 3 dimenzie. Je ťažké reprezentovať viac ako 3 dimenzie, ale funguje to rovnako ako v prípade 3 dimenzií.

Aplikácie OLAP vám zvyčajne umožňujú prijímať údaje o 3 alebo viacerých dimenziách, napríklad môžete pridať ďalšiu dimenziu – plán-akt, kategória nákladov: priama, nepriama, podľa objednávok, podľa mesiacov. Ďalšie dimenzie vám umožňujú získať viac analytických rezov a poskytnúť odpovede na otázky s viacerými podmienkami.

Hierarchia

OLAP tiež umožňuje analytikom organizovať každú dimenziu do hierarchie skupín a podskupín a súčtov, ktoré odrážajú metriku v rámci organizácie – najlogickejší spôsob analýzy podniku.

Odporúča sa napríklad hierarchicky zoskupiť náklady:

OLAP umožňuje analytikom získať údaje o celkovom súhrne (v skutočnosti špičková úroveň), a potom prejdite na najnižšiu a nasledujúcu úroveň, a tak zistíte presný dôvod zmeny ukazovateľa.

Tým, že analytici môžu používať viacero dimenzií v dátovej kocke s možnosťou hierarchicky zostavených dimenzií, OLAP vám umožňuje získať obraz o podnikaní, ktorý nie je komprimovaný štruktúrou informačného skladu.

Zmena smeru analýzy v kocke (rotácia údajov)

Spravidla pracujú s pojmami: rozmery uvedené v stĺpcoch, riadkoch (môže ich byť niekoľko), zvyšok tvoria plátky, obsah tabuľky rozmerov formulára (tržby, náklady, hotovosť)

OLAP vám spravidla umožňuje zmeniť orientáciu rozmerov kocky, čím sa údaje prezentujú v rôznych zobrazeniach.

Zobrazenie údajov kocky závisí od:

  • orientácie rozmerov: ktoré rozmery sú špecifikované v riadkoch, stĺpcoch, výrezoch;
  • skupiny indikátorov zvýraznené v riadkoch, stĺpcoch, výrezoch.
  • Zmena meraní je v rámci činností používateľa.

OLAP vám teda umožňuje vykonávať rôzne typy analýz a porozumieť ich vzťahom s ich výsledkami.

  • Analýza odchýlok - analýza plnenia plánu, ktorá je doplnená o faktorovú analýzu príčin odchýlok s podrobným rozpisom ukazovateľov.
  • Analýza závislostí: OLAP vám umožňuje identifikovať rôzne závislosti medzi rôznymi zmenami, napríklad keď bolo pivo odstránené zo sortimentu, počas prvých dvoch mesiacov sa zistil pokles predaja plotíc.
  • Mapovanie ( komparatívna analýza). Porovnanie výsledkov zmeny ukazovateľa v čase, pre danú skupinu tovarov, v rôznych regiónoch a pod.
  • Analýza dynamiky vám umožňuje identifikovať určité trendy v zmene ukazovateľov v čase.

Efektívnosť: môžeme povedať, že OLAP je založený na zákonoch psychológie: schopnosti spracovávať požiadavky na informácie v „reálnom čase“ – v tempe procesu analytického chápania údajov používateľom.

Ak dokážete prečítať asi 200 záznamov za sekundu z relačnej databázy a zapísať 20, potom dobrý server OLAP dokáže pomocou vypočítaných riadkov a stĺpcov konsolidovať 20 000 až 30 000 buniek (ekvivalent jedného záznamu v relačnej databáze) za sekundu.

viditeľnosť: Treba zdôrazniť, že OLAP poskytuje pokročilé nástroje grafické znázornenieúdaje koncovému užívateľovi. Ľudský mozog je schopný vnímať a analyzovať informácie, ktoré sú prezentované vo forme geometrických obrazov, v objeme niekoľko rádov väčšom ako informácie prezentované v alfanumerickej forme. Príklad: Predpokladajme, že na jednej zo sto fotografií potrebujete nájsť známu tvár. Verím, že tento proces vám nezaberie viac ako minútu. Teraz si predstavte, že namiesto fotografií vám ponúknu sto slovných opisov tých istých osôb. Myslím si, že navrhovaný problém sa vám vôbec nepodarí vyriešiť.

Jednoduchosť : Hlavná prednosť týchto technológií je, že sú zamerané na použitie nie odborníkom na informačné technológie, nie odborným štatistikom, ale odborníkom v aplikovanej oblasti - manažérom úverového oddelenia, manažérom rozpočtového oddelenia a napokon, riaditeľ. Sú určené na to, aby analytik komunikoval s problémom, nie s počítačom..

Napriek veľkým možnostiam OLAP (okrem toho ide o pomerne starú myšlienku - 60. roky) sa v našich podnikoch prakticky nepoužíva. prečo?

  • informácie chýbajú alebo možnosti nie sú jasné
  • zvyk myslieť v dvoch dimenziách
  • cenová bariéra
  • nadmerná vyrobiteľnosť článkov venovaných OLAP: neznáme výrazy odstrašujú - OLAP, "vykopávanie a časti údajov", "ad hoc dotazy", "identifikácia významných korelácií"

Náš a západný prístup k aplikácii OLAP

Okrem toho máme špecifické chápanie aplikačnej užitočnosti OLAP, aj keď rozumieme jeho technologickým možnostiam.

Naši a ruskí autori rôznych materiálov venovaných OLAP vyjadrujú v súvislosti s užitočnosťou OLAP nasledovný názor: väčšina vníma OLAP ako nástroj, ktorý vám umožňuje jednoducho a pohodlne rozširovať a zbaľovať údaje a vykonávať manipulácie, ktoré vám napadnú. analytik v procese analýzy. Čím viac „výrezov“ a „výrezov“ údajov analytik vidí, tým viac má nápadov, ktoré si zase vyžadujú stále viac „výrezov“ na overenie. nie je to správne.

Základom západného chápania užitočnosti OLAP je metodologický model analýzy, ktorý musí byť stanovený pri navrhovaní riešení OLAP. Analytik by sa nemal hrať s OLAP kockou a bezcieľne meniť jej rozmery a úrovne detailov, orientáciu údajov, grafické zobrazenie údajov (a to naozaj chce!), ale jasne pochopiť, aké zobrazenia potrebuje, v akom poradí a prečo (samozrejme môžu tam byť prvky „objavy“, ale to nie je základný prvok užitočnosti OLAP).

Použitie aplikácie OLAP

  • Rozpočet
  • Tok financií

Jedna z najúrodnejších oblastí použitia technológií OLAP. Žiaden za nič moderný systém zostavovanie rozpočtu sa nepovažuje za úplné bez prítomnosti súboru nástrojov OLAP na analýzu rozpočtu v jeho zložení. Väčšina správ o rozpočte sa dá ľahko zostaviť na základe systémov OLAP. Reporty zároveň odpovedajú na veľmi širokú škálu otázok: analýza štruktúry výdavkov a príjmov, porovnanie výdavkov na určité položky v rôznych oddeleniach, analýza dynamiky a trendov výdavkov na určité položky, analýza nákladov a zisk.

OLAP vám umožní analyzovať prílevy a odlevy finančných prostriedkov v kontexte obchodných operácií, protistrán, mien a času s cieľom optimalizovať ich toky.

  • Finančné a manažérske výkazy (s analytikami, ktoré manažment potrebuje)
  • marketing
  • Balanced Scorecard
  • Analýza ziskovosti

Ak máte príslušné údaje, môžete nájsť inú aplikáciu technológie OLAP.

OLAP produkty

V tejto časti budeme hovoriť o OLAP ako o softvérovom riešení.

Všeobecné požiadavky na produkty OLAP

Existuje mnoho spôsobov, ako implementovať aplikácie OLAP, žiadna konkrétna technológia by nemala byť povinná alebo dokonca odporúčaná. Za rôznych podmienok a okolností môže byť jeden prístup výhodnejší ako iný. Technika implementácie zahŕňa mnoho rôznych proprietárnych nápadov, na ktoré sú predajcovia tak hrdí: architektúry klient-server, analýza časových radov, objektová orientácia, optimalizácia ukladania dát, paralelné procesy atď. Tieto technológie však nemôžu byť súčasťou definície OLAP.

Existujú vlastnosti, ktoré musia byť dodržané pri všetkých produktoch OLAP (ak ide o produkt OLAP), čo je ideál technológie. Toto je 5 kľúčových definícií, ktoré charakterizujú OLAP (takzvaný FASMI test): Rýchla analýza zdieľaných viacrozmerných informácií.

  • Rýchlo(FAST) - znamená, že systém by mal používateľom poskytnúť väčšinu odpovedí do približne piatich sekúnd. Aj keď systém varuje, že proces bude trvať výrazne dlhšie, používatelia sa môžu rozptyľovať a stratiť myseľ, čím utrpí kvalita analýzy. Túto rýchlosť nie je ľahké dosiahnuť s veľkým množstvom údajov, najmä ak sú potrebné špeciálne výpočty za chodu. Predajcovia používajú na dosiahnutie tohto cieľa širokú škálu metód, vrátane špecializovaných foriem ukladania údajov, rozsiahlych predvýpočtov alebo sprísňujúcich hardvérových požiadaviek. V súčasnosti však neexistujú žiadne plne optimalizované riešenia. Na prvý pohľad sa môže zdať prekvapujúce, že pri prijatí správy za minútu, čo nie je tak dávno, čo trvalo niekoľko dní, sa používateľ pri čakaní veľmi rýchlo nudí a projekt je oveľa menej úspešný ako v prípade okamžitej odpovede, aj za cenu menej podrobnej analýzy.
  • zdieľané znamená, že systém umožňuje splniť všetky požiadavky na ochranu údajov a implementovať distribuovaný a simultánny prístup k údajom pre rôzne úrovne používateľov. Systém musí byť schopný spracovať viaceré zmeny údajov včas a bezpečne. Toto je hlavná slabina mnohých produktov OLAP, ktoré majú tendenciu predpokladať, že všetky aplikácie OLAP vyžadujú iba na čítanie, a poskytujú zjednodušenú ochranu.
  • Viacrozmerný je kľúčovou požiadavkou. Ak by bolo potrebné definovať OLAP jedným slovom, bol by zvolený. Systém by mal poskytovať viacrozmernú koncepčnú reprezentáciu údajov vrátane plná podpora pre hierarchie a viaceré hierarchie, pretože to určuje najlogickejší spôsob analýzy podniku. Neexistuje žiadny minimálny počet rozmerov, ktoré sa musia spracovať, pretože to závisí aj od aplikácie a väčšina produktov OLAP má dostatok rozmerov pre trhy, na ktoré sa zameriavajú. Opäť nešpecifikujeme, ktorá základná databázová technológia by sa mala použiť, ak má používateľ získať skutočne viacrozmernú koncepčnú reprezentáciu informácií. Táto funkcia je srdcom OLAP
  • Informácie. Potrebné informácie je potrebné získať tam, kde sú potrebné, bez ohľadu na ich objem a umiestnenie. Veľa však závisí od aplikácie. Sila rôznych produktov sa meria podľa toho, koľko vstupu dokážu spracovať, nie podľa toho, koľko gigabajtov dokážu uložiť. Sila produktov sa veľmi líši – najväčšie produkty OLAP dokážu spracovať najmenej tisíckrát viac údajov ako tie najmenšie. V tejto súvislosti je potrebné zvážiť mnoho faktorov vrátane duplikácie údajov, požadovanej pamäte RAM, využitia miesta na disku, výkonu, integrácie s úložiskami informácií atď.
  • Analýza znamená, že systém dokáže spracovať akúkoľvek logickú a štatistickú analýzu špecifickú pre danú aplikáciu a zabezpečuje, že je uchovávaná vo forme dostupnej pre koncového používateľa. Používateľ by mal byť schopný definovať nové špeciálne výpočty ako súčasť analýzy bez potreby programovania. To znamená, že všetky požadované analytické funkcie musia byť poskytované koncovým používateľom intuitívnym spôsobom. Analytické nástroje môžu zahŕňať určité postupy, ako je analýza časových radov, rozdelenie nákladov, menové prevody, cielenie atď. Takéto možnosti sa medzi produktmi značne líšia v závislosti od zamerania cieľa.

Inými slovami, týchto 5 kľúčových definícií sú ciele, na dosiahnutie ktorých sú produkty OLAP navrhnuté.

Technologické aspekty OLAP

Systém OLAP obsahuje určité komponenty. Pre ich prácu existujú rôzne schémy, ktoré môže konkrétny produkt implementovať.

Komponenty systémov OLAP (z čoho pozostáva systém OLAP?)

Systém OLAP zvyčajne obsahuje nasledujúce komponenty:

  • Zdroj dát
    Zdroj, z ktorého sa berú údaje na analýzu (dátový sklad, databáza prevádzkových účtovných systémov, súbor tabuliek, kombinácie vyššie uvedeného).
  • OLAP server
    Dáta zo zdroja sú prenášané alebo kopírované na OLAP server, kde sú systematizované a pripravené na rýchlejšie generovanie odpovedí na dotazy.
  • OLAP klient
    Používateľské rozhranie k serveru OLAP, na ktorom používateľ pracuje

Upozorňujeme, že nie sú potrebné všetky komponenty. Existujú stolové OLAP systémy, ktoré vám umožňujú analyzovať dáta uložené priamo v počítači používateľa a nevyžadujú OLAP server.

Povinným prvkom je však zdroj údajov: dôležitou otázkou je dostupnosť údajov. Ak sú v akejkoľvek forme ako excelovská tabuľka, v databáze účtovného systému, vo forme štruktúrovaných reportov pobočiek, IT špecialista sa bude vedieť integrovať so systémom OLAP priamo alebo s prechodnou transformáciou. Systémy OLAP majú na to špeciálne nástroje. Ak tieto údaje nie sú k dispozícii, alebo ak im chýba úplnosť a kvalita, OLAP nepomôže. To znamená, že OLAP je iba doplnok nad dátami a ak tam nie sú, stávajú sa zbytočnou vecou.

Väčšina údajov pre aplikácie OLAP pochádza z iných systémov. V niektorých aplikáciách (napríklad na plánovanie alebo rozpočtovanie) však možno údaje vytvárať priamo v aplikáciách OLAP. Keď údaje pochádzajú z iných aplikácií, zvyčajne je potrebné, aby boli údaje uložené v samostatnom duplicitnom formulári pre aplikáciu OLAP. Preto je vhodné vytvárať dátové sklady.

Treba si uvedomiť, že pojem „OLAP“ je nerozlučne spojený s pojmom „dátový sklad“ (Data Warehouse). Dátový sklad je doménovo špecifický, časovo ohraničený, nemenný súbor údajov na podporu rozhodovania manažmentu. Údaje v úložisku pochádzajú z operačných systémov(OLTP systémy), ktoré sú určené na automatizáciu obchodných procesov, je možné úložisko dopĺňať z externých zdrojov, ako sú štatistické výkazy.

Napriek tomu, že obsahujú zjavne nadbytočné informácie, ktoré sa už nachádzajú v databázach alebo súboroch operačných systémov, dátové úložiská sú potrebné, pretože:

  • fragmentácia údajov, ich ukladanie vo formátoch rôznych DBMS;
  • zlepšený výkon pri získavaní údajov
  • ak podnik ukladá všetky údaje na centrálny databázový server (čo je extrémne zriedkavé), analytik pravdepodobne nebude rozumieť ich zložitým, niekedy mätúcim štruktúram
  • komplexné analytické dopyty na prevádzkové informácie spomaľujú súčasnú prácu spoločnosti, blokujú tabuľky na dlhú dobu a zaberajú zdroje servera
  • schopnosť vyčistiť a zosúladiť údaje
  • je nemožné alebo veľmi ťažké priamo analyzovať údaje operačných systémov;

Úlohou úložiska je poskytnúť „surovinu“ na analýzu na jednom mieste a v jednoduchej, zrozumiteľnej štruktúre. To znamená, že koncept dátových skladov nie je konceptom analýzy dát, ale skôr konceptom prípravy dát na analýzu. Zahŕňa implementáciu jedného integrovaného zdroja údajov.

Produkty OLAP: architektúry

Pri používaní produktov OLAP sú dôležité 2 otázky: ako a kde zachovať a rukoväťúdajov. V závislosti od spôsobu implementácie týchto 2 procesov sa rozlišujú architektúry OLAP. Existujú 3 spôsoby ukladania údajov pre OLAP a 3 spôsoby spracovania týchto údajov. Mnoho výrobcov ponúka viacero možností, niektorí sa snažia dokázať, že ich prístup je ten jediný najrozumnejší. To je, samozrejme, absurdné. Len veľmi málo produktov však môže kvalitatívne fungovať vo viac ako jednom režime.

Možnosti úložiska OLAP

Ukladanie v tomto kontexte znamená udržiavanie údajov v neustále aktualizovanom stave.

  • Relačné databázy: Toto je typická voľba, ak váš podnik ukladá poverenia v RDB. Vo väčšine prípadov by mali byť údaje uložené v denormalizovanej štruktúre (najvhodnejšia je hviezdicová schéma). Normalizovaná databáza je neprijateľná z dôvodu veľmi slabého výkonu dotazov pri generovaní agregovaných hodnôt pre OLAP (často sú sumárne údaje uložené v agregovaných tabuľkách).
  • Databázové súbory zapnuté klientsky počítač(kiosky alebo dátové obchody): Tieto údaje môžu byť vopred distribuované alebo vytvorené na požiadanie na klientskych počítačoch.

Viacrozmerné databázy: Predpokladá, že údaje sú uložené vo viacrozmernej databáze na serveri. Môže zahŕňať údaje extrahované a zhrnuté z iných systémov a relačných databáz, súbory koncových používateľov atď. Vo väčšine prípadov sú multidimenzionálne databázy uložené na disku, ale niektoré produkty umožňujú použitie aj pamäte RAM, pričom najčastejšie používané údaje počítajú na lietať." Len veľmi málo produktov založených na multidimenzionálnych databázach umožňuje viacnásobnú úpravu údajov, mnohé produkty umožňujú jednu úpravu, ale viacnásobné čítanie údajov, zatiaľ čo iné sú obmedzené len na čítanie.

Tieto tri úložné miesta majú rôzne úložné kapacity a sú usporiadané v zostupnom poradí podľa kapacity. Majú tiež odlišné charakteristiky výkonu dotazov: relačné databázy sú oveľa pomalšie ako posledné dve možnosti.

Možnosti spracovania údajov OLAP

Existujú 3 rovnaké možnosti spracovania údajov:

  • Použitie SQL: Táto možnosť sa samozrejme používa pri ukladaní údajov do RDB. SQL však neumožňuje vykonávať viacrozmerné výpočty v jedinom dotaze, takže sú potrebné zložité dotazy SQL, aby sa nedosiahlo nič viac, ako zvyčajná viacrozmerná funkčnosť. To však vývojárom nebráni v pokusoch. Vo väčšine prípadov vykonávajú obmedzený počet zodpovedajúcich výpočtov SQL s výsledkami, ktoré možno získať z viacrozmerného spracovania údajov alebo z klientskeho počítača. Je tiež možné použiť Náhodný vstup do pamäťe, ktorý dokáže ukladať dáta pomocou viac ako jednej požiadavky: táto dramaticky vylepšená odpoveď.
  • Viacrozmerné spracovanie na strane klienta: Produkt OLAP na strane klienta robí výpočty sám, ale toto spracovanie je k dispozícii len vtedy, ak majú používatelia relatívne výkonné počítače.

Serverové viacrozmerné spracovanie: Toto je obľúbené miesto na vykonávanie viacrozmerných výpočtov v aplikáciách OLAP klient-server a používa sa v mnohých produktoch. Výkon je zvyčajne vysoký, pretože väčšina výpočtov už bola vykonaná. To si však vyžaduje veľa miesta na disku.

Matica architektúr OLAP

V súlade s tým môžete kombináciou možností ukladania / spracovania získať maticu architektúr pre systémy OLAP. Teoreticky teda môže existovať 9 kombinácií týchto metód. Keďže však 3 z nich nemajú zdravý rozum, v skutočnosti existuje iba 6 možností na ukladanie a spracovanie údajov OLAP.

Viacrozmerné možnosti ukladania
údajov

možnosti
viacrozmerný
spracovanie dát

Relačná databáza

Multidimenzionálna databáza na strane servera

Klientsky počítač

Cartesis Magnitude

Multidimenzionálne serverové spracovanie

Crystal Holos (režim ROLAP)

Server IBM DB2 OLAP

CA EUREKA:Stratégia

Informix MetaCube

Speedware Media/MR

Analytické služby spoločnosti Microsoft

Oracle Express (režim ROLAP)

Server pilotnej analýzy

Aplikujte iTM1

Crystal Holos

Rozhodnutie Comshare

Hyperion Essbase

Oracle Express

Speedware Media/M

Analytické služby spoločnosti Microsoft

PowerPlay Enterprise Server

Server pilotnej analýzy

Aplikujte iTM1

Viacrozmerné spracovanie na klientskom počítači

Oracle Discoverer

Informix MetaCube

Rozmerový pohľad

Hyperion Enterprise

Cognos PowerPlay

Osobný expres

Perspektívy iTM1

Keďže spracovanie určuje úložisko, je zvykom zoskupovať podľa možností úložiska, to znamená:

  • Produkty ROLAP v sektoroch 1, 2, 3
  • Desktop OLAP - v sektore 6

Produkty MOLAP – v sektoroch 4 a 5

Produkty HOLAP (umožňujúce možnosti multidimenzionálneho aj relačného ukladania dát) - v 2 a 4 (zvýraznené kurzívou)

Kategórie produktov OLAP

Existuje viac ako 40 predajcov OLAP, aj keď nie všetkých možno považovať za konkurentov, pretože ich schopnosti sú veľmi odlišné a v skutočnosti pôsobia v rôznych segmentoch trhu. Možno ich zoskupiť do 4 základných kategórií, ktorých rozdiely sú založené na pojmoch: funkčnosť je zložitá - funkčnosť je jednoduchá, výkon - miesto na disku. Je vhodné nakresliť kategórie vo forme štvorca, pretože jasne ukazuje vzťahy medzi nimi. Charakteristický znak každej z kategórií je uvedený na jej strane a podobnosti s ostatnými - na susedných stranách, preto sú kategórie na opačných stranách zásadne odlišné.

Zvláštnosti

Výhody

Nedostatky

zástupcovia

Aplikovaný OLAP

Kompletné aplikácie s bohatou funkčnosťou. Takmer všetky vyžadujú multidimenzionálnu databázu, hoci niektoré pracujú aj s relačná. Mnohé z tejto kategórie aplikácií sú špecializované, ako napríklad predaj, výroba, bankovníctvo, rozpočtovanie, finančná konsolidácia, analýza predaja

Schopnosť integrácie s rôznymi aplikáciami

Vysoká úroveň funkčnosti

Vysoká úroveň flexibility a škálovateľnosti

Zložitosť aplikácie (potreba školenia používateľov)

Vysoká cena

Hyperion Solutions

Krištáľové rozhodnutia

Tvorcovia informácií

Produkt je založený na nerelačnej dátovej štruktúre, ktorá poskytuje viacrozmerné ukladanie, spracovanie a prezentáciu dát. Údaje v procese analýzy sa vyberajú výlučne z viacrozmernej štruktúry. Napriek vysokej miere otvorenosti dodávatelia presviedčajú nákupcov, aby si kúpili vlastné nástroje

Vysoký výkon (rýchly výpočet súhrnných ukazovateľov a rôzne viacrozmerné transformácie pre ktorúkoľvek z dimenzií). Priemerný čas odozvy na analytický dotaz ad hoc pri použití viacrozmernej databázy je zvyčajne o 1 až 2 rády kratší ako v prípade RDB.

Vysoká úroveň otvorenosti: veľké množstvo produktov, s ktorými je možná integrácia

Ľahko sa vysporiadajte s úlohami zahrnutia rôznych vstavaných funkcií do informačného modelu, vykonávania špecializovaných analýz používateľom atď.

Potreba veľkého miesta na disku na ukladanie dát (kvôli redundancii ukladaných dát). Ide o extrémne neefektívne využitie pamäte – v dôsledku denormalizácie a vopred vykonanej agregácie zodpovedá množstvo dát v multidimenzionálnej databáze 2,5-100-krát menšiemu množstvu pôvodných detailných dát. V každom prípade MOLAP neumožňuje pracovať s veľkými databázami. Skutočným limitom je databáza s objemom 10-25 gigabajtov

Potenciálna explózia databázy – náhle, dramatické, neúmerné zvýšenie veľkosti databázy

Nedostatok flexibility, keď je potrebné upraviť dátové štruktúry. Akákoľvek zmena v štruktúre rozmerov si takmer vždy vyžaduje úplnú reštrukturalizáciu hyperkocky.

Pre viacrozmerné databázy v súčasnosti neexistujú jednotné štandardy pre rozhranie, jazyky na popis a manipuláciu s údajmi

Hyperion (Essbase)

DOLAP (počítačový OLAP)

Produkty OLAP na strane klienta, ktoré sa relatívne ľahko implementujú a vyžadujú nízke náklady na umiestnenie

Hovoríme o takom analytickom spracovaní, kde sú hyperkocky malé, ich rozmery sú malé, potreby skromné ​​a na takéto analytické spracovanie stačí osobný počítač na pracovnej ploche.

Cieľom výrobcov na tomto trhu je automatizovať stovky a tisíce úloh, no používatelia by mali urobiť pomerne jednoduchú analýzu. Kupujúci sú často motivovaní kupovať viac pracovných miest, ako je potrebné

Dobrá integrácia s databázami: viacrozmerná, relačná

Schopnosť robiť komplexné nákupy, čo znižuje náklady na realizačné projekty

Jednoduchosť používania aplikácií

Veľmi obmedzená funkčnosť (v tomto ohľade nie je porovnateľná so špecializovanými produktmi)

Veľmi obmedzený výkon (malé objemy dát, málo meraní)

Cognos (PowerPlay)

predmety podnikania

Krištáľové rozhodnutia

Toto je najmenší sektor na trhu.

Podrobné údaje zostávajú tam, kde boli pôvodne – v relačnej databáze; niektoré agregáty sú uložené v rovnakej databáze v špeciálne vytvorených tabuľkách služieb

Schopný spracovať veľmi veľké množstvo údajov (nízkonákladové úložisko)

Poskytnite režim prevádzky pre viacerých používateľov vrátane režimu úprav a nielen čítania

Vyššia úroveň ochrany údajov a dobré možnosti diferenciácie prístupových práv

Je možné často vykonávať zmeny v štruktúre meraní (nevyžaduje fyzickú reorganizáciu databázy)

Nízky výkon, výrazná strata rýchlosti odozvy na multidimenzionálne otázky (odpoveď na zložité otázky sa meria v minútach alebo dokonca hodinách, nie v sekundách). Sú to pohodlnejšie nástroje na tvorbu zostáv ako interaktívne analytické nástroje.

Zložitosť produktov. Vyžaduje značné náklady na údržbu zo strany IT špecialistov. Na dosiahnutie výkonu porovnateľného s MOLAP vyžadujú relačné systémy starostlivý návrh databázovej schémy a vyladenie indexov, to znamená veľké úsilie zo strany správcov databáz.

Implementácia je drahá

Obmedzenia SQL zostávajú realitou a bránia implementácii mnohých vstavaných funkcií v RDBMS, ktoré sa dajú ľahko poskytnúť v systémoch založených na viacrozmernej reprezentácii údajov.

Informačná výhoda

Informix (MetaCube)

Je potrebné poznamenať, že zákazníci hybridných produktov, ktoré umožňujú výber režimu ROLAP a MOLAP, ako sú Microsoft Analysis Services, OracleExpress, Crystal Holos, IBM DB2 OLAPServer, takmer vždy volia režim MOLAP.

Každá z prezentovaných kategórií má svoje silné a slabé stránky, neexistuje jediná optimálna voľba. Výber ovplyvňuje 3 dôležité aspekty: 1) výkon; 2) diskový priestor na ukladanie dát; 3) vlastnosti, funkčnosť a najmä škálovateľnosť riešenia OLAP. Zároveň je potrebné brať do úvahy množstvo spracovávaných dát, silu technológií, potreby používateľov a hľadať kompromis medzi rýchlosťou a redundanciou diskového priestoru, ktorý zaberá databáza, jednoduchý a multifunkčný.

Klasifikácia dátových skladov podľa objemu cieľovej databázy

Nevýhody OLAP

Ako každá technológia, aj OLAP má svoje nevýhody: vysoké požiadavky na hardvér, školenia a znalosti administratívnych pracovníkov a koncových užívateľov, vysoké náklady na realizáciu implementačného projektu (peňažné aj dočasné, intelektuálne).

Výber produktu OLAP

Výber správneho produktu OLAP je náročný, ale veľmi dôležitý, ak chcete, aby projekt nezlyhal.

Ako vidíte, rozdiely medzi produktmi spočívajú v mnohých oblastiach: funkčná, architektonická, technická. Niektoré produkty majú veľmi obmedzené nastavenia. Niektoré sú určené pre špecializované oblasti: marketing, predaj, financie. Existujú produkty na všeobecné účely, ktoré nemajú aplikačné využitie, ktoré by malo byť dostatočne flexibilné. Takéto produkty sú spravidla lacnejšie ako špecializované, ale náklady na implementáciu sú vyššie. Sortiment produktov OLAP je veľmi široký – od najjednoduchších nástrojov na zostavovanie kontingenčných tabuliek a grafov, ktoré sú súčasťou kancelárskych produktov, až po nástroje na analýzu dát a vyhľadávanie vzorov, ktorých náklady sa pohybujú v desiatkach tisíc dolárov.

Ako v každej inej oblasti, ani v oblasti OLAP nemôžu existovať jednoznačné odporúčania pre výber nástrojov. Môžete sa sústrediť len na niekoľko kľúčových bodov a porovnávať ponúkané softvérové ​​funkcie s potrebami organizácie. Jedna vec je dôležitá: bez toho, aby ste dôkladne premýšľali o tom, ako budete používať nástroje OLAP, riskujete, že vás bude bolieť hlava.

V procese výberu je potrebné zvážiť dve otázky:

  • posúdiť potreby a schopnosti podniku
  • zhodnotiť aktuálnu ponuku trhu, dôležité sú aj trendy vývoja

Potom to všetko porovnajte a v skutočnosti si vyberte.

Posúdenie potrieb

Nie je možné urobiť racionálny výber produktu bez toho, aby sme pochopili, na čo sa bude používať. Mnoho spoločností chce „najlepší produkt“ bez jasného pochopenia toho, ako by sa mal používať.

Aby bol projekt úspešne zrealizovaný, musí finančný riaditeľ aspoň správne formulovať svoje priania a požiadavky vedúcemu a špecialistom automatizačnej služby. Veľa problémov vzniká v dôsledku nedostatočnej pripravenosti a informovanosti pri výbere OLAP, IT profesionáli a koncoví používatelia majú komunikačné ťažkosti len preto, že v rozhovore manipulujú s rôznymi pojmami a termínmi a uvádzajú protichodné preferencie. V rámci spoločnosti musí byť jednotný účel.

Niektoré faktory sa ukázali už po prečítaní prehľadu kategórií produktov OLAP, a to:

Technické aspekty

  • Zdroje údajov: podnikový dátový sklad, systém OLTP, tabuľkové súbory, relačné databázy. Schopnosť prepojiť nástroje OLAP so všetkými DBMS používanými v organizácii. Ako ukazuje prax, integrácia heterogénnych produktov do stabilného pracovného systému je jednou z najdôležitejších otázok a jej riešenie môže byť v niektorých prípadoch spojené s veľkými problémami. Je potrebné zistiť, aké ľahké a spoľahlivé je integrovať OLAP nástroje s existujúcimi DBMS v organizácii. Dôležité je tiež zhodnotiť možnosti integrácie nielen so zdrojmi dát, ale aj s inými aplikáciami, do ktorých možno budete potrebovať exportovať dáta: e-mail, kancelárske aplikácie
  • Variabilita údajov, ktorá sa počíta
  • Serverová platforma: NT, Unix, AS/400, Linux – ale netrvajte na tom, aby produkty špecifikované špecifikáciou OLAP fungovali na pochybných alebo umierajúcich platformách, ktoré stále používate
  • Štandardy na strane klienta a prehliadača
  • Nasaditeľná architektúra: lokálnej sieti a pripojenie PC modemom, vysokorýchlostný klient/server, intranet, extranet, internet
  • Medzinárodné funkcie: podpora viacerých mien, viacjazyčné operácie, zdieľanie údajov, lokalizácia, licencovanie, aktualizácie systému Windows

Objemy vstupných informácií, ktoré sú k dispozícii a ktoré sa objavia v budúcnosti

Používatelia

  • Rozsah použitia: analýza predaja / marketingu, rozpočtovanie / plánovanie, analýza ukazovateľov výkonnosti, analýza účtovných výkazov, kvalitatívna analýza, finančná situácia, tvorba analytických materiálov (správ)
  • Počet používateľov a ich umiestnenie, požiadavky na oddelenie prístupových práv k údajom a funkciám, utajenie (dôvernosť) informácií
  • Typ používateľa: vyšší manažment, financie, marketing, HR, predaj, výroba atď.
  • Používateľská skúsenosť. Úroveň používateľských zručností. Zvážte poskytnutie školenia. Je veľmi dôležité, aby bola klientska aplikácia OLAP navrhnutá tak, aby sa používatelia cítili sebaisto a mohli ju efektívne používať.

Kľúčové vlastnosti: potreba spätného zápisu údajov, distribuované výpočty, komplexné menové konverzie, potreby tlače zostáv, tabuľkové rozhranie, zložitosť aplikačnej logiky, požadovaná dimenzia, typy analýzy: štatistické, vyhľadávanie cieľov, analýza „čo keby“

Implementácia

  • Kto bude implementovať a prevádzkovať: externí konzultanti, interní IT alebo koncoví používatelia
  • Rozpočet: softvér, hardvér, služby, prenos dát. Pamätajte, že platba za licencie na produkt OLAP je len malou časťou celkových nákladov na projekt. Náklady na implementáciu a hardvér môžu byť vyššie ako licenčné poplatky a náklady na dlhodobú podporu, údržbu a správu sú takmer určite oveľa vyššie. A ak sa nesprávne rozhodnete kúpiť nesprávny produkt len ​​preto, že je lacnejší, môžete skončiť s vyššími celkovými nákladmi na projekt v dôsledku vyšších nákladov na údržbu, správu a/alebo hardvér, zatiaľ čo pravdepodobne získate nižšiu úroveň podnikania. výhod. Pri odhadovaní celkových nákladov si nezabudnite položiť nasledujúce otázky: Aký široký je výber zdrojov na implementáciu, školenia a podporu? Je potenciálny všeobecný fond (zamestnanci, dodávatelia, konzultanti) nahor alebo nadol? Do akej miery sa dajú využiť vaše odborné skúsenosti v priemysle?

Napriek tomu, že náklady na analytické systémy sú aj dnes pomerne vysoké a metodológie a technológie na implementáciu takýchto systémov sú ešte len v plienkach, aj dnes ekonomický efekt, ktorý poskytujú, výrazne prevyšuje efekt tradičných operačných systémov.

Efekt správnej organizácie, strategického a operatívneho plánovania rozvoja podnikania je ťažké vopred odhadnúť v číslach, ale je zrejmé, že môže prevýšiť náklady na implementáciu takýchto systémov v desiatkach až stovkách. Ani jeden by sa však nemal mýliť. Efekt nezabezpečuje samotný systém, ale ľudia, ktorí s ním pracujú. Nie sú preto úplne správne deklarácie typu: „Systém Data Warehouses a OLAP technológií pomôže manažérovi robiť správne rozhodnutia.“ Moderné analytické systémy nie sú systémy umela inteligencia a nemôžu pomôcť ani brániť v rozhodnutí. Ich cieľom je poskytnúť manažérovi všetky informácie potrebné na prijatie rozhodnutia pohodlným spôsobom a včas. A aké informácie sa budú požadovať a aké rozhodnutie sa na ich základe prijme, závisí len od konkrétnej osoby, ktorá ich použije.

Zostáva len povedať, že tieto systémy môžu pomôcť vyriešiť mnohé obchodné problémy a môžu mať ďalekosiahle pozitívne účinky. Zostáva len čakať, kto si ako prvý uvedomí výhody tohto prístupu a predbehne ostatných.

Koncept technológie OLAP sformuloval Edgar Codd v roku 1993.

Táto technológia je založená na konštrukcii multidimenzionálnych súborov údajov - takzvaných kociek OLAP (nie nevyhnutne trojrozmerných, ako by sa dalo usúdiť z definície). Účelom použitia technológií OLAP je analyzovať dáta a prezentovať túto analýzu vo forme, ktorá je vhodná pre vnímanie riadiacim personálom a prijímanie rozhodnutí na základe nich.

Základné požiadavky na aplikácie pre viacrozmernú analýzu:

  • - poskytnúť používateľovi výsledky analýzy v primeranom čase (nie viac ako 5 s);
  • - viacužívateľský prístup k údajom;
  • - viacrozmerná reprezentácia údajov;
  • - možnosť prístupu k akýmkoľvek informáciám bez ohľadu na miesto ich uloženia a objem.

Systémové nástroje OLAP poskytujú možnosť triediť a vyberať údaje podľa špecifikovaných podmienok. Je možné nastaviť rôzne kvalitatívne a kvantitatívne podmienky.

Hlavným dátovým modelom používaným v mnohých nástrojoch na vytváranie a údržbu databáz - DBMS, je relačný model. Údaje v ňom sú prezentované vo forme súboru dvojrozmerných tabuliek-vzťahov spojených kľúčovými poľami. Na odstránenie duplicity, nekonzistentnosti a zníženie nákladov na prácu pri údržbe databáz sa používa formálny aparát na normalizáciu tabuliek entít. Jeho použitie je však spojené s dodatočným časom vynaloženým na generovanie odpovedí na dotazy do databáz, hoci sa ušetria pamäťové zdroje.

Viacrozmerný dátový model predstavuje skúmaný objekt vo forme viacrozmernej kocky, častejšie sa používa trojrozmerný model. Pozdĺž osí alebo plôch kocky sú vynesené merania alebo atribúty atribútov. Základnými detailmi sú výplň buniek kocky. Viacrozmerná kocka môže byť reprezentovaná kombináciou trojrozmerných kociek, aby sa uľahčilo vnímanie a prezentácia pri vytváraní reportovacích a analytických dokumentov a multimediálnych prezentácií na základe materiálov analytickej práce v systéme na podporu rozhodovania.

V rámci technológií OLAP, založených na skutočnosti, že reprezentáciu viacrozmerných údajov je možné organizovať pomocou relačných DBMS aj viacrozmerných špecializovaných nástrojov, existujú tri typy viacrozmerných systémov OLAP:

  • - viacrozmerný (Multidimenzionálny) OLAP-MOLAP;
  • - vzťahový (Relation) OLAP-ROLAP;
  • - zmiešaný alebo hybridný (Hybridný) OLAP-HOLAP.

V multidimenzionálnom DBMS sú dáta organizované nie vo forme relačných tabuliek, ale vo forme usporiadaných multidimenzionálnych polí vo forme hyperkociek, kedy všetky uložené dáta musia mať rovnakú dimenziu, čo znamená potrebu vytvoriť čo najkompletnejší základ merania. Dáta môžu byť usporiadané vo forme polykociek, v tejto možnosti sú hodnoty každého ukazovateľa uložené s vlastnou sadou meraní, spracovanie údajov je vykonávané vlastným nástrojom systému. Skladovacia štruktúra je v tomto prípade zjednodušená, pretože nie je potrebná zóna na ukladanie údajov vo viacrozmernej alebo objektovo orientovanej forme. Znížia sa obrovské mzdové náklady na vytváranie modelov a systémov na konverziu údajov z relačného modelu na objektový.

Výhody MOLAP sú:

  • - rýchlejšia reakcia na požiadavky ako pri ROLAP - strávený čas je o jeden až dva rády kratší;
  • - kvôli obmedzeniam SQL je implementácia mnohých vstavaných funkcií náročná.

Obmedzenia MOLAP zahŕňajú:

  • - relatívne malá veľkosť databáz;
  • - vďaka denormalizácii a predbežnej agregácii využívajú multidimenzionálne polia 2,5-100-krát viac pamäte ako pôvodné dáta (spotreba pamäte rastie exponenciálne s nárastom počtu rozmerov);
  • - neexistujú žiadne štandardy pre rozhranie a nástroje na manipuláciu s údajmi;
  • - Pri načítavaní údajov existujú obmedzenia.

Úsilie potrebné na vytvorenie viacrozmerných údajov sa dramaticky zvyšuje v tejto situácii prakticky neexistujú žiadne špecializované prostriedky na objektivizáciu relačného modelu údajov obsiahnutých v informačnom sklade. Čas odozvy na otázky často nemôže spĺňať požiadavky na systémy OLAP.

Výhody systémov ROLAP sú:

  • - schopnosť rýchlo analyzovať údaje priamo obsiahnuté v úložisku, pretože väčšina zdrojových databáz je relačných;
  • - pri variabilnom rozmere problému vyhráva RO-LAP, pretože nie je potrebná žiadna fyzická reorganizácia databázy;
  • - ROLAP systémy môžu využívať menej výkonné klientske stanice a servery a servery nesú hlavnú ťarchu spracovania zložitých SQL dotazov;
  • - úroveň ochrany informácií a diferenciácie prístupových práv v relačných DBMS je neporovnateľne vyššia ako v multidimenzionálnych.

Nevýhodou systémov ROLAP je nižší výkon, potreba starostlivého štúdia databázových schém, špeciálne ladenie indexov, analýza štatistík dotazov a zohľadnenie záverov analýzy pri úprave databázových schém, čo vedie k výrazným dodatočným mzdovým nákladom.

Splnenie týchto podmienok umožňuje pri používaní systémov ROLAP dosahovať ukazovatele podobné systémom MOLAP z hľadiska prístupového času, ako aj prekonávať úsporu pamäte.

Hybridné OLAP systémy sú kombináciou nástrojov, ktoré implementujú relačný a multidimenzionálny dátový model. To vám umožňuje výrazne znížiť náklady na zdroje na vytvorenie a údržbu takéhoto modelu, čas odozvy na požiadavky.

Tento prístup využíva výhody prvých dvoch prístupov a kompenzuje ich nedostatky. Tento princíp je implementovaný v najrozvinutejších softvérových produktoch tohto účelu.

Použitie hybridnej architektúry v systémoch OLAP je najprijateľnejším spôsobom riešenia problémov spojených s používaním softvérových nástrojov v multidimenzionálnej analýze.

Režim detekcie vzoru je založený na inteligentnom spracovaní údajov. Hlavnou úlohou je tu identifikovať zákonitosti v skúmaných procesoch, vzťahy a vzájomné ovplyvňovanie rôznych faktorov, hľadanie veľkých „nezvyčajných“ odchýlok a prognózovanie priebehu rôznych významných procesov. Táto oblasť patrí do data miningu.

Koncept multidimenzionálnej analýzy dát úzko súvisí s operačnou analýzou, ktorá sa vykonáva pomocou systémov OLAP.

OLAP (On-Line Analytical Processing) je technológia pre online analytické spracovanie dát, ktorá využíva metódy a nástroje na zber, ukladanie a analýzu multidimenzionálnych dát na podporu rozhodovacích procesov.

Hlavným účelom systémov OLAP je podpora analytické činnosti, svojvoľné (často sa používa termín ad-hoc) požiadavky používateľov analytikov. Účelom analýzy OLAP je testovať vznikajúce hypotézy.

Pri počiatkoch technológie OLAP je zakladateľ relačného prístupu E. Codd. V roku 1993 publikoval článok s názvom „OLAP pre používateľov analytikov: Čo by malo byť“. Tento dokument načrtáva základné koncepty online analytického spracovania a identifikuje nasledujúcich 12 požiadaviek, ktoré musia spĺňať produkty, ktoré umožňujú online analytické spracovanie. Tokmakov G.P. Databáza. Databázový koncept, relačný dátový model, jazyky SQL. S. 51

Nižšie je uvedených 12 pravidiel, ktoré Codd načrtol a ktoré definujú OLAP.

1. Multidimenzionálnosť – OLAP-systém na koncepčnej úrovni by mal prezentovať dáta vo forme multidimenzionálneho modelu, ktorý zjednodušuje procesy analýzy a vnímania informácií.

2. Transparentnosť – OLAP systém by mal pred používateľom skrývať skutočnú implementáciu multidimenzionálneho modelu, spôsob organizácie, zdroje, nástroje na spracovanie a ukladanie.

3. Dostupnosť -- OLAP systém musí používateľovi poskytnúť jediný, konzistentný a konzistentný dátový model, ktorý umožní prístup k dátam bez ohľadu na to, ako alebo kde sú uložené.

4. Konzistentný výkon pri vývoji správ -- Výkonnosť systémov OLAP by sa nemala výrazne znižovať so zvyšujúcim sa počtom analyzovaných dimenzií.

5. Architektúra klient-server -- OLAP systém musí byť schopný pracovať v prostredí klient-server, ako väčšina údajov, ktoré sa dnes musia podrobiť online analytickému spracovaniu, sa uchováva distribuovane. Hlavnou myšlienkou je, že serverová súčasť nástroja OLAP by mala byť dostatočne inteligentná, aby umožnila vytvorenie spoločnej koncepčnej schémy založenej na zovšeobecnení a konsolidácii rôznych logických a fyzických podnikových databázových schém s cieľom poskytnúť transparentný efekt.

6. Rovnosť rozmerov -- Systém OLAP musí podporovať viacrozmerný model, v ktorom sú všetky rozmery rovnaké. Ak je to nevyhnutné doplnkové vlastnosti môže byť udelená jednotlivým dimenziám, ale táto možnosť musí byť poskytnutá akejkoľvek dimenzii.

7. Dynamické ovládanie riedke matice -- Systém OLAP musí poskytovať optimálne zaobchádzanie s riedkymi maticami. Rýchlosť prístupu musí byť zachovaná bez ohľadu na umiestnenie dátových buniek a musí byť konštantnou hodnotou pre modely s rôznym počtom rozmerov a rôznym stupňom riedkosti dát.

8. Podpora pre viacužívateľský režim – OLAP-systém by mal poskytovať možnosť pracovať s viacerými používateľmi spolu s jedným analytickým modelom alebo pre nich vytvárať rôzne modely z jedného dáta. Zároveň je možné čítať aj zapisovať dáta, takže systém musí zabezpečiť ich integritu a bezpečnosť.

9. Neobmedzené krížové operácie -- OLAP systém musí zabezpečiť, aby funkčné vzťahy opísané pomocou určitého formálneho jazyka medzi bunkami hyperkocky boli zachované pri vykonávaní akýchkoľvek operácií rezu, rotácie, konsolidácie alebo hĺbkovej analýzy. Systém by mal nezávisle (automaticky) vykonávať transformáciu vytvorených vzťahov bez toho, aby ich používateľ musel predefinovať.

10. Intuitívna manipulácia s údajmi -- OLAP systém by mal poskytovať spôsob, ako vykonávať operácie rozdeľovania, otáčania, konsolidácie a vŕtania na hyperkocke bez toho, aby používateľ musel robiť veľa práce s používateľským rozhraním. Rozmery definované v analytickom modeli musia obsahovať všetky potrebné informácie na vykonanie vyššie uvedených operácií.

11. Flexibilné možnosti podávania správ -- OLAP systém musí podporovať rôznymi spôsobmi vizualizácia dát, t.j. správy by sa mali predkladať vo všetkých možných smeroch. Nástroje na podávanie správ by mali reprezentovať syntetizované údaje alebo informácie vyplývajúce z dátového modelu v akejkoľvek možnej orientácii. To znamená, že riadky, stĺpce alebo strany by mali súčasne zobrazovať 0 až N rozmerov, kde N je počet rozmerov celého analytického modelu. Okrem toho každá dimenzia obsahu zobrazená v jednom príspevku, stĺpci alebo stránke musí umožňovať zobrazenie akejkoľvek podmnožiny prvkov (hodnôt) obsiahnutých v dimenzii v ľubovoľnom poradí.

12. Neobmedzená dimenzionalita a počet úrovní agregácie - Štúdia o možnom počte požadovaných dimenzií v analytickom modeli ukázala, že súčasne je možné použiť až 19 dimenzií. Preto dôrazné odporúčanie, aby analytický nástroj bol schopný poskytnúť aspoň 15 a najlepšie 20 meraní súčasne. Okrem toho by každá zo spoločných dimenzií nemala byť obmedzená počtom úrovní agregácie a konsolidácie definovaných užívateľom-analytikom.

Dodatočné pravidlá Codd.

Súbor týchto požiadaviek, ktoré slúžili ako de facto definícia OLAP, pomerne často vyvoláva rôzne kritiky, napríklad pravidlá 1, 2, 3, 6 sú požiadavky a pravidlá 10, 11 sú neformalizované želania. Tokmakov G.P. Databáza. Databázový koncept, relačný dátový model, jazyky SQL. S. 68 Uvedených 12 požiadaviek Codd vám teda neumožňuje presne definovať OLAP. V roku 1995 Codd pridal do zoznamu nasledujúcich šesť pravidiel:

13. Dávková extrakcia vs. interpretácia -- OLAP systém musí byť rovnako účinný pri poskytovaní prístupu k interným aj externým údajom.

14. Podpora všetkých modelov analýzy OLAP -- Systém OLAP musí podporovať všetky štyri modely analýzy údajov definované Coddom: kategorické, interpretačné, špekulatívne a stereotypné.

15. Zaobchádzanie s denormalizovanými údajmi -- Systém OLAP musí byť integrovaný s denormalizovanými zdrojmi údajov. Úpravy údajov vykonané v prostredí OLAP by nemali viesť k zmenám údajov uložených v pôvodných externých systémoch.

16. Ukladanie výsledkov OLAP: ich oddelenie od pôvodných údajov -- Systém OLAP pracujúci v režime čítania a zápisu musí po úprave pôvodných údajov uložiť výsledky oddelene. Inými slovami, bezpečnosť zdrojových údajov je zabezpečená.

17. Vylúčenie chýbajúcich hodnôt -- Pri prezentovaní údajov používateľovi musí systém OLAP zahodiť všetky chýbajúce hodnoty. Inými slovami, chýbajúce hodnoty sa musia líšiť od hodnôt null.

18 Spracovanie chýbajúcich hodnôt -- OLAP systém musí ignorovať všetky chýbajúce hodnoty bez ohľadu na ich zdroj. Táto funkcia súvisí so 17. pravidlom.

Okrem toho Codd porušil všetkých 18 pravidiel do nasledujúcich štyroch skupín a nazval ich funkciami. Tieto skupiny boli pomenované B, S, R a D.

Medzi hlavné vlastnosti (B) patria nasledujúce pravidlá:

Viacrozmerná koncepčná reprezentácia údajov (pravidlo 1);

Intuitívna manipulácia s údajmi (pravidlo 10);

Dostupnosť (pravidlo 3);

Dávková extrakcia verzus interpretácia (pravidlo 13);

Podpora pre všetky modely analýzy OLAP (pravidlo 14);

Architektúra "klient-server" (pravidlo 5);

Transparentnosť (pravidlo 2);

Podpora pre viacerých hráčov (pravidlo 8)

Špeciálne vlastnosti (S):

Spracovanie nenormalizovaných údajov (pravidlo 15);

Ukladanie výsledkov OLAP: ich ukladanie oddelene od pôvodných údajov (pravidlo 16);

Vylúčenie chýbajúcich hodnôt (pravidlo 17);

Spracovanie chýbajúcich hodnôt (pravidlo 18). Funkcie prehľadov (R):

Flexibilita generovania správ (pravidlo 11);

Správa o štandarde výkonnosti (pravidlo 4);

Automatické nastavenie fyzická vrstva(upravené pôvodné pravidlo 7).

Kontrola merania (D):

Univerzálnosť meraní (pravidlo 6);

Neobmedzený počet dimenzií a úrovní agregácie (pravidlo 12);

Neobmedzené operácie medzi dimenziami (pravidlo 9).

Online analytické spracovanie alebo OLAP je efektívna technológia spracovania údajov, ktorej výsledkom sú súhrnné informácie založené na obrovských poliach všetkých druhov údajov. Je to výkonný produkt, ktorý vám pomáha pristupovať, extrahovať a prezerať informácie na počítači a analyzovať ich z rôznych perspektív.

OLAP je nástroj, ktorý poskytuje strategickú pozíciu pre dlhodobé plánovanie a zohľadňuje základné informácie o prevádzkových údajoch na obdobie 5, 10 alebo viac rokov. Dáta sú uložené v databáze s dimenziou, ktorá je ich atribútom. Používatelia môžu zobraziť rovnakú množinu údajov s rôznymi atribútmi v závislosti od účelu analýzy.

História OLAP

OLAP nie je nový koncept a používa sa už desaťročia. V skutočnosti boli počiatky technológie vysledované už v roku 1962. Tento termín však zaviedol až v roku 1993 autor databázy Ted Codd, ktorý tiež stanovil 12 pravidiel pre produkt. Rovnako ako mnoho iných aplikácií, aj tento koncept prešiel niekoľkými fázami vývoja.

História samotnej technológie OLAP siaha až do roku 1970, kedy boli vydané informačné zdroje Express a prvý server Olap. V roku 1995 ich získala spoločnosť Oracle a následne sa stali základom online analytického spracovania viacrozmerného výpočtového enginu, ktorý známa počítačová značka poskytovala vo svojej databáze. V roku 1992 spoločnosť Arbor Software (získaná spoločnosťou Oracle v roku 2007) vydala ďalší slávny online analytický produkt, Essbase.

V roku 1998 spoločnosť Microsoft vydala MS Analysis Services, online server na spracovanie analytických údajov. To prispelo k popularite technológie a podnietilo vývoj ďalších produktov. V súčasnosti existuje niekoľko svetovo uznávaných predajcov, ktorí ponúkajú aplikácie Olap, vrátane IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.

Online analytické spracovanie

OLAP je nástroj, ktorý vám umožňuje rozhodovať o plánovaných udalostiach. Atypický výpočet Olap môže byť zložitejší ako len agregácia údajov. Analytické požiadavky za minútu (AQM) sa používajú ako štandardný benchmark na porovnanie výkonnosti rôznych nástrojov. Tieto systémy by mali používateľov čo najviac skryť pred komplexnou syntaxou dotazov a poskytnúť konzistentné časy odozvy pre každého (bez ohľadu na to, aké zložité sú).

Existujú nasledujúce hlavné charakteristiky OLAP:

  1. Viacrozmerné reprezentácie údajov.
  2. Podpora zložitých výpočtov.
  3. Dočasná inteligencia.

Viacrozmerné zobrazenie poskytuje základ pre analytické spracovanie prostredníctvom flexibilného prístupu k podnikovým dátam. Umožňuje používateľom analyzovať údaje v akejkoľvek dimenzii a na akejkoľvek úrovni agregácie.

Podpora zložitých výpočtov je základom softvéru OLAP.

Časová inteligencia sa používa na vyhodnotenie výkonu akejkoľvek analytickej aplikácie počas určitého časového obdobia. Napríklad tento mesiac v porovnaní s minulým mesiacom, tento mesiac v porovnaní s rovnakým mesiacom minulého roka.

Viacrozmerná dátová štruktúra

Jednou z hlavných charakteristík online analytického spracovania je viacrozmerná dátová štruktúra. Kocka môže mať viacero rozmerov. Vďaka tomuto modelu je celý proces inteligentnej analýzy OLAP pre manažérov a vedúcich pracovníkov jednoduchý, pretože objekty reprezentované v bunkách sú obchodné objekty skutočného sveta. Tento dátový model navyše umožňuje používateľom spracovávať nielen štruktúrované polia, ale aj neštruktúrované a pološtruktúrované. To všetko ich robí obzvlášť populárnymi pre analýzu dát a aplikácie BI.

Hlavné vlastnosti OLAP systémov:

  1. Využívať viacrozmerné metódy analýzy údajov.
  2. Poskytnite rozšírenú databázovú podporu.
  3. Vytvárajte ľahko použiteľné rozhrania pre koncových používateľov.
  4. Podpora architektúry klient/server.

Jednou z hlavných súčastí konceptov OLAP je server na strane klienta. Okrem agregácie a predúpravaúdaje z relačnej databázy, poskytuje pokročilé možnosti výpočtu a záznamu, doplnkové funkcie, základné rozšírené funkcie dopytov a ďalšie funkcie.

V závislosti od vzorovej aplikácie zvolenej používateľom sú k dispozícii rôzne dátové modely a nástroje vrátane varovania v reálnom čase, funkcie na použitie scenárov typu „čo keby“, optimalizácie a sofistikovaných zostáv OLAP.

kubický tvar

Koncept je založený na kubickom tvare. Rozloženie údajov v ňom ukazuje, ako OLAP dodržiava princíp viacrozmernej analýzy, výsledkom čoho je dátová štruktúra navrhnutá pre rýchlu a efektívnu analýzu.

Kocka OLAP sa nazýva aj „hyperkocka“. Je opísaná ako pozostávajúca z numerických faktov (opatrení) rozdelených do faziet (dimenzií). Dimenzie sa týkajú atribútov, ktoré definujú obchodný problém. Jednoducho povedané, rozmer je označenie, ktoré popisuje mieru. Napríklad v prehľadoch predaja by mierou bol objem predaja a dimenzie by zahŕňali obdobie predaja, predajcov, produkt alebo službu a oblasť predaja. Pri podávaní správ o výrobných operáciách môžu byť mierou celkové výrobné náklady a jednotky výstupu. Rozmery budú dátum alebo čas výroby, štádium výroby alebo fáza, dokonca aj pracovníci zapojení do výrobného procesu.

Dátová kocka OLAP je základným kameňom systému. Údaje v kocke sú usporiadané pomocou hviezdy alebo schémy snehových vločiek. V strede je tabuľka faktov obsahujúca agregáty (miery). Je prepojený so sériou tabuliek rozmerov obsahujúcich informácie o opatreniach. Dimenzie popisujú, ako možno tieto miery analyzovať. Ak kocka obsahuje viac ako tri rozmery, často sa označuje ako hyperkocka.

Jednou z hlavných vlastností, ktoré ku kocke patrí, je jej statický charakter, čo znamená, že kocku nie je možné po jej návrhu meniť. Preto je proces zostavenia kocky a nastavenia dátového modelu kritickým krokom k správnemu spracovaniu dát v architektúre OLAP.

Agregácia údajov

Použitie agregácií je hlavným dôvodom, prečo sú dopyty spracovávané oveľa rýchlejšie v OLAP nástrojoch (v porovnaní s OLTP). Agregácie sú súhrny údajov, ktoré boli vopred vypočítané v čase ich spracovania. Všetky členy uložené v tabuľkách dimenzií OLAP definujú dotazy, ktoré môže kocka prijímať.

V kocke sú nahromadené informácie uložené v bunkách, ktorých súradnice sú špecifikované špecifickými veľkosťami. Počet agregácií, ktoré môže kocka obsahovať, závisí od všetkých možných kombinácií členov dimenzie. Preto typická kocka v aplikácii môže obsahovať extrémne veľký počet agregácií. Predbežný výpočet sa vykoná len pre kľúčové agregáty, ktoré sú distribuované v rámci analytickej kocky online analýzy. To výrazne skráti čas potrebný na definovanie akýchkoľvek agregácií pri spustení dotazu na dátový model.

Existujú aj dve možnosti súvisiace s agregáciou, ktoré môžete použiť na zlepšenie výkonu dokončenej kocky: vytvorte agregáciu vyrovnávacej pamäte schopností a použite agregáciu založenú na analýze dopytov používateľa.

Princíp činnosti

Analýzu prevádzkových informácií odvodených z transakcií možno zvyčajne vykonať pomocou jednoduchej tabuľky (hodnoty údajov sú prezentované v riadkoch a stĺpcoch). To je dobré vzhľadom na dvojrozmerný charakter údajov. V prípade OLAP existujú rozdiely, ktoré súvisia s viacrozmerným dátovým poľom. Keďže sa často získavajú z rôznych zdrojov, tabuľkový procesor ich nemôže vždy efektívne spracovať.

Kocka tento problém rieši a tiež udržuje dátový sklad OLAP v chode logickým a usporiadaným spôsobom. Podnik zhromažďuje údaje z mnohých zdrojov a prezentuje sa v rôznych formátoch, ako napr textové súbory, multimediálne súbory, elektronické Excelové tabuľky, základňa Prístupové údaje a dokonca aj databázy OLTP.

Všetky údaje sa zhromažďujú v úložisku naplnenom priamo zo zdrojov. V ňom budú surové informácie získané z OLTP a iných zdrojov očistené od akýchkoľvek chybných, neúplných a nekonzistentných transakcií.

Po vyčistení a transformácii sa informácie uložia do relačnej databázy. Potom sa odošle na multidimenzionálny server OLAP (alebo kocka Olap) na analýzu. Koncoví používatelia zodpovední za obchodné aplikácie, dolovanie údajov a ďalšie obchodné operácie budú mať prístup k informáciám, ktoré potrebujú, z kocky Olap.

Výhody modelu Array

OLAP je nástroj, ktorý poskytuje rýchly výkon dopytov, čo sa dosahuje optimalizovaným ukladaním, viacrozmerným indexovaním a cachovaním, ktoré patria medzi významné výhody systému. Okrem toho sú výhody:

  1. Menšia veľkosť dát na disku.
  2. Automatizovaný výpočet agregátov vyššej úrovne dát.
  3. Modely polí poskytujú prirodzené indexovanie.
  4. Efektívna extrakcia údajov sa dosiahne predbežným štruktúrovaním.
  5. Kompaktnosť pre nízkorozmerné súbory údajov.

Medzi nevýhody OLAP patrí skutočnosť, že niektoré rozhodnutia (krok spracovania) môžu byť pomerne dlhé, najmä pri veľkom množstve informácií. Toto sa zvyčajne opraví vykonaním iba prírastkového spracovania (preskúmaním údajov, ktoré sa zmenili).

Základné analytické operácie

Konvolúcia(roll-up/drill-up) je tiež známy ako „konsolidácia“. Skladanie zahŕňa zhromažďovanie všetkých údajov, ktoré je možné získať, a výpočet všetkých v jednej alebo viacerých dimenziách. Najčastejšie to môže vyžadovať použitie matematického vzorca. Ako príklad OLAP zvážte maloobchodný reťazec s predajňami v rôznych mestách. Aby bolo možné identifikovať vzory a predvídať budúce trendy predaja, sú zhrnuté zo všetkých miest do hlavného obchodného oddelenia spoločnosti na konsolidáciu a výpočet.

Zverejnenie(vŕtanie). Toto je opak skladania. Proces začína veľkým súborom údajov a potom ho rozdelí na menšie časti, čo používateľom umožňuje zobraziť podrobnosti. V príklade s maloobchodnej siete analytik bude analyzovať údaje o predaji a zobraziť jednotlivé značky alebo produkty, ktoré sa považujú za najpredávanejšie v každom z predajní v rôznych mestách.

prierez(Plátok a kocka). Ide o proces, pri ktorom analytické operácie zahŕňajú dve akcie: extrahovanie konkrétneho súboru údajov z kocky OLAP (aspekt „rozrezávania“ analýzy) a ich prezeranie z rôznych uhlov pohľadu alebo uhlov. To sa môže stať, keď sú všetky výstupné dáta prijaté a vložené do hyperkocky. Analytik vystrihne súbor údajov súvisiacich s predajom z kocky OLAP. Bude preskúmané neskôr pri analýze predaja jednotlivých jednotiek v každom regióne. Ostatní používatelia sa v tomto čase môžu zamerať na vyhodnocovanie nákladovej efektívnosti predaja alebo hodnotenie efektívnosti marketingovej a reklamnej kampane.

Otočte sa(Pivot). Otáča dátové osi, aby poskytla náhradnú reprezentáciu informácií.

Odrody databázy

V podstate ide o typickú kocku OLAP, ktorá implementuje viacrozmernú analýzu údajov pomocou kocky OLAP alebo ľubovoľnej kocky údajov, takže proces analýzy môže podľa potreby pridávať dimenzie. Všetky informácie načítané do multidimenzionálnej databázy budú uložené alebo archivované a môžu byť v prípade potreby vyvolané.

Význam

Relačný OLAP (ROLAP)

ROLAP je pokročilý DBMS spolu s viacrozmerným mapovaním údajov na vykonávanie štandardnej relačnej operácie

Multidimenzionálny OLAP (MOLAP)

MOLAP - implementuje prácu vo viacrozmerných dátach

Hybridné online analytické spracovanie (HOLAP)

V prístupe HOLAP sú agregované súčty uložené vo viacrozmernej databáze a detailné informácie uložené v relačnej databáze. To zaisťuje ako efektivitu modelu ROLAP, tak aj výkon modelu MOLAP.

OLAP Desktop (DOLAP)

V Desktop OLAP si používateľ stiahne časť údajov z databázy lokálne alebo na svoju pracovnú plochu a analyzuje ich. Nasadenie DOLAP je relatívne lacnejšie, pretože ponúka veľmi málo funkčnosť v porovnaní s inými systémami OLAP

Web OLAP (WOLAP)

Web OLAP je OLAP systém prístupný cez webový prehliadač. WOLAP je trojvrstvová architektúra. Skladá sa z troch komponentov: klient, middleware a databázový server

Mobilný OLAP

Mobile OLAP pomáha používateľom získať a analyzovať údaje OLAP pomocou vašich mobilných zariadení

Priestorový OLAP

SOLAP je vytvorený na uľahčenie správy priestorových aj nepriestorových údajov v geografickom priestore informačný systém(GIS)

Existujú menej známe systémy alebo technológie OLAP, no toto sú tie hlavné, ktoré v súčasnosti využívajú veľké korporácie, podniky a dokonca aj vláda.

OLAP nástroje

Online analytické nástroje na spracovanie sú na internete veľmi dobre zastúpené v platenej aj bezplatnej verzii.

Najpopulárnejšie z nich:

  1. Dundas BI od Dundas Data Visualization je platforma business intelligence a vizualizácie údajov založená na prehliadači, ktorá zahŕňa integrované dashboardy, nástroje na vytváranie prehľadov OLAP a analýzu údajov.
  2. Yellowfin je platforma business intelligence, ktorá predstavuje jediné integrované riešenie určené pre spoločnosti rôznych odvetví a veľkostí. Tento systém je prispôsobiteľný pre podniky v oblasti účtovníctva, reklamy, poľnohospodárstva.
  3. ClicData je riešenie business intelligence (BI) určené predovšetkým pre malé a stredné podniky. Tento nástroj umožňuje koncovým používateľom vytvárať zostavy a informačné panely. Board bol vytvorený s cieľom spojiť business intelligence, riadenie výkonnosti podniku a je to plnohodnotný systém, ktorý slúži stredne veľkým a podnikovým spoločnostiam.
  4. Domo je cloudový balík pre správu podniku, ktorý sa integruje s viacerými zdrojmi údajov vrátane tabuliek, databáz, sociálne siete a akékoľvek existujúce cloudové alebo lokálne softvérové ​​riešenie.
  5. InetSoft Style Intelligence je softvérová platforma pre podnikových analytikov, ktorý používateľom umožňuje vytvárať dashboardy, technológiu vizuálnej analýzy OLAP a zostavy pomocou nástroja mashup.
  6. Birst by Infor Company je webové riešenie podnikovej inteligencie a analýzy, ktoré spája nápady rôzne tímy a pomáha vám robiť informované rozhodnutia. Tento nástroj umožňuje decentralizovaným používateľom rozšíriť model podnikového tímu.
  7. Halo je komplexný systém riadenia dodávateľského reťazca a business intelligence, ktorý pomáha pri obchodnom plánovaní a prognózovaní zásob pre riadenie dodávateľského reťazca. Systém využíva údaje zo všetkých zdrojov – veľkých, malých aj stredných.
  8. Chartio je cloudové riešenie obchodného analytika, ktoré poskytuje zakladateľom, obchodným tímom, dátovým analytikom a produktovým tímom nástroje na organizovanie ich každodennej práce.
  9. Exago BI je webové riešenie určené na zabudovanie do webových aplikácií. Implementácia Exago BI umožňuje spoločnostiam všetkých veľkostí poskytovať svojim zákazníkom ad hoc, real-time a interaktívne reporty.

Obchodný vplyv

Používateľ nájde OLAP vo väčšine podnikových aplikácií naprieč odvetviami. Analýzu využívajú nielen podniky, ale aj iné zainteresované strany.

Niektoré z jeho najbežnejších aplikácií zahŕňajú:

  1. Marketingová analýza údajov OLAP.
  2. Finančné výkazníctvo, ktoré pokrýva predaj a výdavky, rozpočtovanie a finančné plánovanie.
  3. Riadenie obchodných procesov.
  4. Analýza predaja.
  5. Databázový marketing.

Odvetvia naďalej rastú, čo znamená, že používatelia to čoskoro uvidia Ďalšie aplikácie OLAP. Viacrozmerné prispôsobené spracovanie poskytuje dynamickejšiu analýzu. Z tohto dôvodu sa tieto systémy a technológie OLAP používajú na vyhodnotenie scenárov typu „čo keby“ a alternatívnych obchodných scenárov.

OLAP (OnLine Analytical Processing) nie je názov konkrétneho produktu, ale celej online technológie analytického spracovania, ktorá zahŕňa analýzu údajov a reportovanie. Používateľ má k dispozícii viacrozmernú tabuľku, ktorá automaticky sumarizuje údaje v rôznych sekciách a umožňuje rýchlu správu výpočtov a formy zostavy.

Hoci sa v niektorých publikáciách analytické spracovanie nazýva online aj interaktívne, prídavné meno „online“ najpresnejšie odráža význam technológie OLAP. Vývoj manažérskych manažérskych rozhodnutí patrí do kategórie oblastí, ktoré sú najviac falošne prístupné automatizácii. Dnes je však možnosť asistovať manažérovi pri rozvoji rozhodnutí a hlavne výrazne urýchliť proces vypracovávania rozhodnutí, ich výberu a prijímania.

Systémy na podporu rozhodovania majú zvyčajne prostriedky na poskytovanie súhrnných údajov pre rôzne vzorky z počiatočného súboru používateľovi vo forme vhodnej na vnímanie a analýzu. Spravidla také agregované funkcie tvoria multidimenzionálny súbor údajov, často nazývaný hyperkocka alebo metakocka, ktorého osi obsahujú parametre a bunky obsahujú agregované údaje, ktoré od nich závisia - a takéto údaje môžu byť uložené aj v relačných tabuľkách, ale v tomto prípade hovoríme o logickom organizáciu údajov, a nie fyzickú realizáciu ich ukladania.

Pozdĺž každej osi môžu byť údaje usporiadané do hierarchie reprezentujúcej rôzne úrovne detailov.

Podľa dimenzií v multidimenzionálnom modeli sa vyčleňujú faktory, ktoré ovplyvňujú činnosť podniku (napríklad: čas, produkty, pobočky spoločnosti atď.). Výsledná kocka OLAP je potom naplnená ukazovateľmi aktivity podniku (ceny, tržby, plán, zisky, peňažný tok atď.). Je potrebné poznamenať, že na rozdiel od geometrickej kocky nemusia mať plochy kocky OLAP rovnakú veľkosť. Toto napĺňanie je možné vykonať tak reálnymi údajmi operačných systémov, ako aj predpovedať na základe historických údajov. Dimenzie hyperkocky môžu byť zložité, hierarchické a možno medzi nimi vytvoriť vzťahy. Počas analýzy môže užívateľ meniť uhol pohľadu na dáta (tzv. operácia zmeny logického pohľadu), čím si dáta prezerá v rôznych sekciách a rieši špecifické problémy. Na kockách je možné vykonávať rôzne operácie, vrátane predpovedania a podmieneného plánovania (analýza čo ak).

Vďaka tomuto dátovému modelu môžu používatelia formulovať zložité dotazy, generovať zostavy a prijímať podmnožiny údajov. Operatívne analytické spracovanie môže výrazne zjednodušiť a urýchliť proces prípravy a rozhodovania riadiacich pracovníkov. Online analytické spracovanie slúži na premenu údajov na informácie. Zásadne sa líši od tradičného procesu podpory rozhodovania, ktorý je najčastejšie založený na zvážení štruktúrovaných správ.


Technológia OLAP sa vzťahuje na typ intelektuálnej analýzy a zahŕňa 12 princípov:

1. Konceptuálna viacrozmerná reprezentácia. Používateľ-analytik vidí svet podniku ako multidimenzionálny a model OLAP musí byť vo svojom jadre multidimenzionálny.

2. Transparentnosť. Architektúra systému OLAP by mala byť otvorená, aby umožnila užívateľovi, nech je kdekoľvek, komunikovať pomocou analytického nástroja – klienta – so serverom.

3. Dostupnosť. Používateľ OLAP analytik musí byť schopný vykonávať analýzu založenú na spoločnej koncepčnej schéme obsahujúcej celopodnikové údaje v relačnej databáze, ako aj údaje zo starších databáz, na spoločných metódach prístupu a na spoločnom analytickom modeli. Systém OLAP by mal pristupovať iba k údajom, ktoré sú skutočne potrebné, a nie uplatňovať všeobecný princíp „kuchynského lievika“, ktorý so sebou prináša zbytočné vstupy.

4. Konzistentný výkon pri tvorbe správ. So zvýšením počtu dimenzií alebo veľkosti databázy by používateľ analytik nemal zaznamenať výrazný pokles výkonu.

5. Architektúra klient-server. Väčšina údajov potrebných pre online analýzu sa dnes nachádza na sálových počítačoch s prístupom k užívateľským pracovným staniciam cez LAN. To znamená, že produkty OLAP musia byť schopné pracovať v prostredí klient-server.

6. Všeobecná mnohorozmernosť. Každá dimenzia by sa mala uplatňovať bez ohľadu na jej štruktúru a prevádzkové možnosti. Základné dátové štruktúry, vzorce a formáty vykazovania by nemali byť zaujaté voči žiadnej jednej dimenzii.

7. Dynamické riadenie riedkych matíc. Fyzický dizajn nástroja OLAP musí byť plne prispôsobiteľný konkrétnemu analytickému modelu, aby bolo možné optimálne spravovať riedke matice. Zriedkavosť (meraná ako percento prázdnych buniek ku všetkým možným bunkám) je jednou z charakteristík šírenia údajov.

8. Podpora viacerých používateľov. Nástroj OLAP musí poskytovať možnosť zdieľania dotazov a rozširovania viacerých používateľov analytikov pri zachovaní integrity a bezpečnosti.

9. Neobmedzené krížové operácie. Rôzne operácie môžu vzhľadom na svoju hierarchickú povahu reprezentovať závislé vzťahy v modeli OLAP, to znamená, že sú medzifunkčné. Ich vykonanie by nemalo vyžadovať, aby analytický používateľ predefinoval tieto výpočty a operácie.

10. Intuitívna manipulácia s údajmi. Pohľad používateľa analytika na dimenzie definované v analytickom modeli musí obsahovať všetky potrebné informácie na vykonávanie akcií na modeli OLAP, t.j. nemali by vyžadovať použitie systému menu alebo iné operácie s viacerými používateľskými rozhraniami.

11. Flexibilné možnosti prehľadov. Nástroje na podávanie správ by mali byť syntetizované údaje alebo informácie vyplývajúce z dátového modelu v akejkoľvek možnej orientácii. To znamená, že riadky, stĺpce alebo stránky zostavy musia súčasne zobrazovať viacero dimenzií modelu OLAP s možnosťou zobrazenia ľubovoľnej podmnožiny prvkov (hodnôt) obsiahnutých v dimenzii a v ľubovoľnom poradí.

12. Neobmedzený rozmer a počet úrovní agregácie. Štúdia o možnom počte potrebných meraní potrebných v analytickom modeli ukázala, že až 19 meraní môže byť súčasne použitým používateľom analytika. To vedie k odporúčaniu o počte dimenzií podporovaných systémom OLAP. Okrem toho by každý zo spoločných rozmerov nemal byť obmedzený počtom úrovní agregácie definovaných užívateľom-analytikom.

Ako špecializované OLAP systémy v súčasnosti ponúkané na trhu môžete špecifikovať CalliGraph, Business Intelligence.

Na riešenie jednoduchých úloh analýzy dát je možné použiť rozpočtové riešenie - kancelárske aplikácie Microsoft Excel a Access, ktoré obsahujú elementárne nástroje technológie OLAP, ktoré umožňujú vytvárať kontingenčné tabuľky a na ich základe zostavovať rôzne zostavy.