Operatívne analytické spracovanie. Operatívne analytické spracovanie (On-Line Analytical Processing, OLAP). Analytické spracovanie heterogénnych textových informácií Formy a metódy spracovania analytických informácií prax

UDK 621. 37/39. 061,2/4

METÓDY ANALYTICKÉHO SPRACOVANIA INFORMÁCIÍ

GVOZDINSKYA.N., KLIMKO E.G., SOROKOVOY A.I.

Analytický prehľad metód intelektuálna analýza dáta (nazývané aj: IAD, data mining, objavovanie znalostí v databázach) s prihliadnutím na použitie určitej metódy na podmienky Ukrajiny. Prehľad metód analytického spracovania informácií v komplexných informačných systémoch je posudzovaný z hľadiska rýchlosti extrakcie dát, zberu zovšeobecnených informácií a zvýšenia spoľahlivosti procesu.

Proces dolovania údajov je analytická štúdia veľkého množstva informácií s cieľom určiť vzorce a vzťahy medzi premennými, ktoré sa potom dajú použiť na nové údaje. Prijaté informácie sú prevedené na úroveň informácií, ktorá je charakterizovaná ako znalosť. Tento proces pozostáva z troch hlavných krokov:

Výskum (odhaľovanie vzorov);

Použitie identifikovaných vzorov na zostavenie modelu;

Analýza výnimiek na zistenie a vysvetlenie odchýlok v nájdených vzoroch.

Hľadanie nových poznatkov pomocou IAD je nový a rýchlo sa rozvíjajúci smer, ktorý využíva metódy umelej inteligencie, matematiky a štatistiky. Tento proces zahŕňa nasledujúce kroky:

Definícia problému (problémové vyhlásenie);

Príprava údajov;

Zber údajov: ich vyhodnotenie, integrácia a čistenie, výber a transformácia;

Budovanie modelu: hodnotenie a interpretácia, externá validácia;

Použitie modelu;

Modelové pozorovanie.

Na vytvorenie modelu a zlepšenie jeho kvality pomáha formálna validácia údajov prostredníctvom sekvencie dotazov alebo predbežného získavania údajov. Nástroje na takúto analýzu zahŕňajú tieto hlavné metódy: neurónové siete, rozhodovacie stromy, genetické algoritmy, ako aj ich kombinácie.

Neurálne siete patria do triedy nelineárnych adaptívnych systémov, ich štruktúra podmienene pripomína nervové tkanivo neurónov.

Ide o množinu vzájomne prepojených uzlov, ktoré prijímajú vstupné dáta, spracúvajú ich a na výstupe vytvárajú nejaký výsledok. Uzly spodnej vrstvy sú zásobované hodnotami vstupných parametrov, na ich základe sa vykonávajú výpočty potrebné pre rozhodovanie, predpovedanie vývoja situácie a pod.

Tieto hodnoty sa považujú za signály, ktoré sa prenášajú do nadložnej vrstvy, pričom sa zvyšujú alebo znižujú v závislosti od číselných hodnôt (váh) priradených interneuronálnym spojeniam. Na výstupe neurónu najvyššej vrstvy sa generuje hodnota, ktorá sa považuje za odozvu, reakciu celej siete na vstup. počiatočné hodnoty. Keďže každý prvok neurónovej siete je čiastočne izolovaný od svojich susedov, takéto algoritmy majú schopnosť paralelizovať výpočty. Na obr. 1 znázorňuje podmienku

Obr.1. Neurónová sieť

Veľkosť a štruktúra siete musí zodpovedať podstate skúmaného javu. Vybudovaná sieť je podrobená procesu takzvaného „tréningu“. Neuróny siete spracovávajú vstupné dáta, pre ktoré sú známe hodnoty vstupných parametrov a správne odpovede na ne. Učenie spočíva vo výbere váh interneuronálnych spojení, ktoré poskytujú najväčšiu blízkosť odpovedí siete známym správnym odpovediam. Po zaškolení na dostupné údaje je sieť pripravená na prácu a možno ju použiť na predpovedanie správania objektu v budúcnosti na základe údajov o jeho vývoji v minulosti, na vykonanie analýzy a na identifikáciu odchýlok a podobností. Spoľahlivé prognózy je možné vytvárať bez špecifikovania typu závislostí, na základe ktorých sú založené.

Neurónové siete sa používajú na riešenie problémov predikcie, klasifikácie alebo riadenia.

Výhoda - siete dokážu aproximovať akúkoľvek spojitú funkciu, nie je potrebné vopred robiť žiadne predpoklady o modeli. Údaje, ktoré sú predmetom vyšetrovania, môžu byť neúplné alebo zašumené.

Nevýhodou je nutnosť mať veľké množstvo tréningovej vzorky. Konečné rozhodnutie závisí od počiatočných nastavení siete. Údaje je potrebné previesť do číselnej podoby. Výsledný model nevysvetľuje objavené poznatky (tzv. „čierna skrinka“).

Rozhodovacie stromy využívajú rozdelenie údajov do skupín na základe hodnôt premenných. Výsledkom je hierarchická štruktúra príkazov „Ak...Potom...“, ktorá vyzerá ako strom. Ak chcete klasifikovať objekt alebo situáciu, musíte odpovedať na otázky v uzloch tohto stromu, počnúc jeho koreňom. Ak je odpoveď kladná, prejdite do pravého uzla ďalšej úrovne, ak je záporná - do ľavého uzla atď. Po dokončení odpovedí sa dostanú do jedného z koncových uzlov, kde

RI, 2000, č. 4

označuje, do ktorej triedy by mal byť predmetný objekt priradený.

Rozhodovacie stromy sú navrhnuté tak, aby riešili klasifikačné problémy, a preto majú veľmi obmedzené využitie vo financiách a obchode.

Výhodou metódy je jednoduchá a zrozumiteľná prezentácia funkcií pre používateľov. Ako cieľová premenná sa používajú merané aj nemerané znaky – to rozširuje rozsah metódy.

Nevýhodou je problém významnosti. Dáta je možné rozdeliť do mnohých špeciálnych prípadov, existuje „krovinatý“ strom, ktorý nemôže poskytnúť štatisticky platné odpovede. Užitočné výsledky sa dosiahnu iba v prípade nezávislých funkcií.

Genetické algoritmy napodobňujú proces prirodzeného výberu v prírode. Na vyriešenie problému, ktorý je z hľadiska nejakého kritéria optimálnejší, sú všetky riešenia opísané množinou čísel alebo veličín nenumerického charakteru. Hľadanie optimálneho riešenia je podobné ako pri evolúcii populácie jedincov, ktorí sú reprezentovaní svojimi súbormi chromozómov. V tomto vývoji fungujú tri mechanizmy, znázornené na obr. 2.

Je možné rozlíšiť nasledujúce mechanizmy:

Výber najsilnejších sád chromozómov, ktoré zodpovedajú najoptimálnejším riešeniam;

Kríženie - získavanie nových jedincov zmiešaním chromozómových sád vybraných jedincov;

Mutácie sú náhodné zmeny v génoch u niektorých jedincov v populácii.

V dôsledku výmeny generácií sa vyvíja riešenie problému, ktoré sa už nedá ďalej zlepšovať.

Výhoda - metóda je vhodná na riešenie rôznych problémov kombinatoriky a optimalizácie, uprednostňuje sa skôr ako nástroj vedeckého výskumu.

Nevýhodou je schopnosť efektívne formulovať problém, určiť kritérium pre výber chromozómov a samotný výberový postup je heuristický a dokáže ho len odborník. Formulácia problému v pojmoch neumožňuje analyzovať štatistickú významnosť riešenia získaného pomocou nich.

Počítačové technológie pre inteligentné analytické spracovanie dát umožňujú využívať metódy umelej inteligencie, štatistiky, teórie databáz a umožňujú vytvárať moderné inteligentné systémy.

V súčasnosti je akútna otázka vytvárania informačných skladov (dátový sklad, dátový sklad) – optimálne usporiadaných databáz, ktoré poskytujú najrýchlejší a najpohodlnejší prístup k informáciám potrebným pre rozhodovanie. Úložisko akumuluje spoľahlivé informácie z rôznych zdrojov počas dlhého časového obdobia, ktoré zostáva nezmenené. Údaje sú agregované a uchovávané podľa oblastí, ktoré popisujú (špecifické pre jednotlivé domény) a spĺňajú požiadavky celého podniku (integrované).

Vzhľadom na relatívne krátke obdobie existencie väčšiny domácich podnikov, nedostatok analyzovaných údajov, nestabilitu podnikov, ktoré podliehajú zmenám v dôsledku zmien v legislatívneho rámca je ťažké vyvinúť efektívnu stratégiu rozhodovania pomocou systémov dolovania údajov. Preto sa predpokladá, že genetické algoritmy sú najprijateľnejšou metódou na skúmanie údajov v oblasti financií a podnikania a pre úlohy klasifikácie obrázkov a faktov je lepšie použiť metódy rozhodovacích stromov alebo neurónové siete.

Literatúra: 1. Shchavelev L.V. Dolovanie dát. http://www.citforum.ru/seminars/cis99/sch_04.shtml, 2. Burov K. Objav vedomostí v dátových skladoch / / otvorené systémy. 1999. č. 5-6., http://www.osp.ru/os/l999/05-06/14.htm. 3. Kiselev M, Solomatin E. Prostriedky získavania znalostí v obchode a financiách // Otvorené systémy. 1997. Číslo 4. s. 41-44. 4. Krechetov N, Ivanov P. Produkty pre dolovanie údajov // Počítačový týždeň - Moskva. 1997. č. 14-15. s. 32-39. 5. Edelstein H. Inteligentné nástroje na analýzu a prezentáciu údajov v informačných skladoch // Počítačový týždeň - Moskva. 1996. Číslo 16. s. 32-35.

Do redakcie doručené 22.06.2000

Recenzent: Dr. tech. vedy, prof. Putyatin V.P.

Gvozdinskij Anatolij Nikolajevič, Ph.D. tech. vied, profesor Katedry umelej inteligencie KhTURE. Vedecké záujmy: hodnotenie efektívnosti komplexných systémov riadenia informácií. Záujmy a záľuby: klasická hudba, turistika. Adresa: Ukrajina, 61166, Charkov, ul. akad. Lyapunova, 7, apt. 9, tel. 32-69-08.

Klimko Elena Genrihovna, asistentka Katedry počítačových technológií a informačných systémov, Poltavská štátna technická univerzita pomenovaná po Jurijovi Kondratyukovi. Postgraduálny študent (pri zamestnaní) Katedry umelej inteligencie KhTURE. Vedecké záujmy: analytická analýza údajov. Záujmy a záľuby: čítanie, pletenie. Adresa: Ukrajina, 36021, Poltava, ul. Diamant, 1-A, apt. 34, tel. (053-22) 3-43-12.

Sorokov Alexander Ivanovič, PhD. tech. v odbore veda, docent Katedry počítačových technológií a informačných systémov, Štátna technická univerzita Yuriy Kondratyuk Poltava. Výskumné záujmy: KDD (Objavovanie vedomostí). Záujmy a koníčky: psy. Adresa: Ukrajina, 36022, Poltava, per. Broken, 37A, tel.(053-2) 18-60-87, e-mail: [e-mail chránený]

Analytické spracovanie informácia je priamo analytický postup, v súvislosti s ktorým sa kladú závažné požiadavky na jeho organizáciu, a to primeranú metodickú podporu, určitú úroveň zaškolenia analytikov a ich zabezpečenie technickými prostriedkami na vykonávanie analýzy.
Kvalitu a platnosť prijatých manažérskych rozhodnutí do značnej miery určuje nielen spoľahlivosť, úplnosť, dostupnosť, efektívnosť získavania informácií, ale aj efektívnosť použitých metód pri ich spracovaní. Zdokonaľovanie technológie analytického spracovania ekonomických informácií je jedným z kľúčových prvkov zlepšovania manažérskej technológie.
Kvalitná informačná podpora procesu riadenia ekonomických činností je možná len s využitím v praxi najnovších informačných technológií: fondy počítačová veda, telekomunikácií a softvéru a automatizované systémy zvládanie.
Podmienky hospodárskej činnosti, navrhovanie širokých práv pre podniky na tvorbu účtovných zásad, možnosť ich zmeny, zmena foriem vlastníctva; reštrukturalizačné procesy, fúzie spoločností atď. si vyžadujú spracovanie veľkého množstva analytických informácií. Skomplikovali sa aj samotné výpočty používané na zaznamenávanie určitých finančných a obchodných transakcií. Široké práva podnikov na výber metód výpočtu odpisov dlhodobého majetku prakticky znemožňujú úlohu výpočtu výšky odpisov za podmienky manuálneho spracovania informácií.
Zvyšujú sa požiadavky na mieru efektívnosti, spoľahlivosti informácií potrebných pre prijímanie manažérskych rozhodnutí. Bola to organizácia ekonomickej analýzy v počítačovom prostredí, ktorá umožnila výrazne zvýšiť efektívnosť zhromažďovania a registrácie účtovných informácií, výrazne znížiť pravdepodobnosť aritmetických chýb a v dôsledku toho znížiť náročnosť práce analytických služieb. v podnikoch.
Zložitosť informačných tokov, nedokonalosť kanálov na získavanie informácií, metódy a techniky zberu, uchovávania a spracovania informácií často vedú k ich výraznému oneskoreniu, a teda k strate ich "kvality. Základom pre včasné prijímanie informácií je integrácia jeho zberu a spracovania, ktorá zabezpečuje interakciu ekonomických činností a ekonomických analýz, vedie k postupnému zlučovaniu automatizácie výpočtov s informačný systém podnikov.
Automatizovaný systém zberu, spracovania a ukladania, ktorým je rozsiahla sieť záznamových zariadení, komunikačných liniek a počítačov, skracuje čas medzi objavením sa informácií a ich využitím v analytickej práci. Technické prostriedky zabezpečujú včasné sprostredkovanie informácií o procesoch prebiehajúcich v podniku manažérom a ostatným riadiacim zamestnancom. Použitie moderných informačných technológií umožňuje vykonávať rýchle vyhľadávanie a výpočty náročné na prácu, ako aj zobrazovať výsledky v prijateľnej forme.
Popredné miesto v postupoch transformácie ekonomických informácií zaujíma ich systematizácia a spracovanie. Pri využívaní výpočtovej techniky sa spracovanie informácií stalo organickou súčasťou jedného procesu informačnej technológie. Moderné počítače nielen zmenili prepojenia tohto procesu s inými, čím sa vytvorila možnosť technologickej jednoty informačných procesov, ale ovplyvnil aj obsah pojmu „spracovanie údajov“. Ak sa pri ručnom alebo mechanizovanom výkone analytických prác chápalo spracovanie najmä aritmetických operácií, dnes sa na spracovanie používajú najzložitejšie logické a štatistické operácie.
Väčšina ekonomických informácií získaných ako výsledok spracovania sa posiela manažérom, špecialistom, manažérom v konkrétnom časovom rámci stanovenom kalendárnym harmonogramom zberu a spracovania údajov. Pri vytváraní regulovaných ekonomických informácií nie je načasovanie ich prípravy obzvlášť ťažké, pretože sú zvyčajne určené podmienkami výroby. Problémom je návrh zberu a spracovania neregulovaných informácií na prijímanie manažérskych rozhodnutí v ľubovoľných časových bodoch. Na získanie takýchto informácií musí systém generovať údaje charakterizujúce výsledky práce, priebeh plánov, dynamiku ekonomického a sociálneho rozvoja s určitým obdobím.
Takýto systém si vyžaduje odlišný prístup k návrhu technologického procesu zberu a spracovania dát, ktorý zabezpečuje rôzne spôsoby získavania informácií. Najsľubnejší je interaktívny režim, ktorý poskytuje priamu interakciu medzi používateľmi a počítačmi. Pre operatívne manažérske rozhodnutia manažéri na základe určitých dialógových postupov vyberajú potrebné informácie, ktoré odrážajú dostupnosť a využitie materiálových, pracovných a finančných zdrojov, priebeh výroby a ďalšie obchodné procesy.
V spracovanej, vzájomne prepojenej a koordinovanej forme sa informácie odovzdávajú útvarom a službám ekonomického manažmentu zodpovedným za analýzu ekonomickej činnosti a rozhodovanie. Na riadenie ekonomiky potrebujú špeciálne informácie prediktívneho charakteru, ktoré umožňujú nielen opraviť stav vecí v podniku, ale aj analyzovať vývojové trendy konkrétneho procesu, javu a na základe toho prijímať optimálne a včasné rozhodnutia. Tento typ riadenia predpokladá prítomnosť nielen údajov o riadenom objekte a jeho prostredí, ale aj analyzovaných informácií vhodných na prognózovanie. nástroje ekonomického modelovania, expertné a prediktívne softvérové ​​systémy.

Galina Akimová, Matvey Pashkin

Technológia spracovania informácií z rôznych zdrojov, vrátane internetových médií, poskytuje automatizovaný vstup (vrátane tematickej textovej analýzy, spracovania, ukladania a vyhľadávania) a získavanie štatistických súhrnov a súhrnov.

V súčasnosti je hlavnou metódou analytického spracovania polí textových údajov vyhľadávanie dokumentov podľa kľúčových slov. Inteligencia tejto operácie sa zvyšuje automatickým zoraďovaním nájdených dokumentov pomocou dosť jednoduché metódy určenie ich významu s prihliadnutím na morfológiu jazyka a (oveľa menej často) sémantické slovníky.

Na riešenie moderných analytických problémov, najmä vzhľadom na obrovské množstvo zdrojových informácií (predovšetkým z internetu), to však zjavne nestačí. Newsblaster Columbia University je príkladom toho, čo zákazníci dnes potrebujú. Pôvodne bol určený na uľahčenie vyhľadávania informácií na webe, no v skutočnosti dokáže z internetu vytiahnuť všetky dôležité správy. Tento systém prehľadáva spravodajské stránky, zoraďuje nájdené informácie podľa tém, zisťuje mieru podobnosti textov a tvorí správy vo forme päťvetového komentára. Približne 88 % tých, ktorí toto riešenie využili, priznáva, že je oveľa pohodlnejšie pracovať s týmto programom, ako „surfovať“ na rôznych weboch a hľadať novinky.

Je potrebné poznamenať, že problém práce s obrovským množstvom informácií má dva aspekty: jedným je automatický zber informácií (na ktorý sa v skutočnosti zameriava vyššie uvedený systém a analógy) a druhým je automatický zber informácií. analýza získaných informácií o tejto téme, vykonaná na základe textu analytického dokumentu.

Podľa A. Kharlamova možno existujúce prístupy k analýze textu rozdeliť do dvoch tried. Prvá trieda je navrhnutá tak, aby zahŕňala rýchle algoritmy, ktoré nie sú závislé od jazyka a predmetu, ktoré využívajú štatistické metódy. Druhá trieda je tvorená pomerne sofistikovaným dávaním dobrý výsledok, ale relatívne pomalé, jazykovo a doménovo špecifické prístupy a väčšinou založené na lingvistických metódach.

Niet pochýb o tom, že najefektívnejší prístup bude ten, ktorý kombinuje rýchlosť a jazykovú nezávislosť prvotriednych algoritmov s vysoká kvalita spracovanie druhého.

Z existujúcich systémov je z pohľadu autorov najzaujímavejší systém TERMIN-5, ktorý využíva lexikálno-štatistickú metódu kategorizácie textov. Výhodou lexikálno-štatistickej metódy je jej vysoká univerzálnosť, keďže význam nadpisu v nej určuje iba súbor učebných textov. Systém umožňuje plne automatizovať proces rubrikácie, poskytuje úpravu rubrikátora podľa cvičnej vzorky textov a vypracovanie rozhodujúceho pravidla pre zaradenie dokumentu do konkrétnej rubriky. Zameriava sa na popis aktuálnych mediálnych tokov textových správ.

Vo všeobecnosti sa na softvérovom trhu dlhodobo rozvíja segment analytických systémov zameraných na matematickú a štatistickú analýzu rôznych kvantitatívnych a kvalitatívnych ukazovateľov. Avšak predtým úplné riešenie veľké objemové analýzy textové informácie obsiahnutý v tlačených publikáciách, spravodajských kanáloch informačných agentúr, na tematických stránkach na internete, je stále dosť vzdialený.

Budovanie autokategorizačných systémov

Na vyriešenie problému analýzy textových informácií a ich následnej automatickej distribúcie do požadovaných tém je potrebné v prvom rade vytvoriť rubrikátor, t.j. nastaviť zoznam tém alebo nadpisov, ktoré najpresnejšie charakterizujú oblasť vedomostí pod štúdium. Nevyhnutnou podmienkou pre analýzu textu je podpora práce s lineárnymi aj hierarchickými nadpismi s neobmedzeným počtom úrovní vnorenia. Nižšie je uvedený príklad lineárneho rubrikátora používaného na webovej stránke Lenta.ru:

Okrem toho, keďže smery výskumu sa môžu meniť, chceli by sme byť schopní klasifikovať rovnaké pole vstupných informácií do rôznych tém špecifikovaných rôznymi rubrikátormi.

V existujúcich systémoch spracovania textových informácií sú bežné dva základné prístupy: založené buď na zozname kľúčových slov alebo na zozname termínov (podstatné mená alebo frázy) priradených k rubrike tak či onak. Okrem toho prípravné práce na korelácii kľúčových slov a výrazov ktorejkoľvek rubriky často vykonávajú odborníci manuálne.

V tomto článku sa budeme zaoberať metódou, ktorá je vývojom systému TERMIN-5 a umožňuje vám automaticky vygenerovať zoznam výrazov, ktoré charakterizujú príslušnosť textových informácií k určitej rubrike. Tento prístup možno nazvať krokom k automatickej sémantickej analýze textu. Zostavenie zoznamu charakteristických pojmov sa vykonáva na základe morfologickej a syntaktickej analýzy textu zvýraznením netriviálnych podstatných mien a vlastných mien obklopených definíciami, pričom sa zohľadňuje frekvencia slov v jazyku.

Vytvorenie tréningovej vzorky

Technológia výučby rubrikátora je založená na zostavení cvičnej vzorky – zoznamu súborov alebo dokumentov, ktoré zodpovedajú hlavičkám tohto rubrikátora. Školenie rubrikátora je najefektívnejšie, ak používate krátke informatívne texty s maximálnou sémantickou záťažou. Pri práci s viacerými rubrikátormi by mal mať každý z nich vlastnú tréningovú súpravu.

Presnosť konštrukcie trénovacej vzorky je možné určiť až v štádiu tematickej analýzy textových informácií, t. j. pri ich zadávaní do databázy. Preto je konštrukcia cvičnej vzorky iteratívnym procesom: v závislosti od kvality definície témy v analýze textu je možné trénovaciu vzorku opraviť.

Školenie rubrikátora

Proces učenia sa rubrikátora spočíva v budovaní určitého súboru pojmov, ktoré charakterizujú príslušnosť každej z jeho rubriky. Zoznam definujúcich pojmov je vytvorený na základe analýzy textu dokumentov, ktoré tvoria školiacu vzorku, pre každú rubriku zvlášť. Každému vybranému pojmu je priradená určitá váha, ktorá charakterizuje jeho význam v texte. Následná analýza výsledkov vám umožní spresniť zoznam, čím sa zníži dôležitosť prelínajúcich sa pojmov a výrazov a často sa odstránia.

Hierarchia rubrik, spolu s pojmami, ktoré sú pre každú rubriku významné, t. j. vyškolený rubrikátor, sa nazýva autorubrikátor. Vďaka dodatočným nástrojom, ktoré umožňujú odborníkovi vykonávať operácie pridania alebo vymazania pojmu, zmeny jeho váhy, je možné celkom flexibilne ovplyvňovať výsledky práce na tvorbe definujúcich pojmov autorského rubrikátora. Opravené výsledky vzdelávania sú uložené vo vlastnej databáze pojmov (podstatných slovných spojení), ktoré charakterizujú každú rubriku, ktorá sa potom používa na automatické určenie predmetu prichádzajúcich informácií.

Pomocou rubrikátora

Po vytvorení rubrikátora ho možno použiť na analýzu prichádzajúcich údajov textové dokumenty. Na tento účel je text dokumentu pri konštrukcii rubrikátora podrobený rovnakému spracovaniu ako texty z tréningovej vzorky. V dôsledku automatickej morfologickej a syntaktickej analýzy textu sa získa súbor charakteristických pojmov (nominálnych skupín a slovných spojení) s prihliadnutím na frekvenciu. Táto množina výrazov sa stáva vstupným parametrom rubrikátora, aby sa priradila k zodpovedajúcim množinám každej rubriky. V dôsledku toho získame odhady relevantnosti daného textu ku každému z nadpisov. Postprocesor môže odrezať nespoľahlivé (slabé) a/alebo extrahovať spoľahlivé (vysoké) odhady v súlade s vopred určenými prahmi spoľahlivosti.

Proces opísaný vyššie automatická detekcia príslušnosť prichádzajúcich informácií do jednej alebo druhej rubriky sa nazýva autorubrikácia.

Predspracovanie informácií

Za hlavné zdroje informácií sa navrhuje považovať internetové médiá, spravodajské kanály, elektronické dokumenty, tlačené vydania. Spracovanie prichádzajúcich údajov je založené na princípe maximálnej možnej automatizácie. Týka sa to tak analýzy textu dokumentu, ako aj sledovania príchodu nových dokumentov a ich následného vstupu do informačného úložiska.

Automatickú analýzu textu a určenie predmetu prichádzajúcich informácií, bez ohľadu na formát ich prezentácie, sa navrhuje vykonať bezprostredne pred ich vložením do úložiska, ale po predúprava počiatočné údaje.

Nevyhnutným funkčným prvkom systémov spracovania informácií by mala byť kontrola ich duplicitnosti. To platí najmä pre internetové médiá, kde často dochádza k úplnej pretlači informácií, niekedy bez odkazu na ich zdroj. Nemenej zriedkavé sú situácie, keď sa pri opätovnej tlači zmení iba názov článku a dátum uverejnenia na stránke. Preto sa navrhuje skontrolovať opakovateľnosť požadovanej aj textovej zložky vstupného dokumentu.

Internetové médiá. Spracovanie noviniek zverejnených na internete nespočíva len v popise štruktúry stránky a organizovaní procesu sťahovania noviniek z nej, ale aj v dodržiavaní pravidiel stanovených na pracovisku užívateľa, ktoré označujú harmonogram a frekvenciu prezerania stránky. , zloženie podrobností sprevádzajúcich novinky, účtovné témy definované na stránke atď.

Spravodajské kanály.Špecifikom štruktúry spravodajského kanála je prítomnosť mnohých dokumentov v jednom textový súbor. Typicky je formát na prezentovanie spravodajských dokumentov určený v rámci organizácie, ktorá ho pripravila, čo naznačuje ich rôznorodosť. Spracovanie news feedu spočíva v automatickom sledovaní noviniek uložených na pevnom disku, v určovaní a parsovaní formátu news feedu a vo zvýraznení jednotlivých dokumentov, ktoré ho tvoria.

Elektronické a papierové dokumenty. Technológia práce s papierovými dokumentmi zvyčajne začína ich prenosom do elektronickej forme, teda z operácie skenovania.

Analytické spracovanie

Rôzne možnosti automatizácie zberu heterogénnych informácií a ich zoskupovania do tematických komponentov je len prvým krokom pri práci s informačnými tokmi pochádzajúcimi z rôznych zdrojov. Ďalším krokom by mala byť analýza informácií, najčastejšie zahŕňajúca zostavovanie štatistických správ (prípadne s prognostickými prvkami) a zostavovanie súhrnov, ktoré umožňujú zoskupovanie a publikovanie údajov na vybranú tému.

Štatistické správy. Analytické reporty založené na štatistickom spracovaní zadaných informácií pomáhajú nielen rýchlo posúdiť kvalitu dostupných údajov, ale často aj predpovedať do budúcnosti. Takéto zostavy je možné zostaviť pomocou štandardných štatistických balíkov (najmä na vytváranie prognóz), ako aj ako výsledok exportu údajov do programu Microsoft Excel.

Budovanie súhrnov. Pri vytváraní súhrnu (súhrnnej správy) je potrebné vziať do úvahy to, čo sa v ňom vyžaduje ako čo najúplnejšia prezentácia informácií o položená otázka(t. j. prezentácia úplného znenia dokumentu), a prezentácia len v krátkej forme, keď je ako textová informácia vybraný abstrakt alebo abstrakt.

Informačno-analytický systém "Astarta"

Nižšie sa budeme zaoberať fungovaním vyššie opísaných metód spracovania informácií na príklade informačno-analytického systému Astarta (vývojár - Cognitive Technologies, http://www.cognitive.ru). Toto softvérové ​​riešenie je založené na technológii Euphrates a je určené na zhromažďovanie, spracovanie a analýzu neštruktúrovaných informácií získaných z internetu, tlačených materiálov, médií a iných zdrojov. Má architektúru klient-server so schopnosťou publikovať verejné dokumenty a formáty noviniek na serveri. Systém poskytuje tri rôzne typy úloh, a teda tri typy užívateľov: administrátor, expert a užívateľ.

Administrácia

Okrem štandardných funkcií správy prístupových práv do systému a vykonávania bežnej údržby je administrátor Astarta zodpovedný za zverejňovanie detailov systému, bežných formátov pre news feedy a rubrikátory na serveri. Pri vytváraní a aktualizácii zoznamu používateľov systému, ako aj pri nastavovaní ich práv na prácu s jeho komponentmi, môžete brať do úvahy štruktúru podniku, klasifikátor práce, ako aj prepojenia, ktoré sú typické pre interakciu medzi oddelenia. Všetky tieto komponenty tvorí a upravuje administrátor zo systémového rozhrania (obr. 1).

Ryža. 1. Okno správcu systému.

Prístupové práva môžete prideliť každému používateľovi systému samostatne aj skupine používateľov. V druhom prípade sú práva tejto skupiny automaticky nastavené pre všetkých používateľov skupiny. Ak používateľ patrí do viacerých skupín, potom sa jeho práva rozširujú v súlade s právami, ktoré má v každej skupine.

Administrátor je špecializovaný používateľ systému, ktorý by nemal mať práva na vykonávanie používateľských funkcií.

Práca s rubrikátorom

Vytvorenie rubrikátora je jedným z najdôležitejších krokov pri príprave systému na prácu, pretože určuje tému, podľa ktorej sa budú triediť prichádzajúce informácie. Systém podporuje prácu s hierarchickým rubrikátorom neobmedzenej hĺbky. Rubrikátor môže byť vytvorený priamo z rozhrania systému alebo pripravený vopred ľubovoľne textový editor a importovať do systému. Pri príprave textu rubrikátora je povolené používať ľubovoľné oddeľovače úrovní hierarchie.

Za výber tréningovej vzorky je zodpovedný buď expert systému alebo špecialista vykonávajúci jeho funkcie. Školiaca vzorka môže pozostávať zo súboru súborov rozdelených do kategórií a dokumentov, ktoré boli predtým zadané do Astarta. Zároveň si môžete zvoliť úroveň hodnotenia relevantnosti príslušnosti k tejto rubrike, nastavenú pri zadávaní dokumentu do systému. Možnosť participácie systémových dokumentov na tvorbe cvičnej vzorky je obzvlášť vhodná pri konštrukcii spresňovacej vzorky.

Kvalita vybudovaného autorubrikátora systému je určená výsledkami automatického určenia predmetu prichádzajúcich informácií. Automatická rubrikácia dokumentov sa vykonáva vo fáze zadávania informácií do databázy. Dokumentom je priradené skóre relevantnosti, ktoré charakterizuje príslušnosť k jednej alebo druhej rubrike (alebo niekoľkým rubrikám). Dokumenty, ktorých predmet nie je stanovený, patria do posledného nadpisu rubrikátora (napríklad „Rôzne“). Ak je kvalita definície predmetu nevyhovujúca, treba preškoliť autorubrikátora s upresnením zloženia tréningovej vzorky a prekategorizovať rovnaký súbor dokumentov (obr. 2).

Ryža. 2. Proces budovania rubrikátora.

Výsledok školiaceho programu (súbor charakteristických výrazov) je k dispozícii na prezeranie a úpravu. Odborník má možnosť opraviť váhu konkrétneho výrazu, pridať nový výraz alebo nepotrebný výraz vymazať.

Pripravený a vyškolený rubrikátor je zverejnený na systémovom serveri alebo je okamžite dostupný pre ďalšiu prácu (ak sa používa lokálna verzia systému).

Používateľská úloha

Práca používateľa systému začína určením zoznamu informačných zdrojov, nastavením plánu pre program, ktorý spracováva internetové médiá, a špecifikovaním zoznamu adresárov, v ktorých sa budú zhromažďovať prichádzajúce spravodajské kanály. Okrem toho musíte vybrať rubrikátora. Systém umožňuje prácu s viacerými rubrikátormi, t. j. každý dokument môže byť zaradený do viacerých rubrikátorov, avšak v danom čase musí byť aktuálny iba jeden rubrikátor.

Štandardne je systém nastavený tak, že jeden dokument je súčasne kategorizovaný pod viacerými nadpismi. Je však možné – a to je výhodné pri zostavovaní štatistických výkazov – nastaviť automatickú kategorizáciu podľa dokumentu patriaceho len do jednej rubriky.

Vkladanie dokumentov

Vstupný systém podporuje automatické prezeranie spravodajských stránok vopred určených stránok v určenej frekvencii a v súlade s harmonogramom. Použitie plánovacieho systému vám umožňuje rozložiť prácu pri zadávaní správ a odkázať ich napríklad na nočný alebo obedový čas.

Predbežné spracovanie internetovej stránky správ spočíva vo výbere jednotlivých správ z bloku správ a analýze štruktúry každej správy, t. j. vo výbere fragmentu textu a zoznamu podrobností, ktoré ho sprevádzajú. Takto pripravené správy sa prenesú do vstupného systému, pri ktorom sa vykoná kontrola duplicitných informácií a následne sa text automaticky rubrikuje. Opakované doklady sa do systému nevkladajú. Všetky informácie o práci s internetovými médiami sa premietajú do špeciálneho protokolu.

Pri spracovaní informačných kanálov rôznych formátov V prvom rade je určený formát tejto pásky. Upozorňujeme, že jeden stream môže obsahovať spravodajské kanály rôznych formátov. Potom sa z informačného kanála vyberú samostatné správy a prenesú sa do vstupného systému. Novinky, ktorých formát systém nedokázal automaticky určiť, sa zhromažďujú na vopred určenom mieste. V budúcnosti môžete manuálne určiť formát, v ktorom sa majú zadávať. Okrem toho je možné do "Astarta" zadávať aj takzvané neformátované dokumenty, teda dokumenty, ktorých formát nie je v systéme popísaný. Indikácia, že sa teraz zadá tok neformálnych dokumentov, sa vykonáva manuálne.

Na spracovanie papierových dokumentov v systéme je možné spustiť skenovací program a v jeho rozhraní určiť umiestnenie prijímaných grafických obrázkov dokumentov. Následné zadávanie takýchto dokumentov do systému sa vykonáva ručne pomocou dodatočná príležitosť rozpoznávanie textu dokumentu „za chodu“ (drag&recog) pri vypĺňaní detailov dokumentu. Automatická fulltextová indexácia grafického dokumentu je možná aj „slepým“ rozpoznaním celého grafického obrazu a prenesením rozpoznaného textu do modulu fulltextovej indexácie.

Vyhľadávanie dokumentov

rozvetvený vyhľadávací systém Softvérový balík "Astarta" (obr. 3) umožňuje zostavovanie komplexných dopytov, podporujúcich organizáciu fulltextového, kontextového a atribútového vyhľadávania dokumentov v lokálnom aj serverovom dátovom úložisku. Pri organizácii vyhľadávania sa využívajú metódy morfologického rozboru, ktoré umožňujú nájsť v texte dokumentu nielen presne zadané slovo (alebo slovné spojenie), ale aj všetky jeho slovné formy. Vyhľadávanie s prihliadnutím na morfológiu sa môže vykonávať v texte dokumentu aj v jeho detailoch.


Ryža. 3. Vytvorenie žiadosti o vyhľadávanie dokumentov.

Systémové rozhranie vám umožňuje generovať dotazy pomocou logických operácií A, ALEBO, NIE, čím označuje presnejšie podmienky pre vyhľadávanie informácií. Existuje aj množstvo nástrojov a funkcií, ktoré zjednodušujú prácu pri generovaní požiadavky na vyhľadávanie dokumentov:

  • prítomnosť slovníkov s podrobnosťami o systéme (zjednodušuje výber požadovanej hodnoty);
  • schopnosť špecifikovať dátum v „prirodzenom“ jazyku (napríklad výber dátumu „marec 2003“ je ekvivalentný špecifikovaniu intervalu od 1.03.03 do 31.03.03);
  • generovanie dotazu na základe výsledkov vyhľadávania;
  • ukladanie preddefinovaných dopytov.

Tvorba tráv

Neoddeliteľnou súčasťou je vytváranie súhrnných správ (digestov) zoskupených podľa rôznych informačných výsekov funkčnosť systémov (obr. 4). Pre realizáciu tejto možnosti má systém Astarta komponent, ktorý umožňuje vytvárať rôzne šablóny pre prezentáciu informácií v reportoch, kde sú špecifikované štýly a štruktúra všetkých komponentov reportov a je uvedený spôsob triedenia dokumentov. Dostupné nastavenia vám umožňujú zostaviť súhrn len na anotáciách dokumentov alebo vygenerovať fulltextový súhrn. S veľkým množstvom informácií môžete vytvoriť viaczväzkový dokument alebo naopak iba obsah.


Ryža. 4. Vytvorenie súhrnnej správy (digest).

V predvolenom nastavení sa konečný dokument vytvorí v vo formáte Microsoft Word si však vo fáze vypĺňania šablóny môžete vybrať iný formát prezentácie údajov.

Vytváranie štatistických súhrnov

Hlavnou úlohou štatistickej analýzy je určiť vývojové trendy skúmaného problému. Najnázornejšie spôsoby prezentácie výsledkov sú časové rady znázorňujúce vývoj skúmanej veličiny v čase a diagram znázorňujúci podiel skúmanej veličiny v pomere k ostatným veličinám. Ak si riešenie prognostických problémov vyžaduje použitie rôznych štatistických balíkov pomocou špeciálnych algoritmov (napríklad algoritmus autoregresie a integrálneho kĺzavého priemeru ARISS - ARIMA), potom kvalitatívny odhad získaný na základe skonštruovaného časového radu možno získať pomocou štandardný balík Excel.

Obidva spôsoby konštrukcie rôznych štatistických prehľadov sú implementované v systéme „Astarta“: s využitím možností balíka Statistica 5.5 alebo štandardného balíka Excel. Pri exporte do Excelu zo systémového rozhrania môžete určiť typ prezentácie informácií: graf, koláčový graf alebo tabuľka. Príklad časového radu vytvoreného pomocou balíka Excel pre rubrikátor lokality Lenta.ru je znázornený na obr. 5.

Záver

Informačné a analytické služby podnikov sa pri svojej práci musia zaoberať širokou škálou zdrojov informácií. Sú to papierové periodiká, elektronické noviny, iné internetové zdroje, Email, prenos spravodajských tokov cez IP a ftp kanály atď. Použitie technológie na spracovanie a analýzu informácií z rôznych zdrojov opísanej v článku s automatickým zoskupovaním podľa tematických prvkov minimalizuje pravdepodobnosť chýbania potrebných informácií. Automatické filtrovanie tokov vám umožňuje rýchlo získať ucelený informačný obraz a na podrobné štúdium prichádzajúcich informácií je možné použiť výkonný vyhľadávací nástroj s konštrukciou zložitých dopytov.

Skúsenosti s implementáciou informačno-analytického systému v rôznych organizáciách ukázali vysokú efektivitu a jednoduchosť prispôsobenia systému lokálnym podmienkam vďaka vyvinutému univerzálnemu nástroju na automatizované načítavanie rozsiahlych textových informačných tokov heterogénnej štruktúry.

Universal Format Parser umožňuje plne automatizovať vstup elektronických informačných tokov z heterogénnych zdrojov s informáciami privedenými do jedinej internej reprezentácie, ako aj minimalizovať rutinnú prácu pri zadávaní nepravidelných textových údajov (napríklad zadávanie textov z papierových médií). pri rozpoznávaní článkov z tlačové médiá, zapisovanie poznámok a v budúcnosti aj automatické rozpoznávanie aktuálnych zvukových informácií atď.). Vstavaný systém automatického sledovania zverejňovania „čerstvých“ správ na informačných stránkach na internete umožňuje automatizovať túto časť činnosti informačných a analytických služieb podnikov.

Dôležitou okolnosťou je flexibilita navrhovanej technológie autokategorizácie (tematické filtrovanie). Zostavenie zoznamu hesiel a školenie systému môže pre potreby špecializovaných informačných a analytických služieb vykonať odborník - špecialista na informačno-analytický servis konkrétneho podniku. Odborník by mal mať k dispozícii aj rozsahy spoľahlivých hodnotení relevantnosti dokumentov k daným položkám ako nástroj na analýzu alebo samoučenie systému na čerstvých údajoch.

Analytický blok slúži na automatizáciu procesu prípravy správ a súhrnov a tiež umožňuje analytikovi sledovať a predpovedať odraz vo verejnosti. informačný priestor(médiá, internet,..) rôzne trendy vo vývoji konkrétnej tematickej oblasti.

Efektívnosť informačno-analytických systémov tejto triedy možno zlepšiť vývojom a implementáciou metód umelej inteligencie aplikovaných na analýzu textu, najmä metód na automatickú sémantickú analýzu textov, teda porozumenie.

4. Klasifikácia produktov OLAP.

5. Princípy fungovania OLAP klientov.

7. Oblasti použitia OLAP-technológií.

8. Príklad využitia OLAP technológií na analýzu v oblasti predaja.

1. Miesto OLAP v informačnej štruktúre podniku.

Pojem „OLAP“ je neoddeliteľne spojený s pojmom „dátový sklad“ (Data Warehouse).

Dáta v úložisku pochádzajú z operačných systémov (OLTP systémy), ktoré sú určené na automatizáciu obchodných procesov. Úložisko je navyše možné doplniť o externých zdrojov ako sú štatistické správy.

Úlohou úložiska je poskytnúť „surovinu“ na analýzu na jednom mieste a v jednoduchej, zrozumiteľnej štruktúre.

Existuje ďalší dôvod, ktorý ospravedlňuje vzhľad samostatného úložiska - zložité analytické dotazy na prevádzkové informácie spomaľujú súčasnú prácu spoločnosti, blokujú tabuľky na dlhú dobu a zaberajú zdroje servera.

Pod úložiskom možno chápať nie nevyhnutne obrovskú akumuláciu údajov - hlavná vec je, že je vhodná na analýzu.

Centralizácia a pohodlná štruktúra nie sú zďaleka všetko, čo analytik potrebuje. Koniec koncov, stále potrebuje nástroj na prezeranie, vizualizáciu informácií. Tradičným reportom, dokonca vybudovaným na základe jediného úložiska, chýba jedna vec – flexibilita. Nemožno ich "skrútiť", "rozbaliť" alebo "zbaliť", aby ste získali požadovaný pohľad na údaje. Prial by som si, aby mal taký nástroj, ktorý by mu umožnil jednoducho a pohodlne rozbaliť a zbaliť údaje! OLAP je jedným z takýchto nástrojov.

Hoci OLAP nie je nevyhnutným atribútom dátového skladu, stále viac sa používa na analýzu informácií nahromadených v tomto dátovom sklade.

Miesto OLAP informačnú štruktúru podnikov (obr. 1).

Obrázok 1. MiestoOLAP v informačnej štruktúre podniku

Prevádzkové údaje sa zhromažďujú z rôznych zdrojov, čistia sa, integrujú a vkladajú do relačného úložiska. Zároveň sú už dostupné na analýzu pomocou rôznych reportovacích nástrojov. Potom sa údaje (celé alebo ich časti) pripravia na analýzu OLAP. Môžu byť načítané do špeciálnej databázy OLAP alebo ponechané v relačnom obchode. Jeho najdôležitejším prvkom sú metadáta, teda informácie o štruktúre, umiestnení a transformácii údajov. Vďaka nim je zabezpečená efektívna súhra rôznych skladovacích komponentov.

Stručne povedané, môžeme OLAP definovať ako súbor nástrojov na multidimenzionálnu analýzu údajov nahromadených v sklade.

2. Operatívne analytické spracovanie dát.

Koncept OLAP je založený na princípe viacrozmernej reprezentácie dát. V roku 1993 E. F. Codd zvážil nedostatky relačného modelu, v prvom rade poukázal na nemožnosť „kombinovať, prezerať a analyzovať dáta z hľadiska multidimenzionality, teda pre podnikových analytikov najzrozumiteľnejším spôsobom“, a definoval všeobecné požiadavky na OLAP systémy, ktorý rozširuje funkcionalitu relačnej DBMS a ako jednu zo svojich charakteristík zahŕňa multidimenzionálnu analýzu.

Podľa Codda je viacrozmerný koncepčný pohľad na údaje viacnásobnou perspektívou pozostávajúcou z niekoľkých nezávislých dimenzií, podľa ktorých možno analyzovať určité súbory údajov.

Simultánna analýza viacerých dimenzií je definovaná ako multivariačná analýza. Každá dimenzia zahŕňa smery konsolidácie údajov, ktoré pozostávajú zo série po sebe nasledujúcich úrovní zovšeobecnenia, pričom každá vyššia úroveň zodpovedá vyššiemu stupňu agregácie údajov pre príslušnú dimenziu.

Dimenzia Dodávateľ teda môže byť určená smerom konsolidácie, pozostávajúca z úrovní zovšeobecnenia "podnik - pododdelenie - oddelenie - zamestnanec". Dimenzia Čas môže dokonca zahŕňať dva smery konsolidácie - "rok - štvrťrok - mesiac - deň" a "týždeň - deň", pretože počítanie času po mesiacoch a týždňoch nie je kompatibilné. V tomto prípade je možné ľubovoľne zvoliť požadovanú úroveň podrobností informácií pre každé z meraní.

Operácia zostupu (vŕtanie dole) zodpovedá pohybu z vyšších úrovní konsolidácie k nižším; naopak prevádzka zdvíhania (rolovania) znamená presun z nižších úrovní do vyšších úrovní (obr. 2).


Obrázok 2Rozmery a smery konsolidácie dát

3. Požiadavky na prostriedky operatívneho analytického spracovania.

Multidimenzionálny prístup vznikol takmer súčasne a paralelne so vzťahovým prístupom. Avšak až od polovice deväťdesiatych rokov, alebo skôr od
1993, záujem o MDBMS sa začal stávať všeobecným. Práve v tomto roku sa objavil nový politický článok jedného zo zakladateľov relačného prístupu E. Codda, v ktorom sformuloval 12 základných požiadaviek na prostriedky realizácie OLAP(Stôl 1).

Stôl 1.

Multidimenzionálne zobrazenie údajov

Nástroje musia podporovať viacrozmerný pohľad na údaje na koncepčnej úrovni.

Transparentnosť

Používateľ nemusí vedieť, aké konkrétne prostriedky sa používajú na ukladanie a spracovanie údajov, ako sú údaje usporiadané a odkiaľ pochádzajú.

Dostupnosť

Samotné nástroje si musia vybrať a spojiť najlepší zdroj údajov, aby vytvorili odpoveď na danú požiadavku. Nástroje by mali poskytovať vlastné automatické zobrazenie logický diagram na rôzne heterogénne zdroje údajov.

Konzistentný výkon

Výkon by mal byť prakticky nezávislý od počtu dimenzií v dotaze.

Podpora architektúry klient-server

Nástroje musia fungovať v architektúre klient-server.

Rovnosť všetkých rozmerov

Žiadny z rozmerov by nemal byť základný, všetky by mali byť rovnaké (symetrické).

Dynamická manipulácia s riedkymi maticami

Nulové hodnoty by sa mali ukladať a spracovať čo najefektívnejším spôsobom.

Podpora viacužívateľského režimu práce s dátami

Nástroje by mali umožniť prácu viacerým používateľom.

Podpora pre operácie založené rôzne merania

Všetky viacrozmerné operácie (napr. agregácia) sa musia aplikovať jednotne a konzistentne na ľubovoľný počet ľubovoľných dimenzií.

Jednoduchosť manipulácie s údajmi

Nástroje by mali mať čo najpohodlnejšie, najprirodzenejšie a najpohodlnejšie používateľské rozhranie.

Pokročilé nástroje na prezentáciu údajov

Finančné prostriedky musia podporovať rôznymi spôsobmi vizualizácia (reprezentácia) údajov.

Neobmedzený počet dimenzií a úrovní agregácie údajov

Počet podporovaných dimenzií by nemal byť obmedzený.

Pravidlá hodnotenia softvérových produktov triedy OLAP

Súbor týchto požiadaviek, ktoré slúžili ako de facto definícia OLAP, by sa mal považovať za odporúčania a jednotlivé produkty by sa mali posudzovať podľa stupňa aproximácie, aby sa v ideálnom prípade úplne splnili všetky požiadavky.

Neskôr bola Coddova definícia prepracovaná do takzvaného testu FASMI, ktorý vyžaduje, aby aplikácia OLAP poskytovala schopnosť rýchlo analyzovať zdieľané viacrozmerné informácie.

Pamätať si Coddových 12 pravidiel je pre väčšinu ľudí príliš zaťažujúce. Ukázalo sa, že definíciu OLAP je možné zhrnúť iba piatimi Kľúčové slová: Rýchla analýza zdieľaných viacrozmerných informácií – alebo stručne – FASMI (preložené z angličtiny:F ast A analýza S zdieľané M ultradimenzionálny ja informácie).

Táto definícia bola prvýkrát sformulovaná začiatkom roku 1995 a odvtedy nie je potrebná revízia.

RÝCHLE ( rýchlo) - znamená, že systém by mal používateľom poskytnúť väčšinu odpovedí do približne piatich sekúnd. Zároveň sú najjednoduchšie požiadavky spracované do jednej sekundy a veľmi málo - viac ako 20 sekúnd. Výskum ukázal, že koncoví používatelia vnímajú, že proces zlyhá, ak sa výsledky nedostanú po 30 sekundách.

Na prvý pohľad sa môže zdať prekvapujúce, že pri prijatí správy za minútu, čo nie je tak dávno, čo trvalo niekoľko dní, sa používateľ pri čakaní veľmi rýchlo začne nudiť a projekt sa ukáže byť oveľa menej úspešný ako v prípade okamžitú odozvu aj za cenu menej podrobnej analýzy.

ANALÝZA (Analýza)znamená, že systém dokáže spracovať akúkoľvek logickú a štatistickú analýzu špecifickú pre túto aplikáciu a zabezpečuje jeho uchovanie vo forme dostupnej pre koncového užívateľa.

Nie je až také dôležité, či sa táto analýza vykonáva vo vlastných nástrojoch dodávateľa alebo v súvisiacom externom softvérovom produkte, akým je napríklad tabuľkový procesor, ale jednoducho všetky požadované analytické funkcie musia byť poskytované koncovým používateľom intuitívnym spôsobom. Analytické nástroje môžu zahŕňať špecifické postupy, ako je analýza časových radov, alokácia nákladov, menové prevody, vyhľadávanie cieľov, zmena viacrozmerných štruktúr, neprocedurálne modelovanie, detekcia výnimiek, extrakcia údajov a iné operácie závislé od aplikácie. Takéto schopnosti sa medzi výrobkami značne líšia v závislosti od cieľovej orientácie.

ZDIEĽANÉ (zdieľané) znamená, že systém presadzuje všetky požiadavky na ochranu dôvernosti (možno až na úroveň bunky) a ak sa vyžaduje viacnásobný prístup k zápisu, vynucuje uzamknutie modifikácií na príslušnej úrovni. Nie všetky aplikácie potrebujú zapisovať dáta. Počet takýchto aplikácií však rastie a systém musí byť schopný včas a bezpečne zvládnuť viaceré úpravy.

VIACROZMERNÉ - toto je kľúčová požiadavka. Ak by sme mali OLAP definovať jedným slovom, vybrali by sme si ho. Systém by mal poskytovať viacrozmernú koncepčnú reprezentáciu údajov vrátane plnej podpory hierarchií a viacerých hierarchií, pretože je to určite najlogickejší spôsob analýzy podnikania a organizácií. Neexistuje žiadny minimálny počet rozmerov, ktoré sa musia spracovať, pretože to závisí aj od aplikácie a väčšina produktov OLAP má dostatok rozmerov pre trhy, na ktoré sa zameriavajú.

INFORMÁCIE - to je všetko. Potrebné informácie treba získať tam, kde sú potrebné. Veľa však závisí od aplikácie. Sila rôznych produktov sa meria podľa toho, koľko vstupu dokážu spracovať, nie podľa toho, koľko gigabajtov dokážu uložiť. Sila produktov sa značne líši – najväčšie produkty OLAP dokážu spracovať najmenej tisíckrát viac údajov ako tie najmenšie. V tejto súvislosti je potrebné zvážiť mnoho faktorov vrátane duplikácie údajov, požadovanej pamäte RAM, využitia miesta na disku, výkonu, integrácie s úložiskami informácií atď.

Test FASMI je rozumnou a zrozumiteľnou definíciou cieľov, na ktoré sa OLAP zameriava.

4. KlasifikáciaOLAP- Produkty.

Takže podstata OLAP spočíva v tom, že prvotné informácie pre analýzu sú prezentované vo forme viacrozmernej kocky a je možné s nimi ľubovoľne manipulovať a získavať potrebné informačné sekcie – reporty. Koncový používateľ zároveň vidí kocku ako viacrozmernú dynamickú tabuľku, ktorá automaticky sumarizuje údaje (fakty) v rôznych sekciách (dimenziách) a umožňuje interaktívne spravovať výpočty a formu zostavy. Tieto operácie sa vykonávajú OLAP stroj (alebo stroj OLAP výpočtová technika).

K dnešnému dňu bolo vo svete vyvinutých veľa produktov, ktoré implementujú OLAP -technológie. Na uľahčenie navigácie medzi nimi použite klasifikácie OLAP -produkty: prostredníctvom uchovávania údajov na analýzu a podľa miesta OLAP - autá. Pozrime sa bližšie na jednotlivé kategórie. OLAP produkty.

Klasifikácia podľa spôsobu ukladania údajov

Viacrozmerné kocky sú zostavené na základe zdrojových a súhrnných údajov. Zdrojové aj agregované údaje pre kocky môžu byť uložené v relačných aj viacrozmerných databázach. Preto v súčasnosti existujú tri spôsoby ukladania údajov: MOLAP (Multidimenzionálny OLAP), ROLAP (Relačný OLAP) a HOLAP (Hybridný OLAP ). resp. OLAP -produkty podľa spôsobu ukladania údajov sú rozdelené do troch podobných kategórií:

1. V prípade MOLAP , zdrojové a súhrnné údaje sú uložené vo viacrozmernej databáze alebo vo viacrozmernej lokálnej kocke.

2. V ROLAP -produkty, zdrojové údaje sú uložené v relačných databázach alebo v plochých lokálnych tabuľkách na súborovom serveri. Súhrnné údaje možno umiestniť do servisných tabuliek v rovnakej databáze. Konverzia údajov z relačnej databázy do viacrozmerných kociek prebieha na požiadanie OLAP nástroje.

3. V prípade použitia HOLAP architektúre, zdrojové dáta zostávajú v relačnej databáze, zatiaľ čo agregáty sú umiestnené v multidimenzionálnej. Budovanie OLAP -kocka vykonaná na požiadanie OLAP -nástroje založené na relačných a viacrozmerných údajoch.

Klasifikácia miesta OLAP- autá.

Na tomto základe OLAP -Produkty sa delia na Servery OLAP a klienti OLAP:

· Na serveri OLAP -prostriedky na výpočet a ukladanie súhrnných údajov vykonáva samostatný proces - server. Klientska aplikácia prijíma iba výsledky dotazov na multidimenzionálne kocky, ktoré sú uložené na serveri. Niektorí OLAP -servery podporujú ukladanie údajov iba v relačných databázach, niektoré - iba v multidimenzionálnych. Mnohé moderné OLAP -servery podporujú všetky tri spôsoby ukladania údajov:MOLAP, ROLAP a HOLAP.

MOLAP.

MOLAP je Viacrozmerné on-line analytické spracovanie, tj viacrozmerný OLAP.To znamená, že server používa na ukladanie údajov multidimenzionálnu databázu (MBD). Význam používania MDB je zrejmý. Dokáže efektívne ukladať dáta, ktoré sú svojou povahou multidimenzionálne, a poskytuje prostriedky na rýchle obsluhovanie databázových dotazov. Údaje sa prenesú zo zdroja údajov do viacrozmernej databázy a potom sa databáza agreguje. Predbežný výpočet je to, čo urýchľuje OLAP dotazy, pretože súhrnné údaje už boli vypočítané. Čas dotazu sa stáva výlučne funkciou času potrebného na prístup ku konkrétnej časti údajov a vykonanie výpočtu. Táto metóda podporuje koncepciu, že práca sa vykoná raz a výsledky sa potom používajú znova a znova. Viacrozmerné databázy sú relatívne novou technológiou. Použitie MDB má rovnaké nevýhody ako väčšina nových technológií. Konkrétne nie sú také stabilné ako relačné databázy (RDB) a nie sú optimalizované v rovnakej miere. Ďalšou slabou stránkou MDB je neschopnosť používať väčšinu multidimenzionálnych databáz v procese agregácie údajov, takže trvá určitý čas. nové informácie boli k dispozícii na analýzu.

ROLAP.

ROLAP je Relačné on-line analytické spracovanie, teda relačný OLAP.Termín ROLAP znamená, že OLAP server je založený na relačnej databáze. Zdrojové údaje sa vkladajú do relačnej databázy, zvyčajne v schéme hviezdy alebo snehovej vločky, aby sa skrátili časy získavania. Server poskytuje viacrozmerný dátový model pomocou optimalizovaných SQL dotazov.

Existuje množstvo dôvodov, prečo zvoliť relačné databázy pred multidimenzionálnou databázou. RDB je dobre zavedená technológia s mnohými príležitosťami na optimalizáciu. Reálne používanie viedlo k vyspelejšiemu produktu. Navyše, RDB podporujú väčšie množstvo dát ako MDB. Práve na takéto objemy sú určené. Hlavným argumentom proti RDB je zložitosť dopytov potrebných na získanie informácií z veľkej databázy s pomocou SQL. Neskúsený SQL programátor by mohol ľahko zaťažiť cenné systémové zdroje tým, že by sa pokúsil niečo urobiť. podobná žiadosť, čo je v MDB oveľa jednoduchšie.

Agregované/vopred agregované údaje.

Rýchla implementácia dotazov je pre OLAP nevyhnutná. Toto je jeden zo základných princípov OLAP – schopnosť intuitívne manipulovať s údajmi vyžaduje rýchle vyhľadávanie informácií. Vo všeobecnosti platí, že čím viac výpočtov je potrebné vykonať na získanie určitej informácie, tým pomalšia je odozva. Preto, aby sa ušetril krátky čas implementácie dotazu, fragmenty informácií, ku ktorým sa zvyčajne pristupuje najčastejšie, ale ktoré vyžadujú výpočet, sú vopred agregované. To znamená, že sa spočítajú a potom sa uložia do databázy ako nové údaje. Príkladom typu údajov, ktoré je možné vopred vypočítať, sú súhrnné údaje, ako sú mesačné, štvrťročné alebo ročné údaje o predaji, pre ktoré sú aktuálne zadané údaje denné.

Rôzni predajcovia majú rôzne metódy výberu parametrov, ktoré vyžadujú predbežnú agregáciu a množstvo vopred vypočítaných hodnôt. Prístup k agregácii ovplyvňuje databázu aj čas vykonávania dotazov. Ak sa počíta viac hodnôt, zvyšuje sa pravdepodobnosť, že používateľ bude požadovať už vypočítanú hodnotu, a preto sa skráti čas odozvy, pretože nebude potrebné žiadať pre výpočet počiatočnú hodnotu. Ak však vypočítame všetky možné hodnoty, nie je to tak najlepšie riešenie- v tomto prípade sa veľkosť databázy výrazne zväčší, čím sa stane neriaditeľnou a čas agregácie bude príliš dlhý. Okrem toho, keď sa do databázy pridajú číselné hodnoty alebo ak sa zmenia, tieto informácie sa musia prejaviť vo vopred vypočítaných hodnotách, ktoré závisia od nových údajov. Aktualizácia databázy teda môže v prípade aj trvať dlho Vysoké číslo vopred vypočítané hodnoty. Keďže databáza počas agregácie zvyčajne pracuje offline, je žiaduce, aby čas agregácie nebol príliš dlhý.

OLAP Klient je nakonfigurovaný inak. Konštrukcia viacrozmernej kocky a OLAP -výpočty sa vykonávajú v pamäti klientskeho počítača.OLAP -zákazníci sa delia aj na ROLAP a MOLAP.A niektoré môžu podporovať obe možnosti prístupu k údajom.

Každý z týchto prístupov má svoje pre a proti. Na rozdiel od všeobecného presvedčenia o výhodách serverových nástrojov oproti klientskym, v mnohých prípadoch použitie OLAP -používanie klienta pre používateľov môže byť efektívnejšie a ziskovejšie OLAP servery.

Vývoj analytických aplikácií pomocou klientskych nástrojov OLAP je rýchly proces a nevyžaduje špeciálne školenie vykonávateľa. Používateľ, ktorý pozná fyzickú implementáciu databázy, môže vyvinúť analytickú aplikáciu sám, bez zapojenia IT špecialistu.

Keď používate OLAP server, musíte sa naučiť 2 rôzne systémy, niekedy od rôznych dodávateľov, aby ste vytvorili kocky na serveri a vyvinuli klientsku aplikáciu.

Klient OLAP poskytuje jediné vizuálne rozhranie na popis kociek a prispôsobenie používateľských rozhraní pre ne.

V akých prípadoch teda môže byť používanie klienta OLAP pre používateľov efektívnejšie a výhodnejšie ako používanie servera OLAP?

· Ekonomická realizovateľnosť aplikácie OLAP - server nastane, keď je množstvo údajov veľmi veľké a neúnosné OLAP -klient, inak je použitie toho druhého opodstatnenejšie. V tomto prípade OLAP -Zákazník kombinuje vysoké výkonové charakteristiky a nízke náklady.

· Výkonné analytické počítače sú ďalším argumentom v prospech OLAP -klienti. Pri aplikácii OLAP -server tieto kapacity nevyužívajú.

Medzi ďalšie výhody klientov OLAP patria:

· Náklady na implementáciu a údržbu OLAP -zákazník je výrazne nižší ako náklady na OLAP server.

· Použitím OLAP -klient so zabudovaným strojovým prenosom dát cez sieť sa vykonáva raz. Počas toho OLAP -operácie sa negenerujú nové dátové toky.

5. Princípy fungovania OLAP-klienti.

Zvážte proces vytvárania OLAP aplikácie pomocou klientskeho nástroja (obr. 1).

Obrázok 1.Vytvorte aplikáciu OLAP pomocou nástroja ROLAP Client Tool

Princípom fungovania klientov ROLAP je predbežný popis sémantickej vrstvy, za ktorou sa skrýva fyzická štruktúra zdrojových dát. V tomto prípade môžu byť zdrojmi údajov: lokálne tabuľky, RDBMS. Zoznam podporovaných zdrojov údajov je určený konkrétnym softvérovým produktom. Potom môže používateľ samostatne manipulovať s objektmi, ktorým rozumie z hľadiska predmetnej oblasti, a vytvárať kocky a analytické rozhrania.

Princíp fungovania klienta servera OLAP je odlišný. Na serveri OLAP pri vytváraní kociek používateľ manipuluje s fyzickými popismi databázy. Tým sa vytvárajú vlastné popisy v samotnej kocke. Klient OLAP Server je nakonfigurovaný len pre kocku.

Pri vytváraní sémantickej vrstvy sa zdroje údajov - tabuľky Predaj a Dohoda - popíšu pojmami zrozumiteľnými pre koncového používateľa a zmenia sa na "Produkty" a "Ponuky". Pole „ID“ z tabuľky „Produkty“ sa premenuje na „Kód“ a „Názov“ na „Produkt“ atď.

Potom sa vytvorí obchodný objekt Predaj. Podnikateľský objekt je plochý stôl, na základe ktorého je vytvorená viacrozmerná kocka. Pri vytváraní obchodného objektu sú tabuľky „Produkty“ a „Ponuky“ spojené poľom „Kód“ produktu. Keďže sa nebude vyžadovať zobrazenie všetkých polí tabuliek v zostave, obchodný objekt používa iba polia "Položka", "Dátum" a "Suma".

V našom príklade bol na základe obchodného objektu „Predaj“ vytvorený prehľad o predaji tovaru podľa mesiacov.

Pri práci s interaktívnou zostavou môže používateľ nastaviť podmienky filtrovania a zoskupovania rovnakými jednoduchými pohybmi myši. V tomto bode klient ROLAP pristupuje k údajom vo vyrovnávacej pamäti. Klient OLAP servera vygeneruje nový dotaz do multidimenzionálnej databázy. Napríklad použitím produktového filtra v prehľade predaja môžete získať prehľad o predaji produktov, ktoré nás zaujímajú.

Všetky nastavenia pre aplikáciu OLAP môžu byť uložené vo vyhradenom úložisku metadát, v aplikácii alebo v úložisku multidimenzionálneho databázového systému.Implementácia závisí od konkrétneho softvérového produktu.

Všetko, čo je súčasťou týchto aplikácií, je štandardný pohľad na rozhranie, preddefinované funkcie a štruktúru a rýchle opravy pre viac-menej štandardné situácie. Obľúbené sú napríklad finančné balíčky. Predpripravené finančné aplikácie umožnia odborníkom používať známe finančné nástroje bez toho, aby museli navrhovať štruktúru databázy alebo bežné formuláre a zostavy.

Internet je nový formulár zákazník. Navyše nesie pečať nových technológií; veľa internetové riešenia sa výrazne líšia svojimi schopnosťami vo všeobecnosti a najmä kvalitou riešenia OLAP. Generovanie správ OLAP cez internet má mnoho výhod. Najdôležitejšie je, že nie sú potrebné špecializované softvér na prístup k informáciám. To firme šetrí veľa času a peňazí.

6. Výber aplikačnej architektúry OLAP.

Pri implementácii informačno-analytického systému je dôležité nepomýliť sa pri výbere architektúry OLAP aplikácie. Doslovný preklad termínu On-Line Analytical Process - "on-line analytické spracovanie" - je často braný doslovne v tom zmysle, že dáta vstupujúce do systému sú rýchlo analyzované. Toto je mylná predstava - účinnosť analýzy s tým nijako nesúvisí reálny čas aktualizácia údajov v systéme. Táto charakteristika sa vzťahuje na čas odozvy systému OLAP na požiadavky používateľov. Analyzované dáta sú zároveň často snímkou ​​informácií „za včerajšok“, ak sa napríklad dáta v úložiskách aktualizujú raz denne.

V tomto kontexte je preklad OLAP ako „interaktívne analytické spracovanie“ presnejší. Práve schopnosť analyzovať dáta v interaktívnom režime odlišuje OLAP systémy od systémov na prípravu regulovaných reportov.

Ďalšou črtou interaktívneho spracovania vo formulácii praotca OLAP, E. Codda, je schopnosť „kombinovať, prezerať a analyzovať dáta z hľadiska viacerých dimenzií, teda tým najzrozumiteľnejším spôsobom pre podnikových analytikov“. Pre samotného Codda pojem OLAP označuje mimoriadne špecifický spôsob prezentácie dát na koncepčnej úrovni – multidimenzionálny. Na fyzickej úrovni môžu byť dáta uložené v relačných databázach, ale v skutočnosti nástroje OLAP pracujú skôr s multidimenzionálnymi databázami, v ktorých sú dáta organizované vo forme hyperkocky (obrázok 1).

Obrázok 1. OLAP- kocka (hyperkocka, metakocka)

Zároveň je relevantnosť týchto údajov určená momentom naplnenia hyperkocky novými údajmi.

Je zrejmé, že čas vzniku multidimenzionálnej databázy výrazne závisí od množstva dát do nej načítaných, preto je rozumné toto množstvo obmedziť. Ako však nezúžiť možnosti analýzy a nepripraviť používateľa o prístup ku všetkým zaujímavým informáciám? Existujú dve alternatívne cesty: Analyzovať a potom dopytovať („Najskôr analyzovať – potom vyžiadať dodatočné informácie“) a Dopytovať a potom analyzovať („Najskôr dopytovať údaje – potom analyzovať“).

Stúpenci prvej cesty navrhujú načítať zovšeobecnené informácie do viacrozmernej databázy, napríklad mesačné, štvrťročné, ročné výsledky za oddelenia. A ak je potrebné údaje spresniť, používateľ je vyzvaný na vygenerovanie zostavy o relačnej databáze obsahujúcej požadovaný výber, napríklad podľa dní pre dané oddelenie alebo podľa mesiacov a zamestnancov vybraného oddelenia.

Zástancovia druhého spôsobu naopak navrhujú, aby sa používateľ v prvom rade rozhodol pre dáta, ktoré bude analyzovať a načítal ich do mikrokocky – malej viacrozmernej databázy. Oba prístupy sa líšia na koncepčnej úrovni a majú svoje výhody a nevýhody.

Medzi výhody druhého prístupu patrí „čerstvosť“ informácií, ktoré používateľ dostane vo forme viacrozmernej správy – „mikrokocky“. Mikrokocka je vytvorená na základe informácií práve vyžiadaných zo skutočnej relačnej databázy. Práca s mikrokockou prebieha v interaktívnom režime - získavanie častí informácií a ich detailovanie v rámci mikrokocky sa vykonáva okamžite. Ďalším pozitívnym bodom je, že návrh konštrukcie a plnenie mikrokocky vykonáva užívateľ „za behu“, bez účasti správcu databázy. Prístup však trpí aj vážnymi nedostatkami. Používateľ nevidí celkový obraz a musí sa vopred rozhodnúť o smere svojho výskumu. V opačnom prípade môže byť požadovaná mikrokocka príliš malá a nebude obsahovať všetky požadované údaje a používateľ bude musieť požiadať o novú mikrokocku, potom novú, potom ďalšiu a ďalšiu. Prístup analýzy Query potom implementuje nástroj BusinessObjects tej istej spoločnosti a nástrojov platforma spoločnosti ContourIntersoft laboratórium.

S prístupom Analyze then query môže byť množstvo údajov načítaných do multidimenzionálnej databázy pomerne veľké, vyplnenie sa musí vykonávať podľa pravidiel a môže to trvať veľa času. Všetky tieto nedostatky sa však vyplatia neskôr, keď má používateľ k dispozícii takmer všetky potrebné dáta v ľubovoľnej kombinácii. Odkaz na pôvodné údaje v relačnej databáze sa vykonáva len ako posledná možnosť, keď sú potrebné podrobné informácie, napríklad na konkrétnej faktúre.

Prevádzka jednej multidimenzionálnej databázy prakticky nie je ovplyvnená počtom používateľov, ktorí k nej pristupujú. Čítajú iba údaje, ktoré sú tam dostupné, na rozdiel od prístupu Query then analysis, v ktorom počet mikrokociek v limitnom prípade môže rásť rovnakou rýchlosťou ako počet používateľov.

S týmto prístupom sa zvyšuje zaťaženie IT služieb, ktoré sú okrem relačných nútené obsluhovať aj multidimenzionálne databázy.Práve tieto služby sú zodpovedné za včasnosť automatická aktualizácia dáta vo viacrozmerných databázach.

Najvýraznejšími predstaviteľmi prístupu „Analyzovať a potom dotazovať“ sú nástroje PowerPlay a Impromptu od Cognos.

Výber prístupu a nástroja, ktorý ho implementuje, závisí predovšetkým od sledovaného cieľa: vždy musíte nájsť rovnováhu medzi šetrením rozpočtu a zlepšovaním kvality služieb pre koncových používateľov. Zároveň treba brať do úvahy, že v strategickom pláne sleduje tvorba informačných a analytických systémov cieľ dosiahnuť konkurenčnú výhodu a nie vyhnúť sa nákladom na automatizáciu. Napríklad podnikový informačný a analytický systém môže poskytnúť potrebné, včasné a spoľahlivé informácie o spoločnosti, ktorých zverejnenie pre potenciálnych investorov zabezpečí transparentnosť a predvídateľnosť tejto spoločnosti, čo sa nevyhnutne stane podmienkou jej investičnej atraktivity.

7. Oblasti použitia OLAP-technológií.

OLAP je použiteľný všade tam, kde je úlohou analyzovať multifaktoriálne údaje. Vo všeobecnosti, ak máte tabuľku s údajmi, ktorá má aspoň jeden popisný stĺpec (rozmer) a jeden stĺpec s číslami (opatrenia alebo fakty), nástroj OLAP bude zvyčajne účinným nástrojom na analýzu a generovanie správ.

Zvážte niektoré oblasti použitia technológií OLAP prevzaté zo skutočného života.

1. Predaj.

Na základe analýzy štruktúry predaja sa riešia otázky potrebné na prijímanie manažérskych rozhodnutí: zmena sortimentu tovaru, cien, zatváranie a otváranie predajní, pobočiek, vypovedanie a podpisovanie zmlúv s obchodníkmi, vedenie či ukončenie reklamných kampaní a pod.

2. Nákup.

Úloha je opakom analýzy predaja. Mnoho podnikov nakupuje komponenty a materiály od dodávateľov. Obchodníci nakupujú tovar na ďalší predaj. Existuje veľa možných úloh pri analýze obstarávania, od plánovania Peniaze na základe minulých skúseností, kontrolu nad manažérmi výber dodávateľov.

3. Ceny.

Analýza nákupov sa spája s analýzou trhových cien. Účelom tejto analýzy je optimalizácia nákladov, výber najvýhodnejších ponúk.

4. Marketing.

Marketingovou analýzou rozumieme len oblasť analýzy nákupcov alebo zákazníkov-spotrebiteľov služieb. Úlohou tejto analýzy je správne umiestnenie tovaru, identifikácia skupín kupujúcich pre cielenú reklamu a optimalizácia sortimentu. Úlohou OLAP je v tomto prípade poskytnúť používateľovi nástroj, ako rýchlo a rýchlosťou myslenia získať odpovede na otázky, ktoré sa intuitívne vynárajú v priebehu analýzy údajov.

5. Sklad.

Analýza štruktúry stavov zásob v sklade podľa druhov tovaru, skladov, analýza skladovateľnosti tovaru, analýza zásielky podľa príjemcov a mnohé ďalšie typy analýz dôležitých pre podnik sú možné, ak má organizácia skladové účtovníctvo.

6. Peňažný tok.

Toto je celá oblasť analýzy, ktorá má veľa škôl a metód. Technológia OLAP môže slúžiť ako nástroj na implementáciu alebo zlepšenie týchto techník, nie však ako ich náhrada. Peňažné toky bezhotovostných a peňažných prostriedkov sa analyzujú v kontexte obchodných operácií, protistrán, mien a času s cieľom optimalizovať toky, zabezpečiť likviditu atď. Zloženie meraní silne závisí od charakteristík podnikania, odvetvia, metodológie.

7. Rozpočet.

Jedna z najúrodnejších oblastí použitia technológií OLAP. Žiaden za nič moderný systém zostavovanie rozpočtu sa nepovažuje za úplné bez prítomnosti súboru nástrojov OLAP na analýzu rozpočtu v jeho zložení. Väčšina správ o rozpočte je ľahko zostavená na základe systémov OLAP. Reporty zároveň odpovedajú na veľmi širokú škálu otázok: analýza štruktúry výdavkov a príjmov, porovnanie výdavkov na určité položky v rôznych oddeleniach, analýza dynamiky a trendov výdavkov na určité položky, analýza nákladov a zisk.

8. Účtovné účty.

Klasickú súvahu zloženú z čísla účtu a obsahujúcu došlé zostatky, obraty a vyšlú zostatky je možné dokonale analyzovať v systéme OLAP. Okrem toho systém OLAP dokáže automaticky a veľmi rýchlo vypočítať konsolidované zostatky viacodvetvovej organizácie, mesačné, štvrťročné a ročné zostatky, agregované zostatky podľa hierarchie účtov, analytické zostatky na základe analytických charakteristík.

9. Finančné výkazníctvo.

Technologicky vybudovaný systém podávania správ nie je nič iné ako súbor pomenovaných ukazovateľov s hodnotami pre dátum, ktoré je potrebné zoskupiť a zhrnúť do rôznych sekcií, aby sa získali konkrétne správy. V tomto prípade je zobrazovanie a tlač zostáv najjednoduchšie a najlacnejšie implementované v systémoch OLAP. V každom prípade interný systém výkazníctva nie je taký konzervatívny a je možné ho reštrukturalizovať, aby sa ušetrilo inžinierske práce o vytváraní reportov a získaní možnosti viacrozmernej operačnej analýzy.

10. Návštevnosť stránky.

Súbor denníka internetového servera má viacrozmerný charakter, a preto je vhodný na analýzu OLAP. Fakty sú: počet návštev, počet prístupov, čas strávený na stránke a ďalšie informácie dostupné v denníku.

11. Objemy výroby.

Toto je ďalší príklad štatistickej analýzy. Takto je možné analyzovať objemy vypestovaných zemiakov, tavenej ocele, vyrobeného tovaru.

12. Spotreba spotrebného materiálu.

Predstavte si závod pozostávajúci z desiatok dielní, ktoré spotrebúvajú chladiace kvapaliny, preplachovacie kvapaliny, oleje, handry, brúsny papier – stovky položiek spotrebného materiálu. Presné plánovanie a optimalizácia nákladov si vyžadujú dôkladnú analýzu skutočnej spotreby spotrebného materiálu.

13. Využívanie priestorov.

Ďalší typ štatistickej analýzy. Príklady: analýza pracovného zaťaženia učební, prenajatých budov a priestorov, využitie konferenčných miestností atď.

14. Fluktuácia zamestnancov v podniku.

Analýza fluktuácie zamestnancov v podniku v kontexte odborov, oddelení, profesií, stupňa vzdelania, pohlavia, veku, času.

15. Preprava osôb.

Analýza počtu predaných lístkov a súm podľa sezóny, destinácie, typov vozňov (tried), typov vlakov (lietadiel).

Tento zoznam nie je obmedzený na oblasti použitia. OLAP - technológie. Zvážte napríklad technológiu OLAP - analýza predaja.

8. Príklad použitia OLAP -technológie na analýzu v oblasti predaja.

Navrhovanie reprezentácie viacrozmerných údajov pre OLAP -analýza začína vytvorením mapy meraní. Napríklad pri analýze predaja môže byť užitočné identifikovať jednotlivé segmenty trhu (rozvojové, stabilné, veľkí a malí zákazníci, pravdepodobnosť nových zákazníkov atď.) a vyhodnotiť objemy predaja podľa produktov, území, zákazníkov, segmentov trhu, distribúcie. kanály a veľkosti objednávok. Tieto smery tvoria súradnicovú mriežku viacrozmernej reprezentácie predaja – štruktúru jeho dimenzií.

Keďže činnosť každého podniku prebieha v čase, prvou otázkou, ktorá pri analýze vzniká, je otázka dynamiky rozvoja podnikania. Správna organizácia časovej osi poskytne na túto otázku kvalitatívnu odpoveď. Obvykle sa časová os delí na roky, štvrťroky a mesiace. Možno ešte viac rozdelenia na týždne a dni. Štruktúra časovej dimenzie je tvorená s prihliadnutím na frekvenciu prijímania údajov; možno určiť aj podľa frekvencie vyžiadania informácií.

Dimenzia „skupina tovaru“ je navrhnutá tak, aby čo najviac odrážala štruktúru predávaných produktov. Zároveň je dôležité zachovať určitú rovnováhu, aby sme sa na jednej strane vyhli prílišnej detailnosti (počet skupín by mal byť viditeľný) a na druhej strane nepremeškali významný segment trhu.

Dimenzia „Zákazníci“ odráža štruktúru predaja podľa geografickej oblasti. Každá dimenzia môže mať svoje hierarchie, napríklad v tejto dimenzii to môže byť štruktúra: Krajiny - Regióny - Mestá - Klienti.

Ak chcete analyzovať výkonnosť oddelení, mali by ste si vytvoriť vlastnú dimenziu. Napríklad možno rozlíšiť dve úrovne hierarchie: oddelenia a oddelenia, ktoré sú v nich zahrnuté, čo by sa malo prejaviť v dimenzii „Subdivízie“.

V skutočnosti dimenzie „Čas“, „Produkty“, „Zákazníci“ celkom plne vymedzujú priestor predmetnej oblasti.

Okrem toho je užitočné rozdeliť tento priestor na podmienené oblasti, pričom za základ sa vezmú vypočítané charakteristiky, napríklad rozsahy objemu transakcií z hľadiska hodnoty. Potom sa dá celý obchod rozdeliť do niekoľkých nákladových rozpätí, v ktorých sa vykonáva. V tomto príklade sa môžete obmedziť na nasledujúce ukazovatele: množstvo predaja tovaru, počet predaného tovaru, výška príjmu, počet transakcií, počet zákazníkov, objem nákupov od výrobcov.

OLAP - kocka na analýzu bude vyzerať takto (obr. 2):


Obrázok 2OLAP– kocka na analýzu objemu predaja

Presne takémuto trojrozmernému poľu v zmysle OLAP hovoríme kocka. V skutočnosti z pohľadu prísnej matematiky nebude takéto pole vždy kockou: pre skutočnú kocku musí byť počet prvkov vo všetkých rozmeroch rovnaký, zatiaľ čo OLAP kocky takéto obmedzenie nemajú. Kocka OLAP vôbec nemusí byť 3D. Môže byť dvojrozmerný aj viacrozmerný – v závislosti od riešeného problému. Seriózne OLAP produkty sú navrhnuté pre cca 20 rozmerov.Jednoduchšie desktopové aplikácie podporujú cca 6 rozmerov.

Nemali by byť vyplnené všetky prvky kocky: ak neexistujú žiadne informácie o predaji produktu 2 zákazníkovi 3 v treťom štvrťroku, hodnota v zodpovedajúcej bunke nebude jednoducho určená.

Samotná kocka však nie je vhodná na analýzu. Ak je ešte možné primerane znázorniť alebo znázorniť trojrozmernú kocku, tak zo šiestich resp devätnásťrozmerná veci sú oveľa horšie. Preto sa obyčajné dvojrozmerné tabuľky pred použitím extrahujú z viacrozmernej kocky. Táto operácia sa nazýva "rezanie" kocky. Analytik, ako to bolo, vezme a "vyreže" rozmery kocky podľa značiek, ktoré ho zaujímajú. Analytik tak dostane dvojrozmerný výsek kocky (správu) a pracuje s ním. Štruktúra správy je znázornená na obrázku 3.

Obrázok 3Štruktúra analytickej správy

Rozrežme našu OLAP - kocku a získajme prehľad o predaji za tretí štvrťrok, bude vyzerať takto (obr. 4).

Obrázok 4Správa o predaji za tretí štvrťrok

Kocku môžete rozrezať pozdĺž druhej osi a získať prehľad o predaji skupiny produktov 2 počas roka (obr. 5).

Obrázok 5Štvrťročná správa o predaji produktov 2

Podobne môžete analyzovať vzťah s klientom 4, rezanie kocky podľa štítku Klienti(obr. 6)

Obrázok 6Správa o dodaní tovaru zákazníkovi 4

Report môžete podrobne rozpísať po mesiacoch alebo sa porozprávať o dodávke tovaru na konkrétnu pobočku klienta.

Po kontrole úplnosti a spoľahlivosti informácií sa vykoná ich analytické spracovanie. Zahŕňa definíciu systému ukazovateľov, ktorých štúdium je potrebné na dosiahnutie cieľov analýzy. Tieto ukazovatele sú buď už obsiahnuté vo vybranej informácii, alebo sú vypočítané v procese jej analytického spracovania.

Systémom ukazovateľov sa rozumie taký ich usporiadaný súbor, v ktorom každý ukazovateľ dáva kvalitatívnu a kvantitatívnu charakteristiku určitého aspektu činnosti ekonomického subjektu, je prepojený s inými ukazovateľmi, ale neduplikuje ich a má vlastnosti redukovateľnosti a deliteľnosti.

Počet ukazovateľov v procese analytického spracovania informácií sa môže takmer neobmedzene zvyšovať ich diferenciáciou alebo integráciou v závislosti od programu analýzy, hĺbky štúdia výsledkov činností a faktorov, ktoré ich ovplyvňujú.

Keďže činnosť ekonomických subjektov, ich štrukturálne členenie, ako aj ich rôzne asociácie sú vo všeobecnosti pomerne stabilné, systém ukazovateľov, s ktorými sa analyzuje, má určitú stabilitu, ale postupne sa obohacuje o nové ukazovatele, keď vznikajú nové úlohy, zmeny. vo všeobecnej ekonomickej situácii, vonkajších a vnútorných podmienkach činnosti ekonomických subjektov.

Nevyhnutným predpokladom pre rozvoj systému analytických ukazovateľov a ich správnu aplikáciu je zoskupovanie týchto ukazovateľov podľa rôznych kritérií (pozri obr. 4.1).

Rozdelenie ukazovateľov na absolútne a príbuzný je nevyhnutný na určenie rozsahu a zložitosti analytického spracovania informácií.

Informácie zozbierané z rôznych zdrojov obsahujú najmä absolútne ukazovatele, ktoré charakterizujú objem činnosti analyzovaného ekonomického subjektu (napríklad objem predaja tovaru, výška nákladov na výrobu tovarov alebo služieb, objem veľkoobchodu alebo maloobchodu). obchodu, výška záloh




Ryža. 4.1. Klasifikácia analytických ukazovateľov podľa rôznych

vlastnosti zoskupenia

kapitál, výška zisku alebo straty, počet zamestnancov, cena dlhodobého majetku, veľkosť zásob).

Relatívne ukazovatele, ktoré majú prvoradý význam pre hodnotenie výkonnosti analyzovanej organizácie ako celku alebo jej vnútorných štruktúrnych útvarov, sú už vypočítané rôznymi matematickými operáciami v procese analytického spracovania informácií. Takéto analytické spracovanie môžu čiastočne ustanoviť príslušné predpisy ako povinnosti účtovného oddelenia a iných vnútorných štruktúrnych útvarov hospodárskeho subjektu (napríklad stanovenie nákladov na jednotlivé produkty, výšku zisku vo vzťahu ku kapitálu, výpočet ekonomických štandardov ako súčasť výkazníctva komerčných bánk).

Výpočet relatívnych ukazovateľov zvyšuje porovnateľnosť údajov za rôzne chronologické obdobia, keďže všetky absolútne ukazovatele používané na tento účel v matematických vzorcoch sú počítané v mene, ktorá má rovnakú kúpnu silu, t. vplyv inflácie je eliminovaný. Všetky absolútne ukazovatele týkajúce sa daného obdobia sa navyše tvoria pod vplyvom rovnakej vnútornej a vonkajšej situácie. Preto sa pri analýze dynamické a priestorové porovnania robia prevažne pomocou relatívnych a nie absolútnych ukazovateľov.

Na zlepšenie porovnateľnosti údajov sa používajú tam, kde je to možné, prirodzené a premenené na prírodné pomocou špeciálne stanovených koeficientov, tzv podmienečne prirodzené metrov. Na rovnaký účel sa v niektorých prípadoch dáva prednosť pôrod a cena prvku metrov, čo umožňuje v prípade potreby eliminovať vplyv na absolútne ukazovatele zmeny ceny tovaru a v relatívnych ukazovateľoch odvodených od tejto hodnoty rozdiely v cene tovaru spôsobené kolísaním pomeru prenesených nákladov fixné aktíva, mzdy živej práce a zisk v cene výrobkov. Je potrebné si uvedomiť, že ani pri použití tvrdej cudzej meny na meranie nákladov absolútnych ukazovateľov nie je eliminovaný vplyv štrukturálnych zmien na hodnotenie objemu činnosti ekonomického subjektu a jeho kvalitatívnych charakteristík. Preto sa v ďalšej prezentácii osobitne zvážia otázky a použitie rôznych prírodných, podmienene prírodných, pracovných a neplnohodnotných meračov na dosiahnutie niektorých cieľov analýzy.

Zoskupenie analytických ukazovateľov do kvantitatívne a kvalitu má veľmi blízko k ich deleniu na absolútne a relatívne, ale úplne sa s ním nezhoduje. Napríklad celková výška zisku je kvantitatívnym ukazovateľom, ale z hľadiska svojho ekonomického obsahu sa vzťahuje na kvalitatívne charakteristiky činnosti objektu, pretože samotná skutočnosť dosahovania zisku a nie straty, a to aj bez odvodenia relatívnej ziskovosti sa už javí ako pozitívny výsledok činnosti.

Mimoriadne dôležitú úlohu v ekonomickej analýze zohráva delenie ukazovateľov podľa zovšeobecňujúci a súkromné.

Sumarizujúce ukazovatele sa považujú za ukazovatele, pomocou ktorých sú uvedené súhrnná charakteristika stav analyzovaného ekonomického subjektu, miera využívania zdrojov, ktoré má k dispozícii, a efektívnosť hospodárenia vyjadrená v dosahovaní sledovaných cieľov. Primárnymi cieľmi môže byť dosiahnutie vyššieho zisku v porovnaní s refinančnou sadzbou alebo s inými alternatívne spôsoby použitie kapitálu, ktorý má subjekt k dispozícii; dosiahnutie vyššej kvality tovarov a služieb ako u konkurentov pri rovnakej alebo nižšej úrovni nákladov na ich výrobu a obeh; na tomto základe dobytie nových trhov a zvýšenie ceny firmy. Medzi zovšeobecňujúce ukazovatele patria aj ukazovatele, ktoré vo všeobecnosti charakterizujú určitú stránku alebo smerovanie podniku alebo jeho jednotlivých štruktúrnych útvarov, veľkosť zdrojov, ktoré využívajú, a ich obrat. Každý zovšeobecňujúci ukazovateľ možno rozložiť na množstvo konkrétnych ukazovateľov, ktoré vo vzťahu k nemu zohrávajú podriadenú úlohu. Tieto súkromné ​​ukazovatele prispievajú k identifikácii a meraniu vplyvu jednotlivých vnútorných a vonkajších faktorov, ktoré určujú veľkosť a dynamiku zovšeobecňujúceho ukazovateľa. Pomocou súkromných ukazovateľov sa dosahuje podriadenosť lokálnych cieľov jednotlivých jednotiek a činností ekonomického subjektu všeobecným cieľom jeho fungovania. Celkový cieľ fungovania ekonomického subjektu nie je jednoznačný, predpokladá súčasné a vzájomne prepojené dosahovanie viacerých cieľov, a preto stupeň jeho dosiahnutia odráža nie jeden, ale celý systém zovšeobecňujúcich a partikulárnych ukazovateľov. .

Na riadenie činnosti ekonomického subjektu ako celku, jeho jednotlivých oblastí a činností každého vykonávateľa sa najskôr vypracuje model tejto činnosti. Je popísaná systémom zovšeobecňujúcich a jednotlivých ukazovateľov stanovených v podnikateľskom pláne, ktorých úroveň a prepojenie má zabezpečiť dosiahnutie plánovaných výsledkov výkonnosti.

Systém plánovaných ukazovateľov je spravidla horší ako systém účtovných ukazovateľov, pretože účtovníctvo odráža vplyv nielen vopred predvídateľných faktorov, ale aj mnohých nepredvídateľných faktorov - objektívnych a subjektívnych, napríklad prírodných katastrof. , nepoctivosť účinkujúcich, podvody a krádeže. V dôsledku toho účtovníctvo odráža vplyv na zovšeobecňujúce a konkrétne ukazovatele celej rozmanitosti reality.

Systém analytických ukazovateľov je ešte širší ako v pláne a účtovníctve, pretože má poskytovať reflexiu výsledkov hospodárenia a hodnotenie úrovne jeho efektívnosti vo všetkých plánovaných oblastiach a početných cieľoch, a to nielen všeobecne pre relatívne skúmaný samostatný ekonomický systém (podnik, komerčná banka), ale aj pre jeho veľké a malé divízie; identifikovať úlohu jednotlivých jednotiek v konečné výsledkyčinnosti a vplyv rôznych faktorov na ekonomický rozvoj. Preto systém analytických ukazovateľov zahŕňa tak zovšeobecňujúce ukazovatele (výsledky) diferencované podľa oblastí činnosti, ako aj súkromné ​​(faktoriálne) ukazovatele.

Jednotlivé ukazovatele, tvorené rozkladom zovšeobecňujúceho ukazovateľa alebo agregované do zovšeobecňujúceho ukazovateľa, sa v analýze ekonomickej aktivity nazývajú aj faktorové ukazovatele, pretože ich použitie umožňuje odhaliť a zmerať vplyv určitých ekonomických faktorov na zovšeobecňujúce ukazovatele. Ako viete, zmeny v stave analyzovaného objektu sa vyskytujú pod vplyvom ekonomických a sociálnych faktorov. Pojem „príčina“ sa zvyčajne používa na skupinu faktorov, ktorých vplyv možno zistiť priamo z účtovných a výkazníckych údajov. Pri ďalšom rozklade skupiny na jej zložky sa získané čiastkové faktorové ukazovatele nazývajú aj príčinami, ak je ich spojenie s analyzovaným ukazovateľom funkčné a je možné ich vypočítať vykonaním rôznych matematických operácií s vykazovacími ukazovateľmi.

V prípadoch, keď je odhalený a meraný vplyv na analyzovaný ukazovateľ iných, s ním súvisiacich v korelácii, a sila ich vplyvu sa meria pomocou štatistických a matematických metód, konkrétne ukazovatele získané na detailnú analýzu sa zvyčajne už nenazývajú príčinami. , ale faktory.

Preto je rozlíšenie medzi pojmami „príčina“ a „faktor“ veľmi podmienené. Vychádza najmä z možností priameho alebo nepriameho merania ich vplyvu s prihliadnutím na charakter súvislosti s analyzovaným zovšeobecňujúcim ukazovateľom.

Napríklad odchýlky od plánu objemu výroby môžu byť spôsobené nesúladom medzi plánom počtu a zloženia personálu a zároveň priemerným výkonom na pracovníka za analyzované obdobie. Hodnoty vyššie uvedených agregovaných skupín faktorov a ich odchýlky od plánu sa priamo odrážajú vo výkazoch a vyvolávajú sa v analýze dôvody odchýlok. Každý z týchto dôvodov však možno ďalej považovať za funkciu mnohých premenných. Takže zmena v počte zamestnancov je podrobne rozpísaná podľa kategórií zamestnancov, výstup na zamestnanca je prezentovaný ako súčin výstupu na pracovníka a podielu pracovníkov na celkovom počte zamestnancov. Tieto analytické ukazovatele možno vypočítať priamo pomocou údajov z výkazníctva, a preto sa nazývajú aj diferencovanejšie dôvody na zmenu súhrnného ukazovateľa.

Predpokladajme, že analýzu ďalej prehĺbime, aby sme zistili vplyv na zmenu zovšeobecňujúceho ukazovateľa - objemu produkcie faktorov, ktoré následne ovplyvňujú plnenie plánu výkonu na pracovníka, ktorého vzťah s týmto ukazovateľom nemožno priamo určiť. Úlohou je napríklad zistiť vplyv na priemernú úroveň výkonu pracovnej organizačnej a technickej úrovne výroby (stupeň mechanizácie a automatizácie hl. technologických procesov a pomocné práce, zavádzanie metód vedeckej organizácie práce, externá spolupráca a pod.) a osobné faktory (všeobecné a špeciálne vzdelanie, pracovné skúsenosti, pohlavie, vek).

Podľa zovšeobecnených údajov účtovníctva a štatistického účtovníctva nie je možné merať vplyv uvedených faktorov na produkciu a jej prostredníctvom na objem produkcie ani na rýchlosť jej rastu. Na tento účel sa zbierajú a spracúvajú primárne účtovné a dokumentačné údaje špeciálnymi ekonomickými a matematickými metódami (hlavne korelačnými). technické služby, personálne, pracovné a mzdové oddelenia, ako aj špeciálne zozbierané doplnkové mimoúčtovné informácie (dotazníkový prieskum, fotografie a autofotografie pracovného dňa, zápisnice z výrobných stretnutí a pod.). Pri takomto ďalšom upresnení príčin sa ich charakteristiky už nazývajú faktory.

Meranie vplyvu jednotlivých faktorov na dynamiku ekonomického rozvoja, výsledky realizácie plánu a efektívnosť manažmentu pomáha určiť ich relatívnu dôležitosť v práci podniku, zamerať sa na hlavné a rozhodujúce a zvýšiť efektívnosti analýzy pri identifikácii rezerv.

Pre podniky rovnakého profilu by mala byť zabezpečená jednotnosť systému ukazovateľov a metodiky ich výpočtu. Pokusy aplikovať rovnaké odhadované ukazovatele v ekonomických subjektoch rôznych sektorov národného hospodárstva sa neuskutočnili, keďže nie je potrebná identita použitých ukazovateľov, ale ich súlad so základným prístupom k hodnoteniu výsledkov dosiahnutých analyzovanými subjekt z hľadiska cieľov svojej činnosti, lokálnych a globálnych kritérií na ich dosiahnutie.

Nie vždy sa spoločnosti darí dosiahnuť všetky svoje ciele a vyriešiť všetky úlohy, ktoré sú jej zverené. Okrem toho, spolu s implementáciou plánu pre niektoré ukazovatele, možno získať negatívny výsledok pre iné. V tejto súvislosti je vhodné pri určovaní ratingu ekonomického subjektu, jeho štrukturálnych členení, vypočítať podmienený integrálny ukazovateľ, ktorého úroveň by odrážala tak mieru plnenia plánovaných cieľov pre každý z ukazovateľov, ako aj ich relatívnu hodnotu.

Integrálny ukazovateľ, odvodený na základe množstva iných, veľmi odlišných ekonomickým obsahom a praktickým účelom, necharakterizuje konkrétne výsledky práce analyzovaného subjektu a stupeň dosiahnutia početných cieľov, ktoré mu boli stanovené. Tento ukazovateľ možno použiť na určenie hodnotenia. Vo všetkých ostatných prípadoch jeho využitie nezodpovedá viacúčelovosti fungovania ekonomických subjektov.

Pre posúdenie plnenia plánu a navyše aj úrovne ekonomickej efektívnosti je potrebné vziať do úvahy všetky ukazovatele zahrnuté v systéme, pretože preplnenie plánu jedného z nich nezbavuje analyzovanú ekonomickú väzbu od povinnosť zabezpečiť dosiahnutie plánovanej úrovne pre ostatné ukazovatele. Nadplánované zlepšenie niektorého z ukazovateľov zvyčajne nekompenzuje škodu spôsobenú oneskorením v inom ukazovateli, čo odráža nesplnenie možno ešte dôležitejšej úlohy tohto ekonomického subjektu. Napríklad výrazné prekročenie plánovanej úrovne výroby tovarov (práce, služby) nevylučuje potrebu zabezpečiť danú úroveň nákladov na jednotku výstupu; prekročenie plánu z hľadiska objemu výroby a zisku nemôže kompenzovať nesplnenie plánu uvedenia čistiarní do prevádzky a iných opatrení na ochranu životného prostredia.

Najprijateľnejším spôsobom konštrukcie integrálneho ukazovateľa je vyriešiť matematický problém výpočtu vzdialeností medzi bodmi, ktoré charakterizujú hodnoty rovnakých ukazovateľov na porovnávaných ekonomických subjektoch a na podmienenom najlepšom podniku pre všetky tieto ukazovatele, tzv. štandard rozvoja a týmto spôsobom určiť ukazovateľ „úrovne rozvoja“ každého z nich. Jeho výhodou oproti iným metódam výpočtu integrálneho ukazovateľa je objektívnosť odhadov, keďže je založený na matematických výpočtoch.

Iné spôsoby agregácie ukazovateľov nie sú dostatočne objektívne. Napríklad pri výpočte integrálneho ukazovateľa možno význam jedného alebo druhého ukazovateľa v ich všeobecnom systéme určiť aj pomocou bodovania. Ak je teda vzhľadom na nedostatok používaných vzácnych kovov obzvlášť dôležité ich najhospodárnejšie využitie, tak najvyššie skóre má priradený ukazovateľ znižovania materiálovej náročnosti výroby týchto kovov. Ak je v prvom rade potrebné zabezpečiť ďalšie rozširovanie sortimentu, tak priradením vyššieho skóre tomuto ukazovateľu sa tento umiestňuje na prvom mieste v rade hodnotiacich ukazovateľov. Napriek tomu, že hodnotenie efektívnosti produkcie v jednotlivých odvetviach národného hospodárstva a v ich podnikoch je založené na rovnakej sústave ukazovateľov, každému z nich možno priradiť iné skóre aj v tom istom odvetví alebo v podniku v r. rôzne časové obdobia. Bodové hodnotenie každého ukazovateľa by malo odrážať jeho význam pri dosahovaní cieľov fungovania analyzovaných ekonomických subjektov. Zároveň, ako každé subjektívne hodnotenie, aj tieto body je možné nastaviť ľubovoľne.

Za sledované obdobie existujú ukazovatele, ktoré fixujú stav analyzovaného ekonomického subjektu a výsledky jeho činnosti, prípadne pôsobenie jeho zamestnancov v určitej oblasti o určitý počet, t.j. v statické, alebo za analyzované obdobie, t.j. v dynamika. Napríklad súvaha odzrkadľuje finančný stav, rozdelenie majetku, zdroje jeho vzniku ku dňu zostavenia a výkaz peňažných tokov zahŕňa ich zostatky, príjmy a úbytky, t.j. ich dynamiku za celé analyzované obdobie.

Vo vzťahu k činnosti analyzovaného ekonomického subjektu a možnostiam ovplyvňovania jeho výsledkov, ukazovatele zohľadňujúce objektívne nezávislý dôvody a subjektívne v závislosti od toho.

V procese analýzy je veľmi dôležité eliminovať vplyv faktorov objektívneho poriadku, ktoré nemožno pripísať užitočným výsledkom alebo naopak nedostatkom činnosti samotného ekonomického subjektu.

Spolu s výberom systému ukazovateľov na analýzu podľa plánovaného programu veľký význam má zovšeobecnenie informácií v analytických tabuľkách a obrázkoch. Analytické tabuľky slúžia na porovnanie analyticky spracovaných údajov podľa chronologických období a na základe toho zisťujú dynamiku skúmaných ukazovateľov, porovnávajú ich dosiahnuté alebo predpokladané hodnoty so základnými údajmi, ktoré môžu byť zodpovedajúcimi ukazovateľmi plánu predchádzajúcich a predpovedané budúce obdobia, povinné normy, ukazovatele iných ekonomických subjektov, priemery za odvetvie alebo akékoľvek iné, ktoré vyberie analytik na základe účelu štúdie.

Na takéto porovnania sa zvyčajne používajú vodorovné riadky analytickej tabuľky, v ktorých sú uvedené názvy porovnávaných údajov a ich absolútne a relatívne hodnoty. Takéto porovnania medzi riadkami tabuľky sa nazývajú horizontálna analýza.

Podľa stĺpcov analytickej tabuľky sa porovnávajú zovšeobecňujúce ukazovatele s ich zložkami - konkrétnymi ukazovateľmi - s cieľom identifikovať relatívna hodnota tieto súkromné ​​ukazovatele pri tvorbe zovšeobecňujúcich ukazovateľov sa určuje najmä štruktúra zovšeobecňujúcich ukazovateľov. Tento spôsob reflektovania analyticky spracovaných informácií sa nazýva vertikálna alebo štrukturálna analýza.

Analytická tabuľka má textovú (ľavú) a číselnú (vpravo) časť. Pre počítačové spracovanie informácií je možné textovú časť tabuľky zašifrovať pomocou abecedných alebo číselných označení. Čísla sú umiestnené v stĺpcoch tabuľky na samostatných čiarach, ktoré ich pretínajú.

Ľavá strana tabuľky, v ktorej sú umiestnené názvy jej riadkov, sa nazýva „predmet“ a pravá, pozostávajúca zo stĺpcov, nad ktorými sú uvedené aj ich názvy, sa nazýva „predikát“.

Zovšeobecnenie zhromaždené informácie v prepojených, doplnkových alebo podrobných analytických tabuľkách umožňuje tzv. beztextovú analýzu; starostlivo analyticky spracované informácie umiestnené v tabuľkách umožňujú vyvodiť potrebné závery a vypracovať spoľahlivé manažérske rozhodnutia. V týchto prípadoch nie je potrebné prezentovať výsledky analýzy vo forme textu, alebo je ten istý text podaný mimoriadne výstižne.

Príprava súboru analytických tabuliek, ktoré by dostatočne objektívne a úplne odzrkadľovali všetky problémy analytického programu a jeho výsledkov, si vyžaduje vysokú profesionalitu zo strany tvorcov rozložení týchto tabuliek a pokynov na ich vyplnenie.

Preto sa v praxi na tento účel používajú štandardné metódy a v tabuľkách v nich odporúčaných sa robia len zmeny vyplývajúce z individuálnych charakteristík analyzovaného ekonomického subjektu alebo situácie, ktorá sa na ňom vyvinula.

Pri použití analytických tabuliek a najmä pri ich zmenách je potrebné dodržiavať všeobecné pravidlá ich návrhu:

1) nad tabuľkou by mal byť umiestnený jej názov a sériové číslo;

2) ak sú vo všetkých riadkoch a stĺpcoch tabuľky použité rovnaké merné jednotky, potom do zátvoriek pod názvom tabuľky v pravom rohu je potrebné umiestniť štandardné označenie mernej jednotky, napríklad (tis. rubľov) alebo ($). Ak sa v riadkoch tabuľky používajú rôzne merné jednotky, ich označenia sú umiestnené v hlavičkách riadkov oddelené čiarkou za názvom. Ak sa v stĺpcoch používajú rôzne merné jednotky, mali by sa uviesť aj v nadpisoch stĺpcov;

3) stĺpce tabuľky sú očíslované postupne, začínajúc od prvého, v ktorom sú uvedené čísla riadkov. V prípadoch, keď sa ukazovatele rôznych stĺpcov počítajú na základe hodnôt uvedených v predchádzajúcich stĺpcoch, by sa okrem názvu a sériového čísla tohto stĺpca mal uviesť aj výpočtový algoritmus označujúci čísla stĺpcov obsahujúcich počiatočné údaje, ako aj matematické akcie, ktoré by sa s nimi mali vykonať na získanie hodnôt uvedených v tomto stĺpci, napríklad: [(stĺpec 4 - stĺpec 3) ∙ 100: 3];

4) nadpisy v „predikáte“ sú jednoduché v prípadoch, keď jeho stĺpce nemajú spoločný obsah, alebo zložité – keď je obsah spoločný pre viacero stĺpcov podrobne rozpísaný v každom z nich. Potom je nadpis označený vo forme niekoľkých úrovní, napríklad:

Často sa používa na zvýšenie viditeľnosti materiálov analýzy grafické metódy. Napríklad tabuľky, ktoré zaznamenávajú dynamiku ukazovateľov, sú doplnené obrázkami, v ktorých je táto dynamika prezentovaná vo forme kriviek alebo stĺpcov. Štruktúra zovšeobecňujúcich ukazovateľov v stĺpcoch analytických tabuliek je znázornená vo forme koláčových grafov. Používajú sa aj iné formy diagramov.