Analytické spracovanie informácií. Spôsoby analytického spracovania dát na podporu rozhodovania. Online analytické spracovanie (OLAP) Technológia analytického spracovania

Téma 6

FIREMNÉ INFORMAČNÉ SYSTÉMY NA SPRACOVANIE EKONOMICKÝCH INFORMÁCIÍ

Koncept podnikových informačných technológií

Podstata a význam podnikových informačných technológií

Medzi rôznymi programami pre podniky sa pojem „informačné technológie v riadení podniku“ tradične chápe ako „komplexné systémy automatizácie riadenia“. Známe sú aj ich ďalšie názvy – celopodnikové systémy, podnikové informačné systémy (CIS), podnikové (alebo komplexné) riadiace systémy (CCS), automatizované riadiace systémy (ACS).

Komplexné riadiace automatizačné systémy sú spravidla „základné“ univerzálne riešenia vhodné pre rôzne druhy podnikov. V prvom rade ide o finančné riadenie, riadenie zásob, riadenie nákupu a predaja. Ale tie isté systémy majú často riešenia špecifické pre dané odvetvie, ktoré odrážajú tú či onú špecifickosť a obsahujú vhodnú regulačnú a referenčnú základňu.

Napríklad systémové riešenie SAP R/3 pre letecký priemysel podporuje účtovanie a kontrolu sériových výrobných čísiel všetkých leteckých dielov, ich životnosti, plánovanej výmeny či opravy, čo zabezpečuje nielen spoľahlivosť výroby, ale aj bezpečnosť pasažierov.

Keďže komplexné riadiace systémy sú primárne zamerané na veľké podniky obsahujúce viacprofilové štruktúry, ponúkajú nielen rozvinutú sadu funkcií, ale poskytujú aj spoľahlivé ukladanie a spracovanie veľkého množstva informácií pomocou výkonných platforiem a systémových nástrojov pre prácu viacerých používateľov. ..

Moderné informačné technológie, komunikácia a internet nám umožňujú riešiť problémy vzdialený prístup do jedinej databázy, ktorá je dôležitá aj pre správu a riadenie spoločnosti.

Koncepcia budovy

Hoci väčšina vývojárov nazýva svoje softvérové ​​produkty manažmentom (podnik, sklad, financie atď.), v skutočnosti takmer všetky softvér, používané v oblasti správy a riadenia spoločností, sú registrácia faktov a dokumentov o finančných a ekonomických činnostiach, účtovné systémy so schopnosťou vytvárať správy a certifikáty v kontextoch, ktoré umožňujú analytické funkcie. To znamená, že do databázy sa vkladajú štruktúrované informácie. Táto štruktúra je do tej či onej miery stanovená prepojenými referenčnými knihami, klasifikátormi, parametrami a formami štandardných dokumentov. Podľa informácií dostupných v databáze je takzvaný „rez“ „postavený“, „kreslený“, „zložený“ nástrojmi. Po prijatí správ a certifikátov na základe takýchto údajov, často nazývaných analytické, môže manažment robiť rozhodnutia. Toto je typický koncept a typická technológia pre prácu so systémami danej triedy.



Nie je náhoda, že takýto odlišný funkčný obsah, systémové riešenia, účel a použitie „riadiaceho“ softvéru, ako je „Galaktika“, „BEST“ a „1C: Enterprise“, je podobné, pokiaľ ide o princípy organizácie informácií, technológiu ich tvorby a spracovania, ako aj metódy interakcie so systémami.

Napriek tomu podniky, napríklad OAO Uralelektromed, predložili také prísne a rôznorodé požiadavky na nástroje správy a riadenia spoločností, že je potrebné vybudovať ich na viacúrovňovom základe. Zvyčajne je jadro jadrom systému, ktoré obsahuje iba programové kódy. Ďalším koncepčne dôležitým prvkom je zabudovaný toolkit systému, ktorý umožňuje bez zmeny programových kódov ho aspoň konfigurovať na pracovisku, vykonávať špecifické operácie, zadávať nové a meniť existujúce formy prvotných a výkazových dokladov, resp. použite iné parametrické nastavenia. Vyspelejšie systémy majú zabudované nástroje na vytváranie rôznych podnikových modelov: informačných, organizačných, funkčných atď. A napokon aj samotná databáza.

Analytické spracovanie informácií

Plánovanie činnosti podniku, získavanie prevádzkových informácií a prijímanie správnych rozhodnutí na základe ich analýzy je spojené so spracovaním veľkého množstva údajov. Zostavy generované v účtovníctve podnikové systémy ah manažment, zvyčajne bez flexibility. Nemožno ich „skrútiť“, „rozbaliť“ alebo „zbaliť“, aby sa získala požadovaná reprezentácia údajov vrátane grafického znázornenia. Čím viac „škrtov“ a „škrtov“ dokážete urobiť, tým realistickejšie si dokážete predstaviť obraz aktivít podniku a urobiť to najlepšie rozhodnutie o riadení obchodných procesov. Takéto úlohy si vyžadujú matematické a ekonomické modelovanie, ako aj vysokú rýchlosť. Analytický modul je dostupný v systéme „RepCo“, známejší je systém „Triumph-Analytics“ (Corporation „PARUS“ - „Tora Center“). Zdá sa, že účtovné systémy vytvárajú certifikáty v rôznych „sekciách“ podľa informácií uložených v databáze, jednoducho predstavujú to, čo je. A analytické systémy vytvárajú nové informácie podľa špecifikovaných parametrov alebo kritérií a optimalizujú ich na špecifické účely. Preto častejšie špeciálny nástroj na prezeranie a vizualizáciu informácií, čo je „online analýza dát“ (OLAP – online analytické spracovanie). Poskytuje sadu pohodlných a rýchlych nástrojov na prístup, prezeranie a viacrozmernú analýzu informácií nahromadených v úložisku.

Technológie OLAP sa používajú na modelovanie situácie podľa schémy „čo sa stane, ak...“, na zostavovanie rôznych analytických správ. Existujú špecializované západné softvérové ​​produkty.

Zvyčajne sa informácie prenášajú z podnikových manažérskych systémov do špecializovaných programov na analytické spracovanie údajov. Mnoho domácich vývojárov sa snaží tieto problémy vyriešiť vlastnými silami, napríklad spoločnosti Nikos-Soft (systém NS-2000), Cepheus (systém riadenia spoločnosti Etalon), COMSOFT (softvérovo-metodický a nástrojový komplex COMSOFT-STANDARD "2.0) a ďalšie.

6.4. Perspektívy rozvoja a využívania podnikových informačných technológií

Vývoj domácich podnikových systémov zahŕňa popri vývoji a využívaní moderných nástrojov a platforiem, ako aj systémových nástrojov ich funkčné saturovanie najmä z hľadiska výroby.

Napriek rozšírenému nadšeniu pre implementáciu manažérskych štandardov poprední hráči na domácom softvérovom trhu vyvíjajú priemyselné riešenia pre rôzne typy odvetví.

Obavy firiem otvoriť „dôvernosť“ ich vývoja sú znížené, čo prispieva ku konsolidácii ich úsilia o integráciu svojich produktov, namiesto toho, aby samostatne vyvíjali všetko od „a“ po „z“. Dnes nemá nikto dostatok prostriedkov. Pre pochopenie nový koncept, vývoj projektu a systému, teda systému, ktorý mení svoju kvalitu podľa toho, čo v ňom je, trvá roky. Požiadavku na integráciu softvérových produktov navyše predkladajú aj podniky, ktoré chcú zachovať „funkčné“ spravidla špecializované systémy a informačne ich kombinovať s novonadobudnutými.

Integrácia je potrebná aj pre produkty od rôznych výrobcov – v mene kombinovania komplexných riešení so špecializovanými:

– rozpočtovanie, finančné a ekonomické analýzy, zákaznícky servis, analytické spracovanie dát a pod.

Treba si uvedomiť, že perspektívnejšie nie sú samotné riadiace systémy, ale jednoduchý a univerzálny nástroj na ich tvorbu, určený pre kvalifikovaných sprostredkovateľov medzi vývojárom a koncovým používateľom. Teraz sa tieto funkcie pokúšajú vykonávať správcov systému a analytika.

Ak bude takýto nástroj k dispozícii, budú žiadané „hotové“ štandardné riešenia pre všetky podniky všetkých odvetví.

Internet ako doplnkový nástroj na rozvoj podnikania možno efektívne využívať len vtedy, ak existuje integrovaný systém riadenia.

Hoci moderné informácie a komunikačných technológií, vrátane internetu, a umožňujú organizovať prenájom softvéru, je predčasné hovoriť o krátkodobom využívaní takýchto príležitostí, najmä u nás. A to ani nie tak z dôvodu dôvernosti, ale z dôvodu nedostatku poriadku a spoľahlivých komunikačných prostriedkov.

Pokusy zaviesť a využiť, aj keď nie v plnej miere, skúsenosti s informačnými technológiami v domácich podnikoch v praxi ukázali, že „zautomatizovať chaos nie je možné“. Nevyhnutná je predbežná reorganizácia podniku a samotného podniku, ako aj vytvorenie riadiacich predpisov (pokynov). Pre zamestnancov podniku je ťažké zvládnuť takúto prácu sami. Najmä vzhľadom na časový faktor v podmienkach trhu. Preto sa všade rozvíja prax interakcie s poradenskými spoločnosťami, ktoré pomáhajú podnikom a učia ich zamestnancov „rozširovať úzke miesta“, zakladať hlavný obchodný proces, vyvíjať technológie, budovať informačné toky atď. Automatizácia zabehnutého procesu je jednoduchšia, jednoduchšia, lacnejšia, rýchlejšia.

Každý musí robiť svoju prácu. Účtovník, skladník, obchodný manažér a iní „predmetoví“ špecialisti by nemali vylepšovať formu formulárov dokladov, odsúvať stĺpce od seba alebo meniť svoje miesta v dôsledku zmien legislatívy alebo obchodných modelov. Preto sa softvérový trh postupne mení z „potravinárskeho“ na „servisný“. Začína sa rozvíjať outsourcing - presun niektorých funkcií podniku na špecialistov zainteresovaných spoločností. Venujú sa údržbe zariadení, systémového softvéru, úprave aplikovanej (funkčnej) časti systémov a pod.

Najdôležitejšia a najrelevantnejšia pri využívaní podnikových manažérskych systémov je informačná technológia a metodická služba pre ich používateľov a spotrebiteľov.

UDK 621. 37/39. 061,2/4

METÓDY ANALYTICKÉHO SPRACOVANIA INFORMÁCIÍ

GVOZDINSKYA.N., KLIMKO E.G., SOROKOVOY A.I.

Vykonáva sa analytický prehľad metód dolovania údajov (tiež nazývaných: IAD, dolovanie údajov, zisťovanie znalostí v databázach), berúc do úvahy použitie určitej metódy na podmienky Ukrajiny. Prehľad metód analytického spracovania informácií v komplexných informačných systémoch je posudzovaný z hľadiska rýchlosti extrakcie dát, zberu zovšeobecnených informácií a zvýšenia spoľahlivosti procesu.

Proces dolovania údajov je analytická štúdia veľkého množstva informácií s cieľom určiť vzorce a vzťahy medzi premennými, ktoré sa potom dajú použiť na nové údaje. Prijaté informácie sú prevedené na úroveň informácií, ktorá je charakterizovaná ako znalosť. Tento proces pozostáva z troch hlavných krokov:

Výskum (odhaľovanie vzorov);

Použitie identifikovaných vzorov na zostavenie modelu;

Analýza výnimiek na zistenie a vysvetlenie odchýlok v nájdených vzoroch.

Hľadanie nových poznatkov pomocou IAD je nový a rýchlo sa rozvíjajúci smer, ktorý využíva metódy umelej inteligencie, matematiky a štatistiky. Tento proces zahŕňa nasledujúce kroky:

Definícia problému (problémové vyhlásenie);

Príprava údajov;

Zber údajov: ich vyhodnotenie, integrácia a čistenie, výber a transformácia;

Budovanie modelu: hodnotenie a interpretácia, externá validácia;

Použitie modelu;

Modelové pozorovanie.

Na vytvorenie modelu a zlepšenie jeho kvality pomáha formálna validácia údajov prostredníctvom sekvencie dotazov alebo predbežného získavania údajov. Nástroje na takúto analýzu zahŕňajú tieto hlavné metódy: neurónové siete, rozhodovacie stromy, genetické algoritmy, ako aj ich kombinácie.

Neurónové siete patria do triedy nelineárnych adaptívnych systémov, v štruktúre podmienečne pripomínajú nervové tkanivo neurónov.

Ide o množinu vzájomne prepojených uzlov, ktoré prijímajú vstupné dáta, spracúvajú ich a na výstupe vytvárajú nejaký výsledok. Uzly spodnej vrstvy sú zásobované hodnotami vstupných parametrov, na ich základe sa vykonávajú výpočty potrebné pre rozhodovanie, predpovedanie vývoja situácie a pod.

Tieto hodnoty sa považujú za signály, ktoré sa prenášajú do nadložnej vrstvy, pričom sa zvyšujú alebo znižujú v závislosti od číselných hodnôt (váh) priradených interneuronálnym spojeniam. Na výstupe neurónu najvyššej vrstvy sa generuje hodnota, ktorá sa považuje za odozvu, reakciu celej siete na vstup. počiatočné hodnoty. Keďže každý prvok neurónovej siete je čiastočne izolovaný od svojich susedov, takéto algoritmy majú schopnosť paralelizovať výpočty. Na obr. 1 znázorňuje podmienku

Obr.1. Neurónová sieť

Veľkosť a štruktúra siete musí zodpovedať podstate skúmaného javu. Vybudovaná sieť je podrobená procesu takzvaného „tréningu“. Neuróny siete spracovávajú vstupné dáta, pre ktoré sú známe hodnoty vstupných parametrov a správne odpovede na ne. Učenie spočíva vo výbere váh interneuronálnych spojení, ktoré poskytujú najväčšiu blízkosť odpovedí siete známym správnym odpovediam. Po zaškolení na dostupných údajoch je sieť pripravená na prácu a možno ju použiť na predpovedanie správania objektu v budúcnosti na základe údajov o jeho vývoji v minulosti, na analýzu, identifikáciu odchýlok a podobností. Spoľahlivé prognózy je možné vytvárať bez špecifikovania typu závislostí, na základe ktorých sú založené.

Neurónové siete sa používajú na riešenie problémov predikcie, klasifikácie alebo riadenia.

Výhoda - siete dokážu aproximovať akúkoľvek spojitú funkciu, nie je potrebné vopred robiť žiadne predpoklady o modeli. Údaje, ktoré sú predmetom vyšetrovania, môžu byť neúplné alebo zašumené.

Nevýhodou je nutnosť mať veľké množstvo tréningovej vzorky. Konečné rozhodnutie závisí od počiatočné nastavenia siete. Údaje je potrebné previesť do číselnej podoby. Výsledný model nevysvetľuje objavené poznatky (tzv. „čierna skrinka“).

Rozhodovacie stromy využívajú rozdelenie údajov do skupín na základe hodnôt premenných. Výsledkom je hierarchická štruktúra príkazov „Ak...Potom...“, ktorá vyzerá ako strom. Ak chcete klasifikovať objekt alebo situáciu, musíte odpovedať na otázky v uzloch tohto stromu, počnúc jeho koreňom. Ak je odpoveď kladná, prejdite do pravého uzla ďalšej úrovne, ak je záporná - do ľavého uzla atď. Po dokončení odpovedí sa dostanú do jedného z koncových uzlov, kde

RI, 2000, č. 4

označuje, do ktorej triedy by mal byť predmetný objekt priradený.

Rozhodovacie stromy sú navrhnuté tak, aby riešili klasifikačné problémy, a preto majú veľmi obmedzené využitie vo financiách a obchode.

Výhodou metódy je jednoduchá a zrozumiteľná prezentácia funkcií pre používateľov. Ako cieľová premenná sa používajú merané aj nemerané znaky – to rozširuje rozsah metódy.

Nevýhodou je problém významnosti. Dáta je možné rozdeliť do mnohých špeciálnych prípadov, existuje „krovinatý“ strom, ktorý nemôže poskytnúť štatisticky platné odpovede. Užitočné výsledky sa dosiahnu iba v prípade nezávislých funkcií.

Genetické algoritmy napodobňujú proces prirodzeného výberu v prírode. Na vyriešenie problému, ktorý je z hľadiska nejakého kritéria optimálnejší, sú všetky riešenia opísané množinou čísel alebo veličín nenumerického charakteru. Hľadanie optimálneho riešenia je podobné ako pri evolúcii populácie jedincov, ktorí sú reprezentovaní svojimi súbormi chromozómov. V tomto vývoji fungujú tri mechanizmy, znázornené na obr. 2.

Je možné rozlíšiť nasledujúce mechanizmy:

Výber najsilnejších sád chromozómov, ktoré zodpovedajú najoptimálnejším riešeniam;

Kríženie - získavanie nových jedincov zmiešaním chromozómových sád vybraných jedincov;

Mutácie sú náhodné zmeny v génoch u niektorých jedincov v populácii.

V dôsledku výmeny generácií sa vyvíja riešenie problému, ktoré sa už nedá ďalej zlepšovať.

Výhoda - metóda je vhodná na riešenie rôznych problémov kombinatoriky a optimalizácie, uprednostňuje sa skôr ako nástroj vedeckého výskumu.

Nevýhodou je schopnosť efektívne formulovať problém, určiť kritérium pre výber chromozómov a samotný výberový postup je heuristický a dokáže ho len odborník. Formulácia problému v pojmoch neumožňuje analyzovať štatistickú významnosť riešenia získaného pomocou nich.

Počítačové technológie pre inteligentné analytické spracovanie dát umožňujú využívať metódy umelej inteligencie, štatistiky, teórie databáz a umožňujú vytvárať moderné inteligentné systémy.

V súčasnosti je akútna otázka vytvárania informačných skladov (dátový sklad, dátový sklad) – optimálne usporiadaných databáz, ktoré poskytujú najrýchlejší a najpohodlnejší prístup k informáciám potrebným pre rozhodovanie. Úložisko akumuluje spoľahlivé informácie z rôznych zdrojov počas dlhého časového obdobia, ktoré zostáva nezmenené. Údaje sú agregované a uchovávané podľa oblastí, ktoré popisujú (špecifické pre jednotlivé domény) a spĺňajú požiadavky celého podniku (integrované).

Vzhľadom na relatívne krátke obdobie existencie väčšiny domácich podnikov, nedostatok analyzovaných údajov, nestabilitu podnikov, ktoré podliehajú zmenám v dôsledku zmien v legislatívneho rámca je ťažké vyvinúť efektívnu stratégiu rozhodovania pomocou systémov dolovania údajov. Preto sa predpokladá, že genetické algoritmy sú najprijateľnejšou metódou na skúmanie údajov v oblasti financií a podnikania a pre úlohy klasifikácie obrázkov a faktov je lepšie použiť metódy rozhodovacích stromov alebo neurónové siete.

Literatúra: 1. Shchavelev L.V. Dolovanie dát. http://www.citforum.ru/seminars/cis99/sch_04.shtml, 2. Burov K. Objav vedomostí v dátových skladoch / / otvorené systémy. 1999. č. 5-6., http://www.osp.ru/os/l999/05-06/14.htm. 3. Kiselev M, Solomatin E. Prostriedky získavania znalostí v obchode a financiách // Otvorené systémy. 1997. Číslo 4. s. 41-44. 4. Krechetov N, Ivanov P. Produkty pre dolovanie údajov // Počítačový týždeň - Moskva. 1997. č. 14-15. s. 32-39. 5. Edelstein H. Inteligentné nástroje na analýzu a prezentáciu údajov v informačných skladoch // Počítačový týždeň - Moskva. 1996. Číslo 16. s. 32-35.

Do redakcie doručené 22.06.2000

Recenzent: Dr. tech. vedy, prof. Putyatin V.P.

Gvozdinskij Anatolij Nikolajevič, Ph.D. tech. vied, profesor Katedry umelej inteligencie KhTURE. Vedecké záujmy: hodnotenie efektívnosti komplexných systémov riadenia informácií. Záujmy a záľuby: klasická hudba, turistika. Adresa: Ukrajina, 61166, Charkov, ul. akad. Lyapunova, 7, apt. 9, tel. 32-69-08.

Klimko Elena Genrihovna, asistentka Katedry počítačových technológií a informačných systémov, Poltavská štátna technická univerzita pomenovaná po Jurijovi Kondratyukovi. Postgraduálny študent (pri zamestnaní) Katedry umelej inteligencie KhTURE. Vedecké záujmy: analytická analýza údajov. Záujmy a záľuby: čítanie, pletenie. Adresa: Ukrajina, 36021, Poltava, ul. Diamant, 1-A, apt. 34, tel. (053-22) 3-43-12.

Sorokov Alexander Ivanovič, PhD. tech. v odbore veda, docent Katedry počítačových technológií a informačných systémov, Štátna technická univerzita Yuriy Kondratyuk Poltava. Výskumné záujmy: KDD (Objavovanie vedomostí). Záujmy a koníčky: psy. Adresa: Ukrajina, 36022, Poltava, per. Broken, 37A, tel.(053-2) 18-60-87, e-mail: [chránený e-mailom]

Po kontrole úplnosti a spoľahlivosti informácií sa vykoná ich analytické spracovanie. Zahŕňa definíciu systému ukazovateľov, ktorých štúdium je potrebné na dosiahnutie cieľov analýzy. Tieto ukazovatele sú buď už obsiahnuté vo vybranej informácii, alebo sú vypočítané v procese jej analytického spracovania.

Systémom ukazovateľov sa rozumie taký ich usporiadaný súbor, v ktorom každý ukazovateľ dáva kvalitatívnu a kvantitatívnu charakteristiku určitého aspektu činnosti ekonomického subjektu, je prepojený s inými ukazovateľmi, ale neduplikuje ich a má vlastnosti redukovateľnosti a deliteľnosti.

Počet ukazovateľov v procese analytického spracovania informácií sa môže takmer neobmedzene zvyšovať ich diferenciáciou alebo integráciou v závislosti od programu analýzy, hĺbky štúdia výsledkov činností a faktorov, ktoré ich ovplyvňujú.

Keďže činnosť ekonomických subjektov, ich štrukturálne členenie, ako aj ich rôzne asociácie sú vo všeobecnosti pomerne stabilné, systém ukazovateľov, s ktorými sa analyzuje, má určitú stabilitu, ale postupne sa obohacuje o nové ukazovatele, ako vznikajú nové úlohy, zmeny v celková ekonomická situácia, vonkajšie a vnútorné podmienky činnosti ekonomických subjektov.

Nevyhnutným predpokladom pre rozvoj systému analytických ukazovateľov a ich správnu aplikáciu je zoskupovanie týchto ukazovateľov podľa rôznych kritérií (pozri obr. 4.1).

Rozdelenie ukazovateľov na absolútne a príbuzný je nevyhnutný na určenie rozsahu a zložitosti analytického spracovania informácií.

Informácie zozbierané z rôznych zdrojov obsahujú najmä absolútne ukazovatele, ktoré charakterizujú objem činnosti analyzovaného ekonomického subjektu (napríklad objem predaja tovaru, výška nákladov na výrobu tovaru alebo služieb, objem veľkoobchodu alebo maloobchodu). obchodu, výška záloh




Ryža. 4.1. Klasifikácia analytických ukazovateľov podľa rôznych

vlastnosti zoskupenia

kapitál, výška zisku alebo straty, počet zamestnancov, cena dlhodobého majetku, veľkosť zásob).

Relatívne ukazovatele, ktoré majú prvoradý význam pre hodnotenie výkonnosti analyzovanej organizácie ako celku alebo jej vnútorných štruktúrnych útvarov, sú už vypočítané rôznymi matematickými operáciami v procese analytického spracovania informácií. Takéto analytické spracovanie môžu čiastočne ustanoviť príslušné predpisy ako povinnosti účtovného oddelenia a iných vnútorných štruktúrnych útvarov hospodárskeho subjektu (napríklad stanovenie nákladov na jednotlivé produkty, výšku zisku vo vzťahu ku kapitálu, výpočet ekonomických štandardov ako súčasť výkazníctva komerčných bánk).

Výpočet relatívnych ukazovateľov zvyšuje porovnateľnosť údajov za rôzne chronologické obdobia, keďže všetky absolútne ukazovatele používané na tento účel v matematických vzorcoch sú počítané v mene, ktorá má rovnakú kúpnu silu, t. vplyv inflácie je eliminovaný. Všetky absolútne ukazovatele týkajúce sa daného obdobia sa navyše tvoria pod vplyvom rovnakej vnútornej a vonkajšej situácie. Preto sa pri analýze dynamické a priestorové porovnania robia prevažne pomocou relatívnych a nie absolútnych ukazovateľov.

Na zlepšenie porovnateľnosti údajov sa používajú tam, kde je to možné, prirodzené a premenené na prírodné pomocou špeciálne stanovených koeficientov, tzv podmienečne prirodzené metrov. Na rovnaký účel sa v niektorých prípadoch dáva prednosť pôrod a náklady na prvok metrov, čo umožňuje v prípade potreby eliminovať vplyv na absolútne ukazovatele zmeny ceny tovaru a v relatívnych ukazovateľoch odvodených od tejto hodnoty rozdiely v cene tovaru spôsobené kolísaním pomeru prenesených nákladov fixné aktíva, mzdy živej práce a zisk v cene výrobkov. Je potrebné vziať do úvahy, že ani pri použití tvrdej cudzej meny na meranie nákladov absolútnych ukazovateľov nie je eliminovaný vplyv štrukturálnych zmien na hodnotenie objemu činnosti ekonomického subjektu a jeho kvalitatívnych charakteristík. Preto sa v nasledujúcej prezentácii osobitne zváži problematika a použitie rôznych prírodných, podmienene prírodných, pracovných a neplnohodnotných meračov na dosiahnutie niektorých cieľov analýzy.

Zoskupenie analytických ukazovateľov do kvantitatívne a kvalitu má veľmi blízko k ich deleniu na absolútne a relatívne, ale úplne sa s ním nezhoduje. Napríklad celková výška zisku je kvantitatívnym ukazovateľom, ale z hľadiska svojho ekonomického obsahu sa vzťahuje na kvalitatívne charakteristiky činnosti objektu, pretože samotná skutočnosť dosahovania zisku a nie straty, a to aj bez odvodenia relatívnej ziskovosti sa už javí ako pozitívny výsledok činnosti.

Mimoriadne dôležitú úlohu v ekonomickej analýze zohráva delenie ukazovateľov podľa zovšeobecňujúci a súkromné.

Sumarizujúce ukazovatele sa považujú za ukazovatele, pomocou ktorých sú uvedené súhrnná charakteristika stav analyzovaného ekonomického subjektu, miera využívania zdrojov, ktoré má k dispozícii, a efektívnosť hospodárenia vyjadrená v dosahovaní sledovaných cieľov. Primárnymi cieľmi môže byť dosiahnutie vyššieho zisku v porovnaní s refinančnou sadzbou alebo s inými alternatívne spôsoby použitie kapitálu, ktorý má subjekt k dispozícii; dosiahnutie vyššej kvality tovarov a služieb ako u konkurentov pri rovnakej alebo nižšej úrovni nákladov na ich výrobu a obeh; na tomto základe dobytie nových trhov a zvýšenie ceny firmy. Medzi zovšeobecňujúce ukazovatele patria aj ukazovatele, ktoré vo všeobecnosti charakterizujú určitú stránku alebo smerovanie podniku alebo jeho jednotlivých štruktúrnych útvarov, veľkosť zdrojov, ktoré využívajú, a ich obrat. Každý zovšeobecňujúci ukazovateľ možno rozložiť na množstvo konkrétnych ukazovateľov, ktoré vo vzťahu k nemu zohrávajú podriadenú úlohu. Tieto súkromné ​​ukazovatele prispievajú k identifikácii a meraniu vplyvu jednotlivých vnútorných a vonkajších faktorov, ktoré určujú veľkosť a dynamiku zovšeobecňujúceho ukazovateľa. Pomocou súkromných ukazovateľov sa dosahuje podriadenosť lokálnych cieľov jednotlivých jednotiek a činností ekonomického subjektu všeobecným cieľom jeho fungovania. Všeobecný cieľ fungovania ekonomického subjektu nie je jednoznačný, znamená súčasné a vzájomne prepojené dosahovanie viacerých cieľov, a preto stupeň jeho dosiahnutia neodráža jeden, ale celý systém zovšeobecňujúcich a partikulárnych ukazovateľov. .

Na riadenie činnosti ekonomického subjektu ako celku, jeho jednotlivých oblastí a činností každého vykonávateľa sa najskôr vypracuje model tejto činnosti. Je opísaná systémom zovšeobecňujúcich a jednotlivých ukazovateľov stanovených v podnikateľskom pláne, ktorých úroveň a prepojenie by malo zabezpečiť dosiahnutie plánovaných výsledkov výkonnosti.

Systém plánovaných ukazovateľov je spravidla horší ako systém účtovných ukazovateľov, pretože účtovníctvo odráža vplyv nielen vopred predvídateľných faktorov, ale aj mnohých nepredvídateľných faktorov - objektívnych a subjektívnych, napríklad prírodných katastrof. , nepoctivosť účinkujúcich, podvody a krádeže. V dôsledku toho účtovníctvo odráža vplyv na zovšeobecňujúce a konkrétne ukazovatele celej rozmanitosti reality.

Systém analytických ukazovateľov je ešte širší ako z hľadiska plánovania a účtovníctva, pretože by mal poskytovať reflexiu výsledkov hospodárenia a hodnotenie úrovne jeho efektívnosti vo všetkých plánovaných oblastiach a početných cieľoch, a to nielen všeobecne pre skúmaný relatívne nezávislý ekonomický systém (podnik, komerčná banka), ale aj pre jeho veľké a malé divízie; identifikovať úlohu jednotlivých jednotiek v konečných výsledkovčinnosti a vplyv rôznych faktorov na ekonomický rozvoj. Preto systém analytických ukazovateľov zahŕňa tak zovšeobecňujúce ukazovatele (výsledky) diferencované podľa oblastí činnosti, ako aj súkromné ​​(faktorové) ukazovatele.

Čiastkové ukazovatele tvorené rozkladom zovšeobecňujúceho ukazovateľa alebo agregované do zovšeobecňujúceho ukazovateľa sa v analýze ekonomickej aktivity nazývajú aj faktorové ukazovatele, pretože ich použitie umožňuje odhaliť a zmerať vplyv určitých ekonomických faktorov na zovšeobecňujúce ukazovatele. Ako viete, zmeny v stave analyzovaného objektu sa vyskytujú pod vplyvom ekonomických a sociálnych faktorov. Pojem „príčina“ sa zvyčajne používa na skupinu faktorov, ktorých vplyv možno zistiť priamo z účtovných a výkazníckych údajov. Pri ďalšom rozklade skupiny na jej zložky sa získané čiastkové faktorové ukazovatele nazývajú aj príčiny, ak je ich spojenie s analyzovaným ukazovateľom funkčné a je možné ich vypočítať vykonaním rôznych matematických operácií s vykazovacími ukazovateľmi.

V tých prípadoch, keď sa odhalí a zmeria vplyv na analyzovaný ukazovateľ iných, s ním súvisiacich v korelácii, a sila ich vplyvu sa meria pomocou štatistických a matematických metód, konkrétne ukazovatele získané na detailnú analýzu sa už zvyčajne nepovažujú za tzv. príčin, ale faktorov.

Preto je rozlíšenie medzi pojmami „príčina“ a „faktor“ veľmi podmienené. Vychádza najmä z možností priameho alebo nepriameho merania ich vplyvu s prihliadnutím na charakter súvislosti s analyzovaným zovšeobecňujúcim ukazovateľom.

Napríklad odchýlky od plánu objemu výroby môžu byť spôsobené nesúladom medzi plánom počtu a zloženia personálu a zároveň priemerným výkonom na pracovníka za analyzované obdobie. Hodnoty vyššie uvedených agregovaných skupín faktorov a ich odchýlky od plánu sa priamo odrážajú vo výkazoch a vyvolávajú sa v analýze dôvody odchýlok. Každý z týchto dôvodov však možno ďalej považovať za funkciu mnohých premenných. Takže zmena v počte zamestnancov je podrobne rozpísaná podľa kategórií zamestnancov, výstup na zamestnanca je prezentovaný ako súčin výstupu na pracovníka a podielu pracovníkov na celkovom počte zamestnancov. Tieto analytické ukazovatele možno vypočítať priamo pomocou údajov z výkazníctva, a preto sa nazývajú aj diferencovanejšie dôvody na zmenu súhrnného ukazovateľa.

Predpokladajme, že analýzu ďalej prehĺbime, aby sme zistili vplyv na zmenu zovšeobecňujúceho ukazovateľa - objemu produkcie faktorov, ktoré následne ovplyvňujú plnenie plánu výkonu na pracovníka, ktorého vzťah s týmto ukazovateľom nemožno priamo určiť. Úlohou je napríklad zistiť vplyv na priemernú úroveň výkonu pracovnej organizačnej a technickej úrovne výroby (stupeň mechanizácie a automatizácie hl. technologických procesov a pomocné práce, zavádzanie metód vedeckej organizácie práce, externá spolupráca a pod.) a osobné faktory (všeobecné a špeciálne vzdelanie, pracovné skúsenosti, pohlavie, vek).

Podľa zovšeobecnených údajov účtovníctva a štatistického účtovníctva nie je možné merať vplyv uvedených faktorov na produkciu a jej prostredníctvom na objem produkcie ani na rýchlosť jej rastu. Na tento účel sa zbierajú a spracúvajú primárne účtovné a dokumentačné údaje špeciálnymi ekonomickými a matematickými metódami (hlavne korelačnými). technické služby, personálne, pracovné a mzdové oddelenia, ako aj špeciálne zozbierané doplnkové mimoúčtovné informácie (dotazníkový prieskum, fotografie a autofotografie pracovného dňa, zápisnice z výrobných stretnutí a pod.). Pri takomto ďalšom upresnení príčin sa ich charakteristiky už nazývajú faktory.

Meranie vplyvu jednotlivých faktorov na dynamiku ekonomického rozvoja, výsledky realizácie plánu a efektívnosť manažmentu pomáhajú určiť ich relatívnu dôležitosť v práci podniku, zamerať sa na hlavné a rozhodujúce a zvýšiť efektívnosť analýzy pri identifikácii rezerv.

Pre podniky rovnakého profilu by mala byť zabezpečená jednotnosť systému ukazovateľov a metodiky ich výpočtu. Pokusy aplikovať rovnaké odhadované ukazovatele v ekonomických subjektoch rôznych sektorov národného hospodárstva sa neuskutočnili, keďže nie je potrebná identita použitých ukazovateľov, ale ich súlad so základným prístupom k hodnoteniu výsledkov dosiahnutých analyzovanými subjektom z hľadiska cieľov svojej činnosti, lokálnych a globálnych kritérií na ich dosiahnutie.

Nie vždy sa spoločnosti darí dosiahnuť všetky svoje ciele a vyriešiť všetky úlohy, ktoré sú jej zverené. Okrem toho, spolu s implementáciou plánu pre niektoré ukazovatele, možno získať negatívny výsledok pre iné. V tejto súvislosti je vhodné pri určovaní ratingu ekonomického subjektu, jeho štrukturálnych členení, vypočítať podmienený integrálny ukazovateľ, ktorého úroveň by odrážala tak mieru plnenia plánovaných cieľov pre každý z ukazovateľov, ako aj ich relatívnu hodnotu.

Integrálny ukazovateľ, odvodený na základe množstva iných, veľmi odlišných ekonomickým obsahom a praktickým účelom, necharakterizuje konkrétne výsledky práce analyzovaného subjektu a stupeň dosiahnutia početných cieľov, ktoré mu boli stanovené. Tento ukazovateľ možno použiť na určenie hodnotenia. Vo všetkých ostatných prípadoch jeho využitie nezodpovedá viacúčelovosti fungovania ekonomických subjektov.

Pre posúdenie plnenia plánu a navyše aj úrovne ekonomickej efektívnosti je potrebné vziať do úvahy všetky ukazovatele zahrnuté v systéme, pretože preplnenie plánu jedného z nich nezbavuje analyzovanú ekonomickú väzbu od povinnosť zabezpečiť dosiahnutie plánovanej úrovne pre ostatné ukazovatele. Nadplánované zlepšenie niektorého z ukazovateľov zvyčajne nevykompenzuje škody spôsobené oneskorením iného ukazovateľa, čo odráža nesplnenie možno ešte dôležitejšej úlohy, ktorá bola tomuto ekonomickému subjektu zverená. Napríklad výrazné prekročenie plánovanej úrovne výroby tovarov (práce, služby) nevylučuje potrebu zabezpečiť danú úroveň nákladov na jednotku výstupu; prekročenie plánu z hľadiska objemu výroby a zisku nemôže kompenzovať nesplnenie plánu uvedenia čistiarní do prevádzky a iných opatrení na ochranu životného prostredia.

Najprijateľnejším spôsobom konštrukcie integrálneho ukazovateľa je vyriešiť matematický problém výpočtu vzdialeností medzi bodmi, ktoré charakterizujú hodnoty rovnakých ukazovateľov na porovnávaných ekonomických subjektoch a na podmienenom najlepšom podniku pre všetky tieto ukazovatele, tzv. štandard rozvoja a týmto spôsobom určiť ukazovateľ „úrovne rozvoja“ každého z nich. Jeho výhodou oproti iným metódam výpočtu integrálneho ukazovateľa je objektívnosť odhadov, keďže je založený na matematických výpočtoch.

Iné spôsoby agregácie ukazovateľov nie sú dostatočne objektívne. Napríklad pri výpočte integrálneho ukazovateľa možno význam jedného alebo druhého ukazovateľa v ich všeobecnom systéme určiť aj pomocou bodovania. Ak je teda vzhľadom na nedostatok používaných vzácnych kovov obzvlášť dôležité ich najhospodárnejšie využitie, tak najvyššie skóre má priradený ukazovateľ znižovania materiálovej náročnosti výroby týchto kovov. Ak je v prvom rade potrebné zabezpečiť ďalšie rozširovanie sortimentu, tak priradením vyššieho skóre tomuto ukazovateľu sa tento umiestňuje na prvom mieste v rade hodnotiacich ukazovateľov. Napriek tomu, že hodnotenie efektívnosti produkcie v jednotlivých odvetviach národného hospodárstva a ich podnikoch je založené na rovnakej sústave ukazovateľov, každému z nich možno priradiť iné skóre aj v tom istom odvetví alebo podniku v rôznych obdobiach čas. Bodové hodnotenie každého ukazovateľa by malo odrážať jeho význam pri dosahovaní cieľov fungovania analyzovaných ekonomických subjektov. Zároveň, ako každé subjektívne hodnotenie, aj tieto body je možné nastaviť ľubovoľne.

Za sledované obdobie existujú ukazovatele, ktoré fixujú stav analyzovaného ekonomického subjektu a výsledky jeho činnosti, prípadne pôsobenie jeho zamestnancov v určitej oblasti o určitý počet, t.j. v statické, alebo za analyzované obdobie, t.j. v dynamika. Napríklad súvaha odzrkadľuje finančný stav, rozdelenie majetku, zdroje jeho vzniku ku dňu zostavenia a výkaz peňažných tokov zahŕňa ich zostatky, príjmy a úbytky, t.j. ich dynamiku za celé analyzované obdobie.

Vo vzťahu k činnosti analyzovaného ekonomického subjektu a možnostiam ovplyvňovania jeho výsledkov, ukazovatele zohľadňujúce objektívne nezávislý dôvody a subjektívne v závislosti od toho.

V procese analýzy je veľmi dôležité eliminovať vplyv faktorov objektívneho poriadku, ktoré nemožno pripísať užitočným výsledkom alebo naopak nedostatkom činnosti samotného ekonomického subjektu.

Spolu s výberom systému ukazovateľov na analýzu podľa plánovaného programu má veľký význam zovšeobecnenie informácií v analytických tabuľkách a číslach. Analytické tabuľky slúžia na porovnanie analyticky spracovaných údajov podľa chronologických období a na základe toho zisťujú dynamiku skúmaných ukazovateľov, porovnávajú ich dosiahnuté alebo predpokladané hodnoty so základnými údajmi, ktoré môžu byť zodpovedajúcimi ukazovateľmi plánu predchádzajúcich a predpovedané budúce obdobia, povinné normy, ukazovatele iných ekonomických subjektov, priemery za odvetvie alebo akékoľvek iné, ktoré vyberie analytik na základe účelu štúdie.

Na takéto porovnania sa zvyčajne používajú vodorovné riadky analytickej tabuľky, v ktorých sú uvedené názvy porovnávaných údajov a ich absolútne a relatívne hodnoty. Takéto porovnania medzi riadkami tabuľky sa nazývajú horizontálna analýza.

Podľa stĺpcov analytickej tabuľky sa porovnávajú zovšeobecňujúce ukazovatele s ich zložkami - konkrétnymi ukazovateľmi - s cieľom identifikovať relatívna hodnota tieto súkromné ​​ukazovatele pri tvorbe zovšeobecňujúcich ukazovateľov sa určuje najmä štruktúra zovšeobecňujúcich ukazovateľov. Tento spôsob reflektovania analyticky spracovaných informácií sa nazýva vertikálna alebo štrukturálna analýza.

Analytická tabuľka má textovú (ľavú) a číselnú (vpravo) časť. Pre počítačové spracovanie informácií je možné textovú časť tabuľky zašifrovať pomocou abecedných alebo číselných označení. Čísla sú umiestnené v stĺpcoch tabuľky na samostatných čiarach, ktoré ich pretínajú.

Ľavá strana tabuľky, v ktorej sú umiestnené názvy jej riadkov, sa nazýva „predmet“ a pravá, pozostávajúca zo stĺpcov, nad ktorými sú uvedené aj ich názvy, sa nazýva „predikát“.

Zovšeobecnenie zhromaždené informácie v prepojených, doplnkových alebo podrobných analytických tabuľkách umožňuje tzv. beztextovú analýzu; starostlivo analyticky spracované informácie umiestnené v tabuľkách umožňujú vyvodiť potrebné závery a vypracovať spoľahlivé manažérske rozhodnutia. V týchto prípadoch nie je potrebné prezentovať výsledky analýzy vo forme textu, alebo je ten istý text podaný mimoriadne výstižne.

Príprava súboru analytických tabuliek, ktoré by dostatočne objektívne a úplne odzrkadľovali všetky otázky analytického programu a jeho výsledkov, si vyžaduje vysokú profesionalitu zo strany tvorcov rozložení týchto tabuliek a pokynov na ich vyplnenie.

Preto sa v praxi na tento účel používajú štandardné metódy a v tabuľkách odporúčaných v nich sa robia len zmeny, ktoré vyplývajú z individuálnych charakteristík analyzovaného ekonomického subjektu alebo zo situácie, ktorá sa na ňom vyvinula.

Pri použití analytických tabuliek a najmä pri ich zmenách je potrebné dodržiavať všeobecné pravidlá ich návrhu:

1) nad tabuľkou by mal byť umiestnený jej názov a sériové číslo;

2) ak sú vo všetkých riadkoch a stĺpcoch tabuľky použité rovnaké merné jednotky, potom do zátvoriek pod názvom tabuľky v pravom rohu je potrebné umiestniť štandardné označenie mernej jednotky, napríklad (tis. rubľov) alebo ($). Ak sú v riadkoch tabuľky použité rôzne merné jednotky, ich označenia sú umiestnené v hlavičkách riadkov oddelené čiarkou za názvom. Ak sa v stĺpcoch používajú rôzne merné jednotky, mali by sa uviesť aj v nadpisoch stĺpcov;

3) stĺpce tabuľky sú očíslované postupne, začínajúc od prvého, v ktorom sú uvedené čísla riadkov. V prípadoch, keď sa ukazovatele rôznych stĺpcov počítajú na základe hodnôt uvedených v predchádzajúcich stĺpcoch, s výnimkou názvu a sériové číslo v tomto stĺpci by mal byť uvedený výpočtový algoritmus s uvedením čísel stĺpcov obsahujúcich počiatočné údaje, ako aj matematické operácie, ktoré by sa s nimi mali vykonať, aby sa získali hodnoty uvedené v tomto stĺpci, napríklad: [ (stĺpec 4 - stĺpec 3) ∙ 100: 3];

4) nadpisy v „predikáte“ sú jednoduché v prípadoch, keď jeho stĺpce nemajú spoločný obsah, alebo zložité – keď je obsah spoločný pre viacero stĺpcov podrobne rozpísaný v každom z nich. Potom je nadpis označený vo forme niekoľkých úrovní, napríklad:

Často sa používa na zvýšenie viditeľnosti materiálov analýzy grafické metódy. Napríklad tabuľky, ktoré zaznamenávajú dynamiku ukazovateľov, sú doplnené obrázkami, v ktorých je táto dynamika prezentovaná vo forme kriviek alebo stĺpcov. Štruktúra zovšeobecňujúcich ukazovateľov v stĺpcoch analytických tabuliek je znázornená vo forme koláčových grafov. Používajú sa aj iné formy diagramov.

Anna Ivanová

Informačné systémy dnes pri svojej činnosti využíva takmer každá spoločnosť, či už veľká alebo veľmi malá, súkromná alebo verejná, a to spravidla nie prvý rok. To znamená, že väčšina podnikov už vlastní určité množstvo nazhromaždených údajov, pričom toto množstvo má často značnú hodnotu – prinajmenšom to potvrdzuje skutočnosť, že v posledných rokoch sa v tlači venuje pomerne veľká pozornosť únikom informácií o podnikoch. údaje, ktoré sú považované za výnosný tovar.pre kriminálny trh.

Upozorňujeme, že hodnota podnikových údajov nespočíva len v súhrnnej hodnote jednotlivých záznamov, ale aj v často oveľa väčšej hodnote súboru údajov ako zdroja dodatočných informácií, ktoré nemožno získať z jedného alebo viacerých záznamov, ako napr. o vzoroch, trendoch alebo vzájomnej závislosti medzi akýmikoľvek údajmi, ktoré vám umožňujú robiť určité obchodné rozhodnutia. Moderné nástroje na riadenie podniku a dodávateľského reťazca, bankové informačné systémy a iné podnikové aplikácie preto zvyčajne zahŕňajú nielen nástroje na zadávanie a úpravu údajov, ale aj nástroje na analytické spracovanie, ktoré umožňujú tak či onak identifikovať a prezentovať vzory a trendy v údajoch. . Dnes sú tieto nástroje veľmi rôznorodé. Zahŕňajú nástroje na budovanie relačných dátových skladov – špeciálne navrhnuté databázy, ktoré umožňujú rýchlo vykonávať dotazy na výber údajov; serverové a klientske nástroje na budovanie viacrozmerných dátových skladov obsahujúcich súhrnné údaje (súčty, priemery) v nerelačnej štruktúre; Klientske aplikácie na poskytovanie užívateľských rozhraní pre relačné a viacrozmerné dátové úložiská; nástroje na vytváranie riešení založených na takýchto úložiskách, analýzu viacrozmerných a relačných údajov, generovanie správ o viacrozmerných a relačných údajoch. Nižšie budeme diskutovať o tom, aké sú produkty každej z týchto kategórií.

Dátové sklady

Dátový sklad sa zvyčajne nazýva databáza, ktorej hlavným účelom je vykonávanie analytických dopytov na výber údajov. Dátové úložiská môžu byť relačné aj viacrozmerné.

Ralph Kimball, jeden z pôvodcov konceptu dátového skladu, opísal dátový sklad ako „miesto, kde majú ľudia prístup k svojim údajom“ (pozri napríklad Ralph Kimball, Súbor nástrojov Data Warehouse Toolkit: Praktické techniky pre budovanie dimenzionálnych dátových skladov, John Wiley & Sons, 1996 a Data Webhouse Toolkit: Budovanie Web-Enabled Data Warehouse John Wiley & Sons, 2000). Sformuloval aj základné požiadavky na dátové sklady:

  • podpora vysokorýchlostného získavania údajov z úložiska;
  • podpora vnútornej konzistentnosti údajov;
  • schopnosť získavať a porovnávať takzvané dátové rezy (rezy a kocky);
  • dostupnosť pohodlných nástrojov na prezeranie údajov v úložisku;
  • úplnosť a spoľahlivosť uložených údajov;
  • podpora kvalitného procesu dopĺňania údajov.

Často je nemožné splniť všetky uvedené požiadavky v rámci toho istého produktu. Na implementáciu dátových skladov sa preto zvyčajne používa viacero produktov, z ktorých niektoré sú vlastne prostriedky na ukladanie dát, iné na ich extrahovanie a prezeranie, iné na ich dopĺňanie atď.

Všimnite si, že pri navrhovaní skladov sa vždy a priori predpokladajú o povahe vzájomných závislostí údajov v nich umiestnených a výhody používania dátového skladu pri rozhodovaní manažmentu do značnej miery závisia od správnosti týchto predpokladov.

Relačné dátové úložiská

Na rozdiel od takzvaných online databáz, ktoré využívajú aplikácie upravujúce dáta, sú relačné dátové úložiská navrhnuté tak, aby sa dosiahol minimálny čas vykonávania požiadaviek na čítanie (online databázy najčastejšie minimalizujú čas vykonávania požiadaviek na úpravu údajov). Údaje sa zvyčajne skopírujú do úložiska z online databáz podľa špecifického plánu.

Typická štruktúra dátového skladu sa výrazne líši od štruktúry konvenčného relačného DBMS. Táto štruktúra je zvyčajne denormalizovaná (čo zlepšuje výkon dotazu) a môže umožniť redundanciu údajov. Typická štruktúra dátového skladu je znázornená na obr. 1. Hlavnými komponentmi tejto štruktúry sú tabuľka faktov a tabuľky dimenzií.

Tabuľka faktov(v príklade na obrázku 1 sa nazýva Sales_Fact) je hlavná tabuľka dátového skladu. Spravidla obsahuje informácie o objektoch alebo udalostiach, ktorých súhrn bude ďalej analyzovaný. Takáto tabuľka zvyčajne obsahuje jedinečný zložený kľúč, ktorý kombinuje primárne kľúče tabuliek dimenzií. Najčastejšie ide o celočíselné hodnoty alebo hodnoty typu „dátum / čas“ – veď tabuľka faktov môže obsahovať státisíce alebo dokonca milióny záznamov a ukladanie opakujúcich sa textových popisov v nej je zvyčajne nerentabilné. Okrem toho tabuľka faktov obsahuje jedno alebo viacero číselných polí, na základe ktorých sa získavajú súhrnné údaje počas vykonávania analytických dopytov.

Všimnite si, že v tabuľke faktov nie sú žiadne informácie o tom, ako zoskupovať záznamy pri výpočte súhrnných údajov. Tieto informácie sú obsiahnuté v tabuľkách rozmerov.

Tabuľky rozmerov obsahujú nemenné alebo zriedkavo zmenené údaje. Majú aspoň jedno popisné pole a zvyčajne celočíselné pole kľúča (zvyčajne náhradný kľúč). Tabuľka dimenzií môže často (ale nie vždy) obsahovať polia, ktoré poukazujú na ďalšie atribúty, ktoré boli v pôvodnej prevádzkovej databáze, alebo na atribúty zodpovedné za zoskupenie jej vlastných údajov. Každá tabuľka dimenzií musí byť vo vzťahu jedna k mnohým s tabuľkou faktov.

Všimnite si, že rýchlosť rastu tabuliek dimenzií by mala byť zanedbateľná v porovnaní s rýchlosťou rastu tabuľky faktov; napríklad, nový vstup do mernej tabuľky charakterizujúcej tovar sa pridá len vtedy, keď sa objaví nový, predtým nepredaný výrobok.

Moderné nástroje na návrh údajov, ako napríklad CA AllFusion Modeling Suite, zvyčajne obsahujú šablóny na navrhovanie dátových skladov. Malo by sa povedať, že špecializované DBMS sa niekedy používajú na vytváranie relačných dátových skladov, v ktorých je ukladanie dát optimalizované z hľadiska rýchlosti vykonávania dotazov. Príkladom takéhoto produktu je Sybase Adaptive Server IQ, ktorý implementuje netradičný spôsob ukladania údajov do tabuliek. Úložisko však môžete vytvoriť v konvenčných relačných DBMS.

OLAP a multidimenzionálne dátové sklady

Multidimenzionálne dátové sklady tvoria základ nástrojov OLAP (On-Line Analytical Processing) určených na komplexnú multidimenzionálnu analýzu dát. Koncept OLAP bol opísaný v roku 1993 E. F. Coddom, autorom relačného dátového modelu a podpora OLAP je v súčasnosti implementovaná v mnohých DBMS a nástrojoch na analýzu dát.

Multidimenzionálne obchody zvyčajne obsahujú agregované údaje (napríklad súčty, priemery, počty) pre rôzne vzorky. Najčastejšie tieto agregované funkcie tvoria viacrozmernú množinu údajov nazývanú kocka, ktorej osi (nazývané dimenzie) obsahujú parametre a ktorej bunky obsahujú súhrnné údaje, ktoré od nich závisia (niekedy nazývané miery). Pozdĺž každej osi môžu byť údaje usporiadané do hierarchií, ktoré odrážajú rôzne úrovne detailov. Súhrnné údaje sa spravidla získavajú vykonaním série dotazov na zoskupenie údajov typu:

Všimnite si, že pomerne často ako zdroj údajov pre podobné žiadosti relačné dátové úložiská. V tomto prípade tabuľky dimenzií zvyčajne obsahujú zdrojové údaje na generovanie rozmerov kocky a tabuľka faktov obsahuje zdrojové údaje na výpočet rozmerov kocky.

Multidimenzionálne dátové sklady obsahujú súhrnné dáta s rôznym stupňom detailov, ako sú predaj podľa dňa, mesiaca, roku, kategórie produktu atď. Účelom ukladania súhrnných dát je skrátiť čas vykonania dotazu, pretože vo väčšine prípadov analýzy a prognózy nie sú podrobné, nie súhrnné údaje. Ukladanie všetkých agregovaných údajov však nie je vždy opodstatnené – koniec koncov, keď sa pridajú nové dimenzie, množstvo údajov, ktoré tvoria kocku, rastie exponenciálne (niekedy sa hovorí o „výbušnom raste“ množstva údajov). Na vyriešenie problému "výbušného rastu" sa používajú rôzne schémy, ktoré umožňujú pri výpočte ďaleko od všetkých možných agregovaných údajov dosiahnuť prijateľnú rýchlosť vykonávania dotazu.

Zdrojové aj agregované údaje môžu byť uložené v relačných alebo viacrozmerných štruktúrach. Preto v súčasnosti existujú tri spôsoby ukladania údajov:

  • MOLAP (Multidimenzionální OLAP) - zdrojové a súhrnné dáta sú uložené vo viacrozmernej databáze;
  • ROLAP (Relational OLAP) - zdrojové údaje zostávajú v rovnakej relačnej databáze, kde boli pôvodne umiestnené, zatiaľ čo súhrnné údaje sú umiestnené v tabuľkách služieb špeciálne vytvorených na ich uloženie v rovnakej databáze;
  • HOLAP (Hybrid OLAP) – zdrojové dáta zostávajú v tej istej relačnej databáze, kde boli pôvodne umiestnené, pričom súhrnné dáta sú uložené v multidimenzionálnej databáze.

Niektoré nástroje OLAP podporujú ukladanie údajov iba v relačných štruktúrach, iné len vo viacrozmerných štruktúrach. Väčšina moderných serverových nástrojov OLAP však podporuje všetky tri spôsoby ukladania údajov. Výber spôsobu ukladania závisí od objemu a štruktúry zdrojových údajov, požiadaviek na rýchlosť vykonávania dotazov a frekvencie aktualizácie OLAP kociek.

DBMS popredných výrobcov vydaných v posledných rokoch - IBM, Microsoft, Oracle, obsahujú nástroje na vytváranie multidimenzionálnych dátových skladov (túto tradíciu začal pred niekoľkými rokmi Microsoft, ktorý obsahoval OLAP server v SQL Server 7.0). Existujú aj samostatné produkty na vytváranie úložísk OLAP – vydávajú ich Hyperion, Sybase, Business Objects a niektoré ďalšie.

data mining

Termín dolovanie údajov (mining v angličtine znamená „ťažba“) označuje proces hľadania korelácií, trendov, vzťahov a vzorov medzi údajmi pomocou rôznych matematických a štatistických algoritmov: zhlukovanie, vytváranie čiastkových vzoriek, regresná a korelačná analýza. Príkladmi hľadaných informácií môžu byť informácie o tom, ktoré kategórie kupujúcich najčastejšie nakupujú konkrétny produkt, aká časť kupujúcich jedného konkrétneho produktu nakupuje iný konkrétny produkt, ktorá kategória zákazníkov najčastejšie nespláca poskytnutý úver načas. Tento druh informácií sa zvyčajne používa pri prognózovaní, strategickom plánovaní, analýze rizík a ich hodnota pre podnik je veľmi vysoká.

Upozorňujeme, že tradičné matematické štatistiky a nástroje OLAP nie sú vždy vhodné na riešenie takýchto problémov. Na testovanie vopred formulovaných hypotéz sa zvyčajne používajú štatistické metódy a OLAP, ale často je to formulácia hypotézy, ktorá sa ukazuje ako najťažšia úloha pri vykonávaní obchodnej analýzy pre následné rozhodovanie, pretože nie všetky vzory v údajoch sú na prvý pohľad zrejmé.

Základ moderného technológie ÚdajeŤažba je založená na koncepte vzorov, ktoré odrážajú vzorce obsiahnuté v čiastkových vzorkách údajov. Hľadanie vzorov sa vykonáva metódami, ktoré nepoužívajú žiadne počiatočné predpoklady o týchto čiastkových vzorkách. Ak štatistická analýza alebo aplikácia OLAP zvyčajne formuluje otázky typu „Aký je priemerný počet klientov bánk, ktorí nesplatili úver načas, medzi slobodnými mužmi vo veku od 40 do 50 rokov?“, potom použitie dolovania údajov spravidla implikuje odpovede na otázky typu „Existujú Je to typická kategória klientov, ktorí nesplácajú úvery načas?“. Zároveň je to práve odpoveď na druhú otázku, ktorá často zabezpečuje prijatie úspešného obchodného rozhodnutia.

Dôležitou črtou Data Miningu je neštandardnosť a neprehľadnosť hľadaných vzorov. Inými slovami, nástroje na dolovanie údajov sa líšia od nástrojov na spracovanie štatistických údajov a OLAP nástroje skutočnosť, že namiesto toho, aby si vopred preverili vzájomné závislosti, ktoré používatelia predpokladali, dokážu takéto vzájomné závislosti na základe dostupných údajov sami nájsť a vytvoriť si hypotézy o ich povahe. Použitie nástrojov na dolovanie údajov však nevylučuje použitie štatistických nástrojov a nástrojov OLAP, pretože výsledky spracovania údajov pomocou týchto nástrojov spravidla prispievajú k lepšiemu pochopeniu povahy vzorov, ktoré by sa mali hľadať. Preto existujú nástroje Data Mining, ktoré dokážu vyhľadávať vzory, korelácie a trendy v relačných aj multidimenzionálnych dátových skladoch.

Zvyčajne existuje päť štandardných typov vzorov identifikovaných metódami dolovania údajov:

  • asociácia - vysoká pravdepodobnosť vzájomného prepojenia udalostí (napríklad alpské lyžovanie sa často kupuje s lyžiarskymi topánkami);
  • sekvencia - vysoká pravdepodobnosť reťazca udalostí súvisiacich v čase (napríklad v určitom období po zakúpení tlačiarne s vysokou pravdepodobnosťou spotrebné materiály jemu);
  • klasifikácia - existujú znaky, ktoré charakterizujú skupinu, do ktorej patrí tá alebo oná udalosť alebo objekt (zvyčajne sú určité pravidlá formulované na základe analýzy už klasifikovaných udalostí);
  • zhlukovanie - vzor podobný klasifikácii a líši sa od nej tým, že samotné skupiny nie sú v tomto prípade nastavené - sú detekované automaticky počas spracovania údajov;
  • časové vzorce – prítomnosť vzorcov v dynamike správania sa určitých údajov (typickým príkladom sú sezónne výkyvy dopytu po určitých tovaroch alebo službách) používaných na prognózovanie.

V súčasnosti existuje pomerne veľké množstvo rôznych metód dolovania údajov, medzi ktorými možno rozlíšiť nasledujúce.

Regresná, disperzná a korelačná analýza- implementované vo väčšine moderných štatistických balíkov, najmä v produktoch SAV Institute, StatSoft a pod.

Metódy analýzy v špecifickej tematickej oblasti založené na empirických modeloch. Často sa používa napríklad v lacných nástrojoch finančnej analýzy.

Algoritmy neurónových sietí, ktorého myšlienka je založená na analógii s fungovaním nervového tkaniva a spočíva v tom, že počiatočné parametre sa považujú za signály, ktoré sa transformujú v súlade s existujúcimi spojeniami medzi „neurónmi“ a odozvou (výsledok analýzy) je odpoveďou celej siete na počiatočné dáta. Odkazy sú v tomto prípade vytvorené pomocou takzvaného sieťového učenia prostredníctvom veľkej vzorky obsahujúcej pôvodné údaje aj správne odpovede.

Metóda najbližšieho suseda- výber blízkeho analógu počiatočných údajov z už dostupných nazhromaždených údajov.

Rozhodovacie stromy- hierarchická štruktúra založená na súbore otázok, z ktorých vyplýva odpoveď „áno“ alebo „nie“; hoci tento spôsob spracovania dát nie vždy ideálne nájde existujúce vzory, pomerne často sa používa v predpovedných systémoch kvôli prehľadnosti odozvy (obr. 3).

Algoritmy ohraničeného enumerácie- vypočítať frekvencie kombinácií jednoduchých logických dejov v podskupinách údajov.

evolučné programovanie- vyhľadávanie a generovanie algoritmu, ktorý vyjadruje vzájomnú závislosť dát na základe pôvodne špecifikovaného algoritmu, modifikovaného v procese vyhľadávania; niekedy sa hľadanie vzájomných závislostí vykonáva medzi niektorými určitými typmi funkcií (napríklad polynómy).

Nástroje na dolovanie dát tradične patria k drahým softvérovým nástrojom – cena niektorých z nich dosahuje niekoľko desiatok tisíc dolárov. Preto až donedávna boli hlavnými spotrebiteľmi tejto technológie banky, finančné a poisťovacie spoločnosti, veľké obchodné podniky a za hlavné úlohy vyžadujúce využitie Data Miningu sa považovalo hodnotenie úverových a poistných rizík a rozvoj marketingu. politika, tarifné plány a ďalšie zásady práce s klientmi. V posledných rokoch sa situácia trochu zmenila: na softvérovom trhu sa objavili relatívne lacné nástroje Data Mining od viacerých výrobcov (vrátane Microsoftu), ktoré túto technológiu sprístupnili aj malým a stredným podnikateľom, ktorí o tom doteraz neuvažovali.

Vizualizačné nástroje pre údaje OLAP a výsledky dolovania údajov

Univerzálne nástroje na vizualizáciu údajov OLAP vydáva mnoho spoločností, ako napríklad Business Objects, Cognos, Panorama, ProClarity. Tieto nástroje sú spravidla určené pre používateľov, ktorí majú určité znalosti o databázach a štatistických metódach analýzy. Takéto nástroje vám zvyčajne umožňujú pristupovať k dátovým skladom a zdrojom OLAP od rôznych dodávateľov (napríklad k multidimenzionálnym úložiskám založeným na Oracle, Microsoft a IBM DBMS), získavať časti viacrozmerných údajov a vytvárať na nich diagramy. Dodávatelia týchto nástrojov často poskytujú aj middlevérové ​​servery na vykonávanie analýzy údajov a poskytovanie výsledkov na zobrazenie v klientskych aplikáciách, ako aj nástroje na vytváranie riešení založených na klientskych nástrojoch a middlevérových serveroch (napríklad knižnice tried alebo ovládacie prvky ActiveX). Vzhľadom na to, že situácia so štandardmi business intelligence je stále ďaleko od ideálu (na rozdiel od relačnej DBMS neexistuje pre viacrozmernú DBMS ani všeobecne akceptovaný štandard pre dopytovací jazyk podobný SQL, ani univerzálne mechanizmy prístupu k údajom podobné ODBC alebo OLEDB), Takéto nástroje môžu do tej či onej miery vyriešiť problém vytvárania analytických aplikácií v spoločnostiach pomocou nástrojov DBMS a OLAP od niekoľkých rôznych výrobcov.

Dodávatelia nástrojov OLAP, ako sú Oracle a IBM, často uvoľňujú klientske aplikácie pre používateľov na prístup k úložiskám OLAP na základe ich vlastných serverových nástrojov. Takže spoločnosť Oracle Corporation má dokonca niekoľko týchto produktov kombinovaných v balíku Oracle Business Intelligence. Okrem toho sa v poslednej dobe rozšírili tabuľkové doplnky na vizualizáciu údajov OLAP. Používatelia majú napríklad k dispozícii nástroje na zobrazenie údajov Microsoft SQL Server Analytic Services Microsoft Excel 2000 a novšie verzie a Oracle a Hyperion uvoľňujú ďalšie prístupové moduly zabudované do rovnakého Excelu na prístup k ich vlastným úložiskám OLAP.

Za povšimnutie stojí expanzia v posledných rokoch sortimentu analytických produktov zameraných na obsluhu niektorých odvetví (napríklad maloobchod alebo veľkoobchod, finančné služby). Vyrábajú ich aj vyššie uvedené spoločnosti a množstvo ďalších výrobcov, najmä dodávatelia systémov podnikového riadenia a iných podnikových aplikácií špecifických pre daný priemysel.

Nástroje na generovanie správ

Správa je dokument, ktorého obsah je dynamicky generovaný na základe informácií obsiahnutých v databáze. Na softvérovom trhu je v súčasnosti veľa nástrojov na vytváranie správ: ako samostatné produkty, tak aj zahrnuté v nástrojoch na vývoj aplikácií alebo DBMS a implementované ako serverové služby alebo klientske aplikácie. Nástroje na vytváranie správ spravidla podporujú širokú škálu mechanizmov univerzálneho prístupu k údajom (ODBC, OLE DB, ADO.NET), často - nástroje na priamy prístup k najpopulárnejším DBMS pomocou ich klientskych API, obsahujú nástroje obchodnej grafiky, integrujú sa s kancelárske aplikácie, umožňujú publikovať zostavy na internete, zahŕňajú triedy alebo komponenty určené na vytváranie aplikácií, ktoré implementujú (okrem iných funkcií) generovanie zostáv.

Nesporným lídrom na trhu v oblasti reportovacích nástrojov je Crystal Reports, ktorý vlastní Business Objects. Je dostupný samostatne aj ako súčasť produktov iných výrobcov, od nástrojov na vývoj aplikácií až po geografické informačné systémy. Existuje aj serverová verzia tohto produktu navrhnutá tak, aby poskytovala správy veľkému počtu používateľov. Okrem Crystal Reports existuje niekoľko menej populárnych produktov tejto triedy.

Záver

V tomto prehľade sme zhodnotili hlavné technológie, ktoré sú základom moderných analytických aplikácií. Ako vidíte, výber technológií a produktov, ktoré ich implementujú, je pomerne široký, najmä vzhľadom na skutočnosť, že takéto nástroje sú k dispozícii v moderných serverových DBMS a široká škála klientskych nástrojov na vizualizáciu výsledkov analýz a vytváranie analytických správ. Nedostatok všeobecne akceptovaných štandardov v oblasti business intelligence však zatiaľ vytvára určité problémy pri vytváraní riešení, ktoré ju využívajú.

8.3.1. Nástroje on-line analytického spracovania (OLAP).

On-Line Analytical Processing - prostriedok operatívneho (real-time) analytického spracovania informácií zameraný na podporu rozhodovania a pomoc analytikom pri odpovedi na otázku "Prečo sú objekty, prostredia a výsledky ich interakcie také a nie iné?". Analytik zároveň sám vytvára verzie vzťahov medzi súborom informácií a kontroluje ich na základe dostupných údajov v príslušných štruktúrovaných informačných databázach.

ERP systémy sa vyznačujú prítomnosťou analytických komponentov ako súčasti funkčných subsystémov. Poskytujú formáciu analytické informácie v reálnom čase. Tieto informácie sú základom väčšiny manažérskych rozhodnutí.

Technológie OLAP využívajú hyperkocky – špeciálne štruktúrované dáta (inak nazývané kocky OLAP). V dátovej štruktúre hyperkocky sú:

Opatrenia - kvantitatívne ukazovatele (podrobnosti-základne) používané na tvorbu súhrnných štatistických výsledkov;

Dimenzie - popisné kategórie (detaily-vlastnosti), v kontexte ktorých sú miery analyzované.

Rozmer hyperkocky je určený počtom rozmerov na jeden takt. Napríklad hyperkocka PREDAJ obsahuje údaje:

Merania: spotrebitelia, dátumy transakcií, skupiny tovarov, nomenklatúra, úpravy, balenie, sklady, druhy platieb, typy zásielok, tarify, mena, organizácie, divízie, zodpovední, distribučné kanály, regióny, mestá;

Opatrenia: plánované množstvo, skutočné množstvo, plánovaná suma, skutočná suma, plánované platby, skutočné platby, plánovaný zostatok, skutočný zostatok, predajná cena, čas vykonania objednávky, vrátená suma.

Takáto hyperkocka je určená pre analytické správy:

Klasifikácia spotrebiteľov podľa objemu nákupov;

Klasifikácia predávaného tovaru podľa metódy ABC;

Analýza podmienok vykonávania objednávok rôznych spotrebiteľov;

Analýza objemov predaja podľa období, produktov a skupín produktov, regiónov a spotrebiteľov, interných divízií, manažérov a distribučných kanálov;

Prognóza vzájomného vyrovnania so spotrebiteľmi;

Analýza vrátenia tovaru od spotrebiteľov; atď.

Analytické správy môžu mať ľubovoľnú kombináciu dimenzií a mier, používajú sa na analýzu rozhodnutí manažmentu. Analytické spracovanie je zabezpečené inštrumentálnymi a lingvistickými prostriedkami. Informačná technológia "Pivot Tables" je prezentovaná vo verejnej tabuľke MS Excel, počiatočné údaje pre ich vytvorenie sú:

Zoznam (databáza) MS Excel - relačná tabuľka;

Ďalšia kontingenčná tabuľka MS Excel;

Konsolidovaný rozsah buniek MS Excel umiestnených v rovnakých alebo rôznych zošitoch;

Externá relačná databáza alebo kocka OLAP, zdroj údajov (súbory vo formáte .dsn, .ode).

Na zostavenie kontingenčných tabuliek na základe externých databáz sa používajú ovládače ODBC a tiež program MS Query. Kontingenčná tabuľka pre zdrojovú databázu MS Excel má nasledovnú štruktúru (obr. 8.3).

Rozloženie kontingenčnej tabuľky má nasledovnú dátovú štruktúru (obr. 8.4): rozmery - kód oddelenia, pozícia; opatrenia - dĺžka služby, plat a bonus. Nižšie je uvedená súhrnná tabuľka. 8.2, ktorý vám umožňuje analyzovať vzťah medzi priemernými pracovnými skúsenosťami a platom, priemernými pracovnými skúsenosťami a prémiami, platom a prémiami.

Tabuľka 8.2

Kontingenčná tabuľka pre analýzu odkazov

Koniec tabuľky. 8.2

Ak chcete pokračovať v analýze pomocou kontingenčnej tabuľky, môžete:

Pridajte nové súčty (napríklad priemerný plat, priemernú výšku bonusu atď.);

Využite filtrovanie záznamov a súčtov kontingenčnej tabuľky (napríklad na základe "Pohlavie", ktoré je umiestnené v rozložení v oblasti * Strana ");

Vypočítajte štrukturálne ukazovatele (napríklad rozdelenie mzdových prostriedkov a bonusového fondu podľa oddelení - pomocou prostriedkov dodatočné spracovanie kontingenčné tabuľky, podiely súčtu podľa stĺpca); atď.

Balík programov MS Office umožňuje publikovať tabuľkové údaje vrátane kontingenčných tabuliek a grafov vo formáte XTML.

Microsoft Office Web Components podporuje prácu s publikovanými údajmi v prostredí Internet Explorer a poskytuje nepretržitú analýzu (zmeny v štruktúre údajov kontingenčnej tabuľky, výpočet nových súhrnných súčtov).

8.3.2. Nástroje na dolovanie údajov (DM).

Nástroje DM zahŕňajú extrakciu („kopanie“, „dolovanie“) údajov a sú zamerané na identifikáciu vzťahov medzi informáciami uloženými v digitálnych databázach podniku, ktoré môže analytik použiť na zostavenie modelov, ktoré mu umožnia kvantifikovať mieru vplyvu faktorov záujem o neho. Okrem toho môžu byť takéto nástroje užitočné pri vytváraní hypotéz o možnej povahe informačných vzťahov v podnikových digitálnych databázach.

Technológia Text Mining (TM) je súbor nástrojov, ktoré vám umožňujú analyzovať veľké súbory informácií pri hľadaní trendov, vzorov a vzťahov, ktoré môžu pomôcť pri strategických rozhodnutiach.

Technológia Image Mining (IM) obsahuje nástroje na rozpoznávanie a klasifikáciu rôznych vizuálnych obrazov uložených v podnikových databázach alebo získaných ako výsledok online vyhľadávania z externých informačných zdrojov.

Na vyriešenie problémov spracovania a uchovávania všetkých údajov sa používajú tieto prístupy:

1) vytvorenie niekoľkých záložných systémov alebo jedného distribuovaného systému pracovného toku, ktorý vám umožňuje ukladať údaje, ale má pomalý prístup k uloženým informáciám na žiadosť používateľa;

2) budovanie internetových systémov, ktoré sú vysoko flexibilné, ale nie sú prispôsobené implementácii vyhľadávania a ukladania textových dokumentov;

3) zavedenie internetových portálov, ktoré sú dobre orientované na požiadavky používateľov, ale nemajú načítané popisné informácie o textových údajoch.

Systémy spracovania textové informácie, bez problémov uvedených vyššie, možno rozdeliť do dvoch kategórií: systémy jazykovej analýzy a systémy analýzy textových údajov.

Hlavné prvky technológie Text Mining sú:

sumarizácia;

Tematické vyhľadávanie (extrakcia funkcií);

Zhlukovanie;

Klasifikácia (klasifikácia);

Odpovedanie na požiadavky (odpovedanie na otázky);

Tematické indexovanie;

Vyhľadávanie podľa kľúčových slov (hľadanie kľúčových slov);

Vytváranie a udržiavanie taxonómie (oftaxonómie) a tezaurov (tezaurov).

Medzi softvérové ​​produkty, ktoré implementujú technológiu Text Mining, patria:

IBM Intelligent Miner for Text - set jednotlivé komunálne služby spustiť z príkazového riadku alebo skriptov; navzájom nezávislé (hlavný dôraz je kladený na mechanizmy dolovania dát – vyhľadávanie informácií);

Oracle InterMedia Text - sada integrovaná do DBMS, ktorá umožňuje najefektívnejšie pracovať s požiadavkami používateľov (umožňuje pracovať s modernými relačnými DBMS v kontexte komplexného viacúčelového vyhľadávania a analýzy textových údajov);

Megaputer Text Analyst je sada objektov zabudovaných do programu COM určených na riešenie problémov s dolovaním textu.

8.3.3. Inteligentné informačné technológie

Dnes v oblasti automatizácie riadenia dominuje informačná analýza v prípravnom štádiu prípravy rozhodnutia - spracovanie primárnych informácií, dekompozícia problémovej situácie, ktorá umožňuje dozvedieť sa len fragmenty a detaily procesov, a nie situáciu ako celý. Na prekonanie tohto nedostatku je potrebné naučiť sa budovať znalostné bázy s využitím skúseností najlepších špecialistov, ako aj generovať chýbajúce znalosti.

Využitie informačných technológií v rôznych sférach ľudskej činnosti, exponenciálny rast objemu informácií a potreba rýchlej reakcie v každej situácii si vyžadovali hľadanie adekvátnych spôsobov riešenia vznikajúcich problémov. Najúčinnejší z nich je spôsob intelektualizácie informačných technológií.

Pod inteligentné informačné technológie(ITT) zvyčajne rozumejú takým informačným technológiám, ktoré poskytujú nasledujúce funkcie:

Prítomnosť vedomostných báz, ktoré odrážajú skúsenosti konkrétnych ľudí, skupín, spoločností, ľudstva ako celku, pri riešení kreatívnych problémov v určitých oblastiach činnosti, sa tradične považuje za výsadu ľudského intelektu (napríklad také zle formalizované úlohy, ako je rozhodovanie tvorba, dizajn, extrakcia významu, vysvetlenie, školenie atď.);

Prítomnosť modelov myslenia založených na znalostných bázach: pravidlá a logické závery, argumentácia a uvažovanie, rozpoznávanie a klasifikácia situácií, zovšeobecňovanie a porozumenie atď.;

Schopnosť vytvárať celkom jasné rozhodnutia na základe nejasných, neprísnych, neúplných, nedostatočne určených údajov;

Schopnosť vysvetliť závery a rozhodnutia, t.j. prítomnosť vysvetľovacieho mechanizmu;

Schopnosť učiť sa, rekvalifikovať a následne sa rozvíjať.

Technológie neformálneho hľadania skrytých vzorcov v dátach a informáciách sú založené na Knowledge Discovery (KD). najnovšie technológie formovanie a štruktúrovanie informačných obrazov objektov, ktoré je najbližšie k princípom spracovania informácií inteligentnými systémami.

Informačné technológie na podporu rozhodovania (DS) na podporu rozhodovania sú škrupiny odborníkov

systémy alebo špecializované expertné systémy, ktoré umožňujú analytikom určiť vzťahy a vzťahy medzi nimi informačných štruktúr na základe štruktúrovaných informácií podniku, ako aj predvídať možné výsledky rozhodovania.

Vývojové trendy IIT. Systémy komunikácie a komunikácie. Globálne informačné siete a IIT môžu zásadne zmeniť spôsob, akým uvažujeme o firmách a samotnej znalostnej práci. Prítomnosť zamestnancov na pracovisku sa stane takmer zbytočnou. Ľudia môžu pracovať z domu a komunikovať medzi sebou v prípade potreby prostredníctvom sietí. Známa je napríklad úspešná skúsenosť s vytvorením novej modifikácie lietadla Boeing 747 distribuovaným tímom špecialistov interagujúcich cez internet. Umiestnenie účastníkov v akomkoľvek rozvoji bude hrať stále menšiu úlohu, ale bude sa zvyšovať dôležitosť úrovne zručností účastníkov. Ďalší dôvod, ktorý predurčil prudký rozvoj IIT, súvisí s komplikovanosťou komunikačných systémov a úloh riešených na ich základe. Vyžadovala sa kvalitatívne nová úroveň „intelektualizácie“ takých softvérových produktov, akými sú systémy na analýzu heterogénnych a nestriktných údajov, zaistenie informačnej bezpečnosti, vývoj riešení v distribuovaných systémoch atď.

Vzdelávanie. Už dnes dištančné vzdelávanie začína zohrávať významnú úlohu vo vzdelávaní a zavedením IIT sa tento proces výrazne individualizuje v súlade s potrebami a schopnosťami každého študenta.

Život. Informatizácia každodenného života sa už začala, ale s rozvojom IIT sa objavia zásadne nové príležitosti. Postupne sa do počítača budú prenášať stále nové a nové funkcie: kontrola nad zdravím užívateľa, ovládanie domácich spotrebičov ako sú zvlhčovače vzduchu, osviežovače vzduchu, ohrievače, ionizátory, stereo, lekárska diagnostika atď. Inými slovami, systémy sa stanú aj diagnostikmi stavu človeka a jeho domova. Pohodlie bude zabezpečené informačný priestor v priestoroch, kde sa informačné prostredie stane súčasťou prostredia človeka.

Perspektívy rozvoja IIT. Zdá sa, že v súčasnosti IIT pristúpilo k zásadne novej etape svojho vývoja. Takže za posledných 10 rokov sa možnosti IIT výrazne rozšírili vďaka vývoju nových typov logických modelov, vzniku nových

vyh teórií a ideí. Kľúčové body vo vývoji IIT sú:

Prechod od logickej inferencie k modelom argumentácie a uvažovania;

Hľadanie relevantných znalostí a generovanie vysvetlení;

Porozumenie a syntéza textov;

Kognitívna grafika, t.j. grafické a obrazové znázornenie vedomostí;

Multiagentové systémy;

Inteligentné sieťové modely;

Výpočty založené na fuzzy logike, neurálne siete, genetické algoritmy, pravdepodobnostné výpočty (realizované v rôznych kombináciách medzi sebou a s expertné systémy);

Problém metaznalcov.

Multi-agentové systémy sa stali novou paradigmou vytvárania sľubných IIT. Tu sa predpokladá, že agent je nezávislý inteligentný systém, ktorá má svoj vlastný systém stanovovania cieľov a motivácie, vlastnú oblasť pôsobenia a zodpovednosti. Interakciu medzi agentmi zabezpečuje systém vyššej úrovne – metainteligencia. V multiagentových systémoch sa modeluje virtuálna komunita inteligentných agentov – objektov, ktoré sú autonómne, aktívne, vstupujú do rôznych sociálnych vzťahov – kooperácia a kooperácia (priateľstvo), súťaživosť, súťaživosť, nepriateľstvo a pod. Sociálny aspekt riešenia moderných problémov je základným rysom koncepčnej novosti pokročilých intelektuálnych technológií – virtuálnych organizácií, virtuálnej spoločnosti.

(?) Kontrolné otázky a úlohy

1. Uveďte popis podniku ako objektu informatizácie. Aké sú hlavné ukazovatele charakterizujúce vývoj systému riadenia podniku.

2. Uveďte popredné informačné technológie pre riadenie priemyselných podnikov.

3. Vymenujte hlavné informačné technológie organizačného a strategického rozvoja podnikov (korporácií).

4. Aké sú základy štandardov strategického riadenia zameraných na zlepšovanie podnikových procesov? Aký je pomer informačných technológií BPM a BPI?

5. Definujte filozofiu celkového manažérstva kvality (TQM). Ako spolu súvisia fázy rozvoja kvality a informačných technológií?

6. Vymenujte hlavné ustanovenia organizačného rozvoja podniku, popíšte etapy strategického riadenia. Pomenujte skupinové stratégie.

7. Ako sa vytvára obchodný model podniku? Aké sú hlavné prístupy k hodnoteniu efektívnosti obchodného modelu.

8. Čo je to vyvážená výsledková karta? Vymenujte hlavné zložky SSP. Aké sú vzťahy medzi skupinami ukazovateľov BSC?

9. Vymenujte metodické základy tvorby informačných systémov. Čo je systémový prístup?

10. Čo je informačný prístup k formovaniu informačných systémov a technológií?

11. Aký je strategický prístup k formovaniu informačných systémov a technológií?

12. Čo je obsahom objektovo orientovaného prístupu k popisu správania agentov na trhu? Uveďte definíciu objektu, uveďte analógy agentových systémov.

13. Aké sú metodické princípy zlepšovania riadenia podniku založeného na informačných a komunikačných technológiách? Aký je účel IKT?

14. Uveďte definície dokumentu, toku dokumentov, pracovného toku, systému správy dokumentov.

15. Ako je navrhnuté rozloženie formulára dokumentu? Pomenujte zóny dokumentu, zloženie ich detailov.

16. Vymenujte základné informačné technológie systému správy dokumentov.

17. Čo je jednotný dokumentačný systém? Aké sú všeobecné princípy zjednotenia?

18. Popíšte organizačnú a administratívnu dokumentáciu, uveďte príklady dokumentov.

19. Aké požiadavky by mal spĺňať systém elektronickej správy dokumentov?

20. Čo je to podnikový informačný systém? Vymenujte hlavné regulačné slučky, zloženie funkčných modulov.

21. Pomenujte softvérové ​​produkty pre CIS, ktoré poznáte. Poskytnite im porovnávací popis.

SH Literatúra

1. Vernet J., Moriarty S. Marketingová komunikácia. Integrovaný prístup. St. Petersburg; Charkov: Peter, 2001.

2. Brooking E. Intelektuálny kapitál. Kľúč k úspechu v novom tisícročí. Petrohrad: Peter, 2001.

3. Godin V.V., Korpev I.K. Kontrola informačné zdroje. M.: INFRA-M, 1999.

4. Informačné systémy a technológie v ekonómii: Učebnica. 2. vyd., dod. a prepracované. / M.I. Semenov, I.T. Trubilin, V.I. Loiko, T.P. Baranovskaya; Ed. IN AND. Loiko. M.: Financie a štatistika, 2003.

5. Informačné technológie v podnikaní / Ed. M. Zelený. Petrohrad: Peter, 2002.

6. Kaplan Robert S., Norton David P. Balanced Scorecard. Od stratégie k akcii / Per. z angličtiny. M.: CJSC "Olimp-Business", 2003.

7. Karagodin V.I., Karagodina BJI. Informácie sú základom života. Dubna: Phoenix, 2000.

8. Karminský AM., Nesterov PZ. Podniková informatizácia. M.: Financie a štatistika, 1997.

9. Lichačeva T.N. Informačné technológie v službách informačnej spoločnosti // Nové informačné technológie v ekonomických systémoch. M., 1999.

10. Ostreykovsky V.A. Teória systémov. Moskva: Vyššia škola, 1997.

11. Piterkin S.V., Oladov N.A., Isaev D.V. Práve včas pre Rusko. Prax používania ERP systémov. 2. vyd. Moskva: Vydavateľstvo Alpina, 2003.

12. Sokolov D.V. Úvod do teórie sociálnej komunikácie: Proc. príspevok. Petrohrad: Vydavateľstvo SP6GUP, 1996.

13. Trofimov V.Z., Tomilov V.Z. Informačné a komunikačné technológie v manažmente: Proc. príspevok. Petrohrad: SPbGUEF, 2002.