OLAP-system. OLAP-system Grundläggande begrepp som OLAP-teknologier fungerar på

Syftet med rapporten

Denna rapport kommer att fokusera på en av kategorierna av intelligent teknik som är ett bekvämt analysverktyg - OLAP-teknik.

Syftet med rapporten: att avslöja och lyfta fram 2 frågor: 1) begreppet OLAP och deras tillämpade betydelse i ekonomisk förvaltning; 2) implementering av OLAP-funktionalitet i mjukvarulösningar: skillnader, möjligheter, fördelar, nackdelar.

Jag vill genast notera att OLAP är ett universellt verktyg som kan användas inom alla applikationsområden, och inte bara inom finans (som det kan förstås av rapportens titel), vilket kräver dataanalys olika metoder.

Finanshantering

Ekonomistyrning är ett område där analys är viktigare än något annat. Varje ekonomiskt och förvaltningsbeslut uppstår som ett resultat av vissa analytiska procedurer. Idag får ekonomiförvaltningen en viktig roll för att företaget ska fungera framgångsrikt. Trots att ekonomisk förvaltning är en hjälpprocess i ett företag, kräver den särskild uppmärksamhet, eftersom felaktiga ekonomiska och administrativa beslut kan leda till stora förluster.

Ekonomistyrningen syftar till att ge företaget ekonomiska resurser i erforderliga mängder, vid rätt tidpunkt och på rätt plats för att få maximal effekt av användningen genom optimal fördelning.

Det är kanske svårt att avgöra nivån på "maximal effektivitet i resursanvändningen", men i alla fall,

CFO bör alltid veta:

  • hur många ekonomiska resurser finns tillgängliga?
  • Var kommer pengarna ifrån och hur mycket?
  • var ska man investera mer effektivt och varför?
  • Och vid vilken tidpunkt ska detta göras?
  • hur mycket behövs för att säkerställa företagets normala drift?

För att få rimliga svar på dessa frågor är det nödvändigt att ha, analysera och veta hur man analyserar ett tillräckligt stort antal resultatindikatorer. Dessutom täcker FI ett stort antal områden: kassaflödesanalys (rörelser Pengar), analys av tillgångar och skulder, lönsamhetsanalys, marginalanalys, lönsamhetsanalys, sortimentsanalys.

Kunskap

Därför är nyckelfaktorn för effektiviteten av den ekonomiska förvaltningsprocessen kunskapen om:

  • Personlig kunskap inom ämnesområdet (man kan säga teoretisk och metodisk), inklusive erfarenhet, intuition av en finansiär/ekonomichef
  • Allmän (företags) kunskap eller systematiserad information om fakta om finansiella transaktioner i företaget (d.v.s. information om företagets tidigare, nuvarande och framtida tillstånd, presenterad i olika indikatorer och mätningar)

Om den första ligger i handlingsfältet för denna finansiär (eller HR-direktören som anställde denna anställd), bör den andra målmedvetet skapas på företaget genom gemensamma ansträngningar från finans- och informationstjänstarbetare.

Vad är nu

Men nu är en paradoxal situation typisk för företag: det finns information, det finns mycket av det, för mycket. Men det är i ett kaotiskt tillstånd: ostrukturerat, inkonsekvent, fragmenterat, inte alltid tillförlitligt och ofta felaktigt, det är nästan omöjligt att hitta och ta emot det. En lång och ofta värdelös generation av berg av finansiella rapporter produceras, vilket är obekvämt för finansiell analys, svårt att uppfatta, eftersom det inte skapas för intern förvaltning utan för att överlämnas till externa tillsynsmyndigheter.

Enligt en undersökning gjord av företaget Reuters bland 1 300 internationella chefer säger 38 % av de tillfrågade att de spenderar mycket tid på att försöka hitta den information de behöver. Det visar sig att en högt kvalificerad specialist spenderar högt betald tid inte på dataanalys, utan på att samla in, söka och systematisera den information som är nödvändig för denna analys. Samtidigt upplever chefer en stor belastning av data, ofta irrelevant för fallet, vilket återigen minskar deras effektivitet. Orsaken till denna situation: ett överskott av information och brist på kunskap.

Vad ska man göra

Information måste omvandlas till kunskap. För moderna företag är värdefull information, dess systematiska förvärv, syntes, utbyte, användning en slags valuta, men för att ta emot den är det nödvändigt att hantera information, som alla affärsprocesser.

Nyckeln till informationshantering är att leverera rätt information i rätt form till rätt personer inom organisationen vid rätt tidpunkt. Syftet med denna förvaltning är att hjälpa människor att arbeta bättre tillsammans med hjälp av ökande mängder information.

Informationsteknik fungerar i det här fallet som ett sätt genom vilket det skulle vara möjligt att systematisera information i ett företag, ge vissa användare tillgång till den och ge dem verktygen att omvandla denna information till kunskap.

Grundläggande begrepp för OLAP-teknik

OLAP-teknik (från engelska. Online analytisk Bearbetning är inte namnet på en specifik produkt, utan på hela tekniken för operationsanalys av flerdimensionell data som ackumuleras i lagringen. För att förstå essensen av OLAP är det nödvändigt att överväga den traditionella processen att erhålla information för beslutsfattande.

Traditionellt beslutsstödssystem

Här kan det naturligtvis också finnas många alternativ: fullständigt informationskaos eller den mest typiska situationen, när företaget har operativa system som registrerar fakta om vissa operationer och lagrar dem i databaser. För att extrahera data från databaser för analytiska ändamål byggdes ett system med frågor för vissa dataprover.

Men denna metod för beslutsstöd saknar flexibilitet och har många nackdelar:

  • använder en försumbar mängd data som kan vara användbar för beslutsfattande
  • ibland skapas komplexa flersidiga rapporter, varav 1-2 rader faktiskt används (resten är för säkerhets skull) - informationsöverbelastning
  • långsam reaktion av processen på förändringar: om en ny representation av data behövs, måste begäran formellt beskrivas och kodas av programmeraren, först därefter exekveras. Väntetid: timmar, dagar. Och kanske behövs ett beslut nu, omedelbart. Men efter att ha fått ny information, kommer en ny fråga att uppstå (förtydligande)

Om frågerapporter presenteras i ett endimensionellt format är affärsproblem vanligtvis flerdimensionella och mångfacetterade. Om du vill få en tydlig bild av företagets verksamhet måste du analysera datan i olika avsnitt.

Många företag skapar fantastiska relationsdatabaser genom att perfekt sortera genom bergen av oanvänd information, som i sig inte ger ett snabbt eller adekvat svar på marknadshändelser. JA – relationsdatabaser var, är och kommer att vara den mest lämpliga tekniken för att lagra företagsdata. Det handlar inte om ny teknologi DB, utan snarare om verktyg analyssystem som kompletterar funktionerna i befintliga DBMS och är tillräckligt flexibla för att tillhandahålla och automatisera olika typer intellektuell analys, inneboende i OLAP.

Förstå OLAP

Vad ger OLAP?

  • Avancerade verktyg för åtkomst till lagringsdata
  • Dynamisk interaktiv datamanipulation (rotation, konsolidering eller drill down)
  • Tydlig visuell visning av data
  • Hastighet - analys utförs i verkligt läge tid
  • Multidimensionell datapresentation - simultan analys av ett antal indikatorer över flera dimensioner

För att få effekten av att använda OLAP-tekniker är det nödvändigt: ​​1) att förstå kärnan i själva tekniken och deras kapacitet; 2) definiera tydligt vilka processer som behöver analyseras, vilka indikatorer de kommer att kännetecknas av och i vilka dimensioner det är lämpligt att se dem, d.v.s. skapa en analysmodell.

De grundläggande koncepten som OLAP-tekniker fungerar på är följande:

Flerdimensionalitet

För att förstå dataens multidimensionalitet bör man först presentera en tabell som visar till exempel hur företagskostnader presterar efter ekonomiska element och affärsenheter.

Dessa data presenteras i två dimensioner:

  • artikel
  • affärsenhet

Den här tabellen är inte informativ, eftersom den visar försäljningen för en viss tidsperiod. För olika tidsperioder måste analytiker jämföra flera tabeller (för varje tidsperiod):

Figuren visar den tredje dimensionen, Tid, utöver de två första. (Artikel, affärsenhet)

Ett annat sätt att visa flerdimensionell data är att representera den i form av en kub:

OLAP-kuber tillåter analytiker att få data på olika segment för att svara på frågor som företaget ställer:

  • Vilka kostnader är kritiska i vilka affärsenheter?
  • Hur förändras affärsenhetskostnaderna över tiden?
  • Hur förändras kostnadsposterna över tiden?

Svar på sådana frågor är nödvändiga för att fatta ledningsbeslut: att minska vissa kostnadsposter, påverka deras struktur, identifiera orsakerna till kostnadsförändringar över tid, avvikelser från planen och deras eliminering - optimering av deras struktur.

I det här exemplet beaktas endast 3 dimensioner. Det är svårt att representera mer än 3 dimensioner, men det fungerar på samma sätt som i fallet med 3 dimensioner.

Vanligtvis tillåter OLAP-applikationer dig att ta emot data om 3 eller fler dimensioner, till exempel kan du lägga till ytterligare en dimension - Plan-Act, Kostnadskategori: direkt, indirekt, efter order, per månader. Ytterligare dimensioner gör att du kan få fler analytiska segment och ge svar på frågor med flera villkor.

Hierarki

OLAP tillåter också analytiker att organisera varje dimension i en hierarki av grupper och undergrupper och totaler som återspeglar måtten över hela organisationen - det mest logiska sättet att analysera ett företag.

Till exempel är det tillrådligt att gruppera kostnader hierarkiskt:

OLAP tillåter analytiker att få data om ett övergripande sammanfattande mått (faktiskt högsta nivån), och borra sedan ner till den lägsta och efterföljande nivån och upptäck på så sätt den exakta orsaken till förändringen i indikatorn.

Genom att tillåta analytiker att använda flera dimensioner i en datakub, med möjlighet till hierarkiskt uppbyggda dimensioner, låter OLAP dig få en bild av verksamheten som inte är komprimerad av informationslagrets struktur.

Ändra analysriktningar i en kub (datarotation)

Som regel arbetar de med koncept: dimensioner specificerade i kolumner, rader (det kan finnas flera), resten bildar skivor, innehållet i tabellformens dimensioner (försäljning, kostnader, kontanter)

Som regel låter OLAP dig ändra orienteringen på kubens dimensioner och därigenom presentera data i olika vyer.

Visningen av kubdata beror på:

  • dimensionsorientering: vilka dimensioner som anges i rader, kolumner, skivor;
  • grupper av indikatorer markerade i rader, kolumner, skivor.
  • Att ändra mått ligger inom ramen för användarens agerande.

Således låter OLAP dig utföra olika typer av analyser och förstå deras samband med deras resultat.

  • Analys av avvikelser - analys av genomförandet av planen, som kompletteras med en faktoranalys av orsakerna till avvikelser genom att detaljera indikatorerna.
  • Beroendeanalys: OLAP låter dig identifiera olika beroenden mellan olika förändringar, till exempel när öl togs bort från sortimentet visade sig mörtförsäljningen minska under de första två månaderna.
  • Kartläggning ( jämförande analys). Jämförelse av resultaten av att ändra indikatorn över tid, för en given grupp av varor, i olika regioner, etc.
  • Analys av dynamiken gör att du kan identifiera vissa trender i förändringen av indikatorer över tiden.

Effektivitet: vi kan säga att OLAP är baserad på psykologins lagar: förmågan att bearbeta informationsförfrågningar i "realtid" - i takt med processen för analytisk förståelse av data av användaren.

Om du kan läsa cirka 200 poster per sekund från en relationsdatabas och skriva 20, så kan en bra OLAP-server, med hjälp av beräknade rader och kolumner, konsolidera 20 000-30 000 celler (motsvarande en post i en relationsdatabas) per sekund.

synlighet: Det bör betonas att OLAP tillhandahåller avancerade verktyg grafisk representation data till slutanvändaren. Den mänskliga hjärnan kan uppfatta och analysera information som presenteras i form av geometriska bilder, i en volym som är flera storleksordningar större än information som presenteras i alfanumerisk form. Exempel: Anta att du behöver hitta ett bekant ansikte på ett av hundra fotografier. Jag tror att denna process inte tar dig mer än en minut. Föreställ dig nu att du istället för fotografier kommer att erbjudas hundra verbala beskrivningar av samma personer. Jag tror inte att du kommer att kunna lösa det föreslagna problemet alls.

Enkelhet : Huvud funktion av dessa tekniker är att de är fokuserade på användningen inte av en informationsteknikspecialist, inte av en expertstatistiker, utan av en professionell inom det tillämpade området - en chef för en kreditavdelning, en chef för en budgetavdelning, och slutligen, en direktör. De är avsedda för analytikern att kommunicera med problemet, inte med datorn..

Trots de stora möjligheterna med OLAP (dessutom är idén relativt gammal - 60-talet) används den praktiskt taget aldrig i våra företag. Varför?

  • information saknas eller möjligheterna är otydliga
  • vana att tänka i två dimensioner
  • prisbarriär
  • överdriven tillverkningsbarhet av artiklar ägnade åt OLAP: okända termer skrämmer bort - OLAP, "utgrävning och skivor av data", "ad hoc-frågor", "identifiering av signifikanta korrelationer"

Vårt tillvägagångssätt och västerländska till tillämpningen av OLAP

Dessutom har vi också en specifik förståelse för applikationsverktyget för OLAP även när vi förstår dess tekniska kapacitet.

Våra och ryska författare av olika material som ägnas åt OLAP uttrycker följande åsikt i förhållande till användbarheten av OLAP: majoriteten uppfattar OLAP som ett verktyg som låter dig expandera och kollapsa data enkelt och bekvämt, genom att utföra manipulationer som du tänker på en analytiker i analysprocessen. Ju fler "skivor" och "skivor" av data analytikern ser, desto fler idéer har han, som i sin tur kräver fler och fler "skivor" för verifiering. Det är inte rätt.

I hjärtat av den västerländska förståelsen av användbarheten av OLAP är en metodologisk analysmodell som måste läggas fast vid utformningen av OLAP-lösningar. En analytiker bör inte leka med en OLAP-kub och planlöst ändra dess dimensioner och detaljnivåer, dataorientering, grafisk visning av data (och det krävs verkligen!), utan tydligt förstå vilka vyer han behöver, i vilken sekvens och varför (såklart) , element "upptäckter" kan finnas där, men detta är inte en grundläggande del av användbarheten av OLAP).

Applikationsanvändning av OLAP

  • Budget
  • Flöde av medel

Ett av de mest bördiga användningsområdena för OLAP-teknologier. Ingen för ingenting modernt system budgetering anses inte vara komplett utan närvaron av en OLAP-verktygslåda för budgetanalys i dess sammansättning. De flesta budgetrapporter byggs enkelt utifrån OLAP-system. Samtidigt svarar rapporterna på ett mycket brett spektrum av frågor: analys av strukturen för utgifter och inkomster, jämförelse av utgifter för vissa poster i olika avdelningar, analys av dynamiken och trenderna för utgifterna för vissa poster, analys av kostnad och vinst.

OLAP låter dig analysera in- och utflöden av medel i samband med affärsverksamhet, motparter, valutor och tid för att optimera deras flöden.

  • Ekonomi- och förvaltningsrapportering (med analyser som ledningen behöver)
  • Marknadsföring
  • Balanced Scorecard
  • Lönsamhetsanalys

Om du har rätt data kan du hitta en annan tillämpning av OLAP-teknik.

OLAP företagsprofil

I det här avsnittet kommer vi att prata om OLAP som en mjukvarulösning.

Allmänna krav för OLAP-produkter

Det finns många sätt att implementera OLAP-applikationer, ingen speciell teknik bör vara obligatorisk, eller ens rekommenderas. Under olika förutsättningar och omständigheter kan ett tillvägagångssätt vara att föredra framför ett annat. Implementeringstekniken inkluderar många olika egenutvecklade idéer som leverantörer är så stolta över: klient-server-arkitekturer, tidsserieanalys, objektorientering, datalagringsoptimering, parallella processer, etc. Men dessa teknologier kan inte vara en del av definitionen av OLAP.

Det finns egenskaper som måste observeras i alla OLAP-produkter (om det är en OLAP-produkt), vilket är teknikens ideal. Det här är 5 nyckeldefinitioner som kännetecknar OLAP (det så kallade FASMI-testet): Snabbanalys av delad multidimensionell information.

  • Snabbt(SNABB) - betyder att systemet ska ge majoriteten av svaren till användarna inom cirka fem sekunder. Även om systemet varnar för att processen kommer att ta betydligt längre tid, kan användarna bli distraherade och tappa förståndet, och kvaliteten på analysen blir lidande. Denna hastighet är inte lätt att uppnå med stora datamängder, särskilt om speciella on-the-fly-beräkningar krävs. Leverantörer använder en mängd olika metoder för att uppnå detta mål, inklusive specialiserade former av datalagring, omfattande förberäkningar eller hårdvarukrav. Det finns dock för närvarande inga helt optimerade lösningar. Vid första anblicken kan det tyckas förvånande att när man tar emot en rapport på en minut, vilket för inte så länge sedan tog dagar, blir användaren mycket snabbt uttråkad medan han väntar, och projektet visar sig vara mycket mindre framgångsrikt än i fallet med en omedelbar respons, även till priset av mindre detaljerad analys.
  • delad innebär att systemet gör det möjligt att uppfylla alla dataskyddskrav och implementera distribuerad och samtidig åtkomst till data för olika nivåer av användare. Systemet måste kunna hantera flera dataändringar på ett snabbt och säkert sätt. Detta är en stor svaghet hos många OLAP-produkter, som tenderar att anta att alla OLAP-applikationer kräver skrivskyddad och ger förenklat skydd.
  • Flerdimensionellär ett nyckelkrav. Om det var nödvändigt att definiera OLAP i ett ord, skulle det väljas. Systemet bör tillhandahålla en flerdimensionell konceptuell representation av data, inklusive fullt stöd för hierarkier och flera hierarkier, eftersom detta bestämmer det mest logiska sättet att analysera ett företag. Det finns inget minsta antal dimensioner som måste bearbetas, eftersom detta också beror på applikationen, och de flesta OLAP-produkter har tillräckligt med dimensioner för de marknader de riktar sig till. Återigen, vi anger inte vilken underliggande databasteknologi som ska användas om användaren ska få en verkligt multidimensionell konceptuell representation av informationen. Denna funktion är hjärtat i OLAP
  • Information. Nödvändig information ska inhämtas där den behövs, oavsett volym och plats. Mycket beror dock på applikationen. Kraften hos olika produkter mäts i termer av hur mycket input de klarar av, inte hur många gigabyte de kan lagra. Kraften i produkterna varierar stort – de största OLAP-produkterna klarar minst tusen gånger mer data än de minsta. Det finns många faktorer att ta hänsyn till i detta avseende, inklusive dataduplicering, erforderligt RAM-minne, diskutrymmesanvändning, prestanda, integration med informationsbutiker, etc.
  • Analys innebär att systemet kan hantera vilken logisk och statistisk analys som helst som är specifik för en given applikation och säkerställer att den hålls i en form som är tillgänglig för slutanvändaren. Användaren ska kunna definiera nya specialberäkningar som en del av analysen utan behov av programmering. Det vill säga att all nödvändig analysfunktionalitet måste tillhandahållas på ett intuitivt sätt för slutanvändare. Analysverktygen kan innefatta vissa procedurer såsom tidsserieanalys, kostnadsfördelning, valutaöverföringar, målinriktning, etc. Sådana möjligheter varierar kraftigt mellan produkter, beroende på målinriktning.

Med andra ord är dessa 5 nyckeldefinitioner de mål som OLAP-produkter är designade för att uppnå.

Tekniska aspekter av OLAP

OLAP-systemet innehåller vissa komponenter. Det finns olika system för deras arbete, som en viss produkt kan implementera.

Komponenter i OLAP-system (vad består ett OLAP-system av?)

Vanligtvis innehåller ett OLAP-system följande komponenter:

  • Datakälla
    Källa från vilken data tas för analys (datalager, databas med operativa redovisningssystem, en uppsättning tabeller, kombinationer av ovanstående).
  • OLAP-server
    Data från källan överförs eller kopieras till OLAP-servern, där den systematiseras och förbereds för snabbare generering av svar på frågor.
  • OLAP-klient
    Användargränssnitt till OLAP-servern där användaren arbetar

Observera att inte alla komponenter krävs. Det finns stationära OLAP-system som låter dig analysera data som lagras direkt på användarens dator och som inte kräver en OLAP-server.

Det som är obligatoriskt är dock datakällan: tillgången på data är en viktig fråga. Om de är, i någon form, som en Excel-tabell, i databasen för ett redovisningssystem, i form av strukturerade rapporter från filialer, kommer en IT-specialist att kunna integrera med OLAP-systemet direkt eller med en mellanliggande transformation. OLAP-system har specialverktyg för detta. Om denna data inte är tillgänglig, eller om den saknar fullständighet och kvalitet, hjälper OLAP inte. Det vill säga, OLAP är bara ett tillägg över data, och om de inte finns där blir de en värdelös sak.

De flesta data för OLAP-applikationer har sitt ursprung i andra system. Men i vissa applikationer (till exempel för planering eller budgetering) kan data skapas direkt i OLAP-applikationer. När uppgifterna kommer från andra applikationer är det vanligtvis nödvändigt att uppgifterna lagras i en separat, duplicerad form för OLAP-applikationen. Därför är det lämpligt att skapa datalager.

Det bör noteras att termen "OLAP" är oupplösligt kopplad till termen "data warehouse" (Data Warehouse). Ett datalager är en domänspecifik, tidsbunden, oföränderlig samling av data för att stödja ledningens beslutsfattande. Data i lagring kommer från operativa system(OLTP-system), som är designade för att automatisera affärsprocesser, kan lagringen fyllas på från externa källor, såsom statistiska rapporter.

Trots det faktum att de innehåller uppenbart överflödig information som redan finns i databaserna eller filerna i operativsystem, är datalagring nödvändiga eftersom:

  • fragmentering av data, deras lagring i olika DBMS-format;
  • förbättrad datahämtning
  • om företaget lagrar all data på den centrala databasservern (vilket är extremt sällsynt) kommer analytikern förmodligen inte att förstå deras komplexa, ibland förvirrande strukturer
  • komplexa analytiska frågor för operativ information saktar ner företagets nuvarande arbete, blockerar tabeller under lång tid och lägger beslag på serverresurser
  • förmågan att rensa och stämma av data
  • det är omöjligt eller mycket svårt att analysera data från operativa system direkt;

Förvarets uppgift är att tillhandahålla "råvaran" för analys på ett ställe och i en enkel, begriplig struktur. Det vill säga begreppet Data Warehouse är inte ett begrepp för dataanalys, snarare är det ett koncept för att förbereda data för analys. Det innebär implementering av en enda integrerad datakälla.

OLAP-produkter: arkitekturer

När du använder OLAP-produkter är 2 frågor viktiga: hur och var ha kvar och hantera data. Beroende på hur dessa två processer implementeras, urskiljs OLAP-arkitekturer. Det finns tre sätt att lagra data för OLAP och tre sätt att behandla dessa data. Många tillverkare erbjuder flera alternativ, vissa försöker bevisa att deras tillvägagångssätt är det enskilt mest försiktiga. Detta är naturligtvis absurt. Men mycket få produkter kan fungera i mer än ett läge kvalitativt.

OLAP-lagringsalternativ

Lagring innebär i detta sammanhang att hålla data i ett ständigt uppdaterat tillstånd.

  • Relationsdatabaser: Detta är ett typiskt val om ditt företag lagrar referenser i en RDB. I de flesta fall bör data lagras i en denormaliserad struktur (stjärnschema är det lämpligaste). En normaliserad databas är oacceptabel på grund av mycket dålig frågeprestanda vid generering av aggregerade värden för OLAP (ofta lagras sammanfattningsdata i aggregerade tabeller).
  • Databasfiler på klientdator(kiosker eller datamarts): Denna data kan fördistribueras eller skapas på begäran på klientdatorer.

Flerdimensionella databaser: Förutsätter att data lagras i en flerdimensionell databas på servern. Det kan inkludera data som extraherats och sammanfattats från andra system och relationsdatabaser, slutanvändarfiler etc. I de flesta fall lagras flerdimensionella databaser på disk, men vissa produkter tillåter även användning av RAM, vilket beräknar de mest använda data i farten . ". Väldigt få produkter baserade på flerdimensionella databaser tillåter redigering av flera data, många produkter tillåter en enda modifiering men multipel läsning av data, medan andra är begränsade till endast läsning.

Dessa tre lagringsplatser har olika möjligheter lagringsvolymer, och de är ordnade i minskande kapacitetsordning. De har också olika frågeprestandaegenskaper: relationsdatabaser är mycket långsammare än de två sista alternativen.

Alternativ för OLAP-databehandling

Det finns 3 av samma databehandlingsalternativ:

  • Använda SQL: Det här alternativet används naturligtvis när du lagrar data i RDB. SQL tillåter dock inte att flerdimensionella beräkningar utförs i en enda fråga, så att skriva komplexa SQL-frågor krävs för att inte uppnå något mer än den vanliga flerdimensionella funktionaliteten. Detta hindrar dock inte utvecklare från att försöka. I de flesta fall utför de ett begränsat antal motsvarande SQL-beräkningar, med resultat som kan erhållas från flerdimensionell databehandling eller från en klientmaskin. Det är också möjligt att använda random access minne, som kan lagra data med mer än en begäran: detta dramatiskt förbättrade svar.
  • Flerdimensionell bearbetning på klientsidan: OLAP-produkten på klientsidan gör beräkningarna själv, men denna bearbetning är endast tillgänglig om användarna har relativt kraftfulla datorer.

Server multidimensionell bearbetning: Detta är en populär plats för att utföra flerdimensionella beräkningar i klient-server OLAP-applikationer och används i många produkter. Prestanda är vanligtvis hög eftersom de flesta beräkningarna redan är gjorda. Detta kräver dock mycket diskutrymme.

Matris av OLAP-arkitekturer

Följaktligen, genom att kombinera lagrings- / bearbetningsalternativ, kan du få en matris av arkitekturer för OLAP-system. Följaktligen kan det teoretiskt finnas 9 kombinationer av dessa metoder. Men eftersom 3 av dem saknar sunt förnuft, finns det i verkligheten bara 6 alternativ för att lagra och bearbeta OLAP-data.

Flerdimensionella förvaringsmöjligheter
data

alternativ
flerdimensionell
databehandling

Relationsdatabas

Flerdimensionell databas på serversidan

Klientdator

Cartesis magnitud

Flerdimensionell serverbearbetning

Crystal Holos (ROLAP-läge)

IBM DB2 OLAP Server

CA EUREKA: Strategi

Informix MetaCube

Speedware Media/MR

Microsoft Analysis Services

Oracle Express (ROLAP-läge)

Pilotanalysserver

Applicera iTM1

Kristall Holos

Comshare-beslut

Hyperion Essbase

Oracle Express

Speedware Media/M

Microsoft Analysis Services

PowerPlay Enterprise Server

Pilotanalysserver

Applicera iTM1

Flerdimensionell bearbetning på klientdatorn

Oracle Discoverer

Informix MetaCube

Dimensionell insikt

Hyperion Enterprise

Cognos PowerPlay

Personlig Express

iTM1 Perspektiv

Eftersom det är lagring som avgör bearbetningen är det vanligt att gruppera efter lagringsalternativ, det vill säga:

  • ROLAP-produkter inom sektorerna 1, 2, 3
  • Desktop OLAP - i sektor 6

MOLAP-produkter - i sektorerna 4 och 5

HOLAP-produkter (som tillåter både flerdimensionella och relationella datalagringsalternativ) - i 2 och 4 (markerade i kursiv stil)

Kategorier av OLAP-produkter

Det finns mer än 40 OLAP-leverantörer, även om alla av dem inte kan betraktas som konkurrenter, eftersom de har mycket olika kapacitet och faktiskt arbetar inom olika marknadssegment. De kan grupperas i fyra grundläggande kategorier, vars skillnader är baserade på begreppen: komplex funktionalitet - enkel funktionalitet, prestanda - diskutrymme. Det är bekvämt att rita kategorierna i form av en kvadrat eftersom det tydligt visar relationerna mellan dem. Det utmärkande särdraget för var och en av kategorierna presenteras på sin sida, och likheter med andra - på intilliggande sidor är därför kategorierna på motsatta sidor fundamentalt olika.

Egenheter

Fördelar

Brister

Representanter

Tillämpade OLAP

Kompletta applikationer med rik funktionalitet. Nästan alla kräver en flerdimensionell databas, även om vissa fungerar med en relationsdatabas också. Många av denna kategori av applikationer är specialiserade, såsom försäljning, tillverkning, bank, budgetering, finansiell konsolidering, försäljningsanalys

Förmåga att integrera med olika applikationer

Hög funktionalitet

Hög nivå av flexibilitet och skalbarhet

Applikationskomplexitet (behov av användarutbildning)

Högt pris

Hyperion Solutions

Kristallbeslut

Informationsbyggare

Produkten är baserad på en icke-relationell datastruktur som ger flerdimensionell lagring, bearbetning och presentation av data. Data i analysprocessen väljs uteslutande från en flerdimensionell struktur. Trots den höga graden av öppenhet övertalar leverantörer köpare att köpa sina egna verktyg

Hög prestanda (snabb beräkning av sammanfattande indikatorer och olika multidimensionella transformationer för någon av dimensionerna). Den genomsnittliga svarstiden på en ad hoc analytisk fråga när du använder en flerdimensionell databas är vanligtvis 1-2 storleksordningar mindre än i fallet med en RDB

Hög grad av öppenhet: ett stort antal produkter med vilka integration är möjlig

Klara enkelt uppgifterna att inkludera olika inbyggda funktioner i informationsmodellen, utföra specialiserad analys av användaren, etc.

Behovet av stort diskutrymme för att lagra data (på grund av redundansen hos data som lagras). Detta är en extremt ineffektiv användning av minnet - på grund av denormalisering och pre-exekverad aggregering motsvarar mängden data i en flerdimensionell databas 2,5-100 gånger mindre än mängden ursprungliga detaljerade data. MOLAP tillåter i alla fall inte att du arbetar med stora databaser. Den verkliga gränsen är en databas med en volym på 10-25 gigabyte

Potentiell databasexplosion – plötslig, dramatisk, oproportionerlig ökning av databasstorlek

Brist på flexibilitet när datastrukturer behöver modifieras. Varje förändring i dimensionsstrukturen kräver nästan alltid en fullständig omstrukturering av hyperkuben.

För flerdimensionella databaser finns det för närvarande inga enhetliga standarder för gränssnittet, språk för att beskriva och manipulera data

Hyperion (Essbase)

DOLAP (OLAP för dator)

OLAP-produkter på klientsidan som är relativt enkla att implementera och kräver låg kostnad per plats

Vi talar om sådan analytisk bearbetning, där hyperkuber är små, deras dimension är liten, behoven är blygsamma och för sådan analytisk bearbetning räcker det med en persondator på skrivbordet.

Målet för tillverkare på denna marknad är att automatisera hundratals och tusentals jobb, men användare bör göra en ganska enkel analys. Köpare är ofta motiverade att köpa fler jobb än nödvändigt

Bra integration med databaser: flerdimensionell, relationell

Förmåga att göra komplexa inköp, vilket minskar kostnaderna för implementeringsprojekt

Användarvänlighet för applikationer

Mycket begränsad funktionalitet (inte jämförbar i detta avseende med specialiserade produkter)

Mycket begränsad effekt (små datavolymer, få mätningar)

Cognos (PowerPlay)

affärsobjekt

Kristallbeslut

Detta är den minsta sektorn på marknaden.

Detaljerad data förblir där den ursprungligen var - i en relationsdatabas; vissa aggregat lagras i samma databas i speciellt skapade tjänstetabeller

Kan hantera mycket stora mängder data (ekonomisk lagring)

Sörja för ett driftläge för flera användare, inklusive i redigeringsläge, och inte bara läsning

Högre nivå av dataskydd och goda möjligheter till differentiering av åtkomsträttigheter

Det är möjligt att ofta göra ändringar i strukturen för mätningar (kräver ingen fysisk omorganisation av databasen)

Låg prestanda, avsevärt förlust i svarshastighet på flerdimensionella (svar på komplexa frågor mäts i minuter eller till och med timmar snarare än sekunder). Dessa är mer bekväma rapportbyggare än interaktiva analysverktyg.

Produkternas komplexitet. Kräver betydande underhållskostnader av IT-specialister. För att uppnå prestanda jämförbar med MOLAP kräver relationssystem noggrann design av databasschemat och justering av index, det vill säga mycket ansträngning från DBA:s sida

Dyrt att genomföra

Begränsningarna för SQL förblir en realitet, vilket förhindrar att många inbyggda funktioner implementeras i RDBMS som enkelt tillhandahålls i system baserade på flerdimensionell datarepresentation.

Informationsfördel

Informix (MetaCube)

Det bör noteras att kunder med hybridprodukter som tillåter val av ROLAP- och MOLAP-läge, såsom Microsoft Analysis Services, OracleExpress, Crystal Holos, IBM DB2 OLAPServer, nästan alltid väljer MOLAP-läge.

Var och en av de presenterade kategorierna har sina styrkor och svagheter, det finns inget optimalt val. Valet påverkar 3 viktiga aspekter: 1) prestation; 2) diskutrymme för datalagring; 3) funktioner, funktionalitet och särskilt skalbarheten hos en OLAP-lösning. Samtidigt är det nödvändigt att ta hänsyn till mängden data som behandlas, teknikens kraft, användarnas behov och söka en kompromiss mellan hastighet och redundans av diskutrymme som upptas av databasen, enkel och multifunktionell.

Klassificering av datalager i enlighet med volymen av måldatabasen

Nackdelar med OLAP

Som all teknik har OLAP också sina nackdelar: höga krav på hårdvara, utbildning och kunskap om administrativ personal och slutanvändare, höga kostnader för genomförandet av implementeringsprojektet (både monetära och tillfälliga, intellektuella).

Att välja en OLAP-produkt

Att välja rätt OLAP-produkt är svårt, men mycket viktigt om du vill att projektet inte ska misslyckas.

Som du kan se ligger skillnaderna mellan produkterna inom många områden: funktionella, arkitektoniska, tekniska. Vissa produkter har mycket begränsade inställningar. Vissa är designade för specialiserade ämnesområden: marknadsföring, försäljning, ekonomi. Det finns produkter för allmänna ändamål, som inte har applikationsanvändning, som borde vara tillräckligt flexibla. Som regel är sådana produkter billigare än specialiserade, men det finns fler implementeringskostnader. Utbudet av OLAP-produkter är mycket brett – från de enklaste verktygen för att konstruera pivottabeller och diagram, som ingår i kontorsprodukter, till verktyg för att analysera data och söka efter mönster, vars kostnad är tiotusentals dollar.

Som inom alla andra områden, inom OLAP-området kan det inte finnas några entydiga rekommendationer för val av verktyg. Du kan bara fokusera på ett antal nyckelpunkter och jämföra mjukvarufunktionerna som erbjuds med organisationens behov. En sak är viktig: utan att noga tänka på hur du ska använda OLAP-verktyg riskerar du att göra dig själv en kraftig huvudvärk.

I urvalsprocessen måste två frågor beaktas:

  • bedöma företagets behov och kapacitet
  • utvärdera det aktuella marknadserbjudandet, utvecklingstrender är också viktiga

Jämför sedan allt detta och gör faktiskt ett val.

Behöver granskning

Det är omöjligt att göra ett rationellt val av en produkt utan att förstå vad den ska användas till. Många företag vill ha den "bästa produkten" utan en klar förståelse för hur den ska användas.

För att projektet ska kunna genomföras framgångsrikt måste ekonomidirektören åtminstone korrekt formulera sina önskemål och krav till chefen och specialisterna för automationstjänsten. Många problem uppstår på grund av otillräcklig beredskap och medvetenhet för att välja OLAP, IT-proffs och slutanvändare upplever kommunikationssvårigheter bara för att de manipulerar olika begrepp och termer i konversation och framför motstridiga preferenser. Det måste finnas konsekvens i syftet inom företaget.

Vissa faktorer har redan blivit uppenbara efter att ha läst översikten över OLAP-produktkategorier, nämligen:

Tekniska aspekter

  • Datakällor: företagsdatalager, OLTP-system, tabellfiler, relationsdatabaser. Möjlighet att länka OLAP-verktyg med alla DBMS som används i organisationen. Som praxis visar är integreringen av heterogena produkter i ett stabilt fungerande system en av de viktigaste frågorna, och dess lösning kan i vissa fall förknippas med stora problem. Det är nödvändigt att förstå hur lätt och pålitligt det är att integrera OLAP-verktyg med befintligt DBMS i organisationen. Det är också viktigt att utvärdera möjligheterna till integration inte bara med datakällor utan även med andra applikationer som du kan behöva exportera data till: e-post, kontorsapplikationer
  • Variabiliteten av data som räknas
  • Serverplattform: NT, Unix, AS/400, Linux - men insistera inte på att produkterna som specificeras av OLAP-specifikationen körs på tvivelaktiga eller döende plattformar som du fortfarande använder
  • Klientsidan och webbläsarstandarder
  • Utplacerbar arkitektur: det lokala nätverket och PC-modemanslutning, höghastighetsklient/server, intranät, extranät, Internet
  • Internationella funktioner: stöd för flera valutor, flerspråkig operation, datadelning, lokalisering, licensiering, Windows-uppdateringar

Volymer av indatainformation som är tillgänglig och som kommer att dyka upp i framtiden

Användare

  • Tillämpningsområde: försäljnings-/marknadsanalys, budgetering/planering, analys av resultatindikatorer, analys av redovisningsrapporter, kvalitativ analys, finansiell ställning, bildande av analytiskt material (rapporter)
  • Antal användare och deras plats, krav på åtskillnad av åtkomsträttigheter till data och funktioner, sekretess (sekretess) för information
  • Typ av användare: företagsledning, ekonomi, marknadsföring, HR, försäljning, tillverkning, etc.
  • Användarupplevelse. Användarkompetensnivå. Överväg att ge utbildning. Det är mycket viktigt att OLAP-klientapplikationen är utformad på ett sådant sätt att användarna känner sig trygga och kan använda den effektivt.

Nyckelfunktioner: behov av dataåterskrivning, distribuerad beräkning, komplexa valutaomvandlingar, rapportutskriftsbehov, kalkylbladsgränssnitt, applikationslogikkomplexitet, nödvändig dimensionalitet, analystyper: statistisk, målsökning, vad-om-analys

Genomförande

  • Vem ska implementera och driva: externa konsulter, intern IT eller slutanvändare
  • Budget: programvara, hårdvara, tjänster, dataöverföring. Kom ihåg att betalning för licenser för en OLAP-produkt bara är en liten del av den totala projektkostnaden. Implementerings- och hårdvarukostnader kan vara mer än licensavgifter, och långsiktiga support-, underhålls- och administrationskostnader är nästan säkert mycket mer. Och om du fattar fel beslut att köpa fel produkt bara för att den är billigare, kan du sluta med en högre total projektkostnad på grund av högre underhålls-, administrations- och/eller hårdvarukostnader, samtidigt som du sannolikt får en lägre nivå av affärsfördelar. När du uppskattar totala kostnader, se till att ställa följande frågor: Hur stort är valet av källor för implementering, utbildning och support? Är den potentiella allmänna fonden (anställda, entreprenörer, konsulter) upp eller ner? I vilken utsträckning kan din industriella yrkeserfarenhet användas?

Trots det faktum att kostnaden för analytiska system även idag är ganska hög, och metoderna och teknikerna för att implementera sådana system är fortfarande i sin linda, även idag, överstiger den ekonomiska effekten som de tillhandahåller avsevärt effekten av traditionella operativa system.

Effekten av korrekt organisation, strategisk och operativ planering av affärsutveckling är svår att uppskatta i förväg i siffror, men det är uppenbart att det kan överstiga kostnaderna för att implementera sådana system med tiotals och till och med hundratals gånger. Man ska dock inte heller ta fel. Effekten tillhandahålls inte av systemet i sig, utan av människorna som arbetar med det. Därför är deklarationer av typen inte helt korrekta: "Systemet med Data Warehouses och OLAP-teknologier kommer att hjälpa chefen att fatta rätt beslut." Moderna analytiska system är inga artificiella intelligenssystem och de kan varken hjälpa eller hindra beslutsfattande. Deras mål är att ge chefen all information som behövs för att fatta ett beslut på ett bekvämt sätt i tid. Och vilken information som kommer att begäras och vilket beslut som kommer att fattas på grundval av den beror bara på den specifika person som använder den.

Allt som återstår att säga är att dessa system kan hjälpa till att lösa många affärsproblem och kan ha långtgående positiva effekter. Det återstår bara att vänta vem som blir den första att inse fördelarna med detta tillvägagångssätt och kommer att ligga före de andra.

Konceptet med OLAP-teknik formulerades av Edgar Codd 1993.

Denna teknik bygger på konstruktionen av flerdimensionella datamängder - de så kallade OLAP-kuberna (inte nödvändigtvis tredimensionella, som man kan dra slutsatsen från definitionen). Syftet med att använda OLAP-teknik är att analysera data och presentera denna analys i en form som är bekväm för ledningspersonalen att uppfatta och fatta beslut baserat på dem.

Grundläggande krav för applikationer för multivariat analys:

  • - förse användaren med resultaten av analysen inom rimlig tid (högst 5 s.);
  • - Fleranvändaråtkomst till data;
  • - flerdimensionell representation av data;
  • - Möjligheten att komma åt all information, oavsett lagringsplats och volym.

OLAP-systemverktyg ger möjlighet att sortera och välja data enligt specificerade förhållanden. Olika kvalitativa och kvantitativa villkor kan ställas.

Den huvudsakliga datamodellen som används i många verktyg för att skapa och underhålla databaser - DBMS, är relationsmodellen. Data i den presenteras i form av en uppsättning tvådimensionella tabeller-relationer kopplade av nyckelfält. För att eliminera dubbelarbete, inkonsekvens och minska arbetskostnaderna för att underhålla databaser, används en formell apparat för normalisering av enhetstabeller. Användningen är dock förknippad med ytterligare tid som läggs på att generera svar på frågor till databaser, även om minnesresurser sparas.

En multidimensionell datamodell representerar objektet som studeras i form av en flerdimensionell kub, oftare används en tredimensionell modell. Längs kubens axlar eller ytor plottas mått eller attributattribut. Basdetaljerna är fyllningen av kubcellerna. En flerdimensionell kub kan representeras av en kombination av tredimensionella kuber för att underlätta uppfattning och presentation vid generering av rapporterings- och analytiska dokument och multimediapresentationer baserade på material från analytiskt arbete i ett beslutsstödssystem.

Inom ramen för OLAP-teknologier, baserat på det faktum att en multidimensionell representation av data kan organiseras både med hjälp av relationella DBMS:er och multidimensionella specialiserade verktyg, finns det tre typer av multidimensionella OLAP-system:

  • - flerdimensionell (Multidimensional) OLAP-MOLAP;
  • - relationell (Relation) OLAP-ROLAP;
  • - blandad eller hybrid (Hybrid) OLAP-HOLAP.

I flerdimensionell DBMS organiseras data inte i form av relationstabeller, utan i form av ordnade flerdimensionella arrayer i form av hyperkuber, när all lagrad data måste ha samma dimension, vilket innebär behovet av att utgöra den mest kompletta basen för mätningar. Data kan organiseras i form av polykuber, i det här alternativet lagras värdena för varje indikator med sin egen uppsättning mätningar, databehandling utförs av systemets eget verktyg. Lagringsstrukturen i detta fall är förenklad, eftersom det finns inget behov av en datalagringszon i flerdimensionell eller objektorienterad form. Enorma arbetskostnader för att skapa modeller och system för att konvertera data från en relationsmodell till en objektmodell minskar.

Fördelarna med MOLAP är:

  • - snabbare svar på förfrågningar än med ROLAP - tidsåtgången är en eller två storleksordningar mindre;
  • - på grund av SQLs begränsningar är implementeringen av många inbyggda funktioner svårt.

MOLAP-restriktioner inkluderar:

  • - Relativt liten storlek på databaser.
  • - på grund av denormalisering och preliminär aggregering använder flerdimensionella arrayer 2,5-100 gånger mer minne än originaldata (minneskonsumtionen växer exponentiellt med en ökning av antalet dimensioner);
  • - Det finns inga standarder för gränssnittet och verktygen för datamanipulation;
  • – Det finns begränsningar vid laddning av data.

Ansträngningen som krävs för att skapa flerdimensionell data ökar dramatiskt i denna situation finns det praktiskt taget inga specialiserade medel för att objektifiera den relationsmodell av data som finns i informationslagret. Svarstiden på frågor kan ofta inte uppfylla kraven för OLAP-system.

Fördelarna med ROLAP-system är:

  • - förmågan att snabbt analysera data direkt i lagringen, eftersom de flesta källdatabaser är relationella;
  • - med en variabel dimension av problemet vinner RO-LAP, eftersom ingen fysisk omorganisation av databasen krävs;
  • - ROLAP-system kan använda mindre kraftfulla klientstationer och servrar, och servrarna bär huvudbördan av att bearbeta komplexa SQL-frågor;
  • - nivån på informationsskydd och differentiering av åtkomsträttigheter i relationella DBMS är ojämförligt högre än i flerdimensionella.

Nackdelen med ROLAP-system är lägre prestanda, behovet av noggrann studie av databasscheman, speciell justering av index, analys av frågestatistik och att ta hänsyn till analysens slutsatser vid modifiering av databasscheman, vilket leder till betydande extra arbetskostnader.

Uppfyllelsen av dessa villkor gör det möjligt att vid användning av ROLAP-system uppnå indikatorer som liknar MOLAP-system när det gäller åtkomsttid, samt att överträffa minnesbesparingarna.

Hybrid OLAP-system är en kombination av verktyg som implementerar en relationell och flerdimensionell datamodell. Detta gör att du kan drastiskt minska kostnaden för resurser för att skapa och underhålla en sådan modell, svarstiden på förfrågningar.

Detta tillvägagångssätt använder fördelarna med de två första tillvägagångssätten och kompenserar för deras brister. Denna princip är implementerad i de mest utvecklade mjukvaruprodukterna för detta ändamål.

Användningen av hybridarkitektur i OLAP-system är det mest acceptabla sättet att lösa de problem som är förknippade med användningen av mjukvaruverktyg i flerdimensionell analys.

Mönsterdetekteringsläget är baserat på intelligent databehandling. Huvuduppgiften här är att identifiera mönster i de processer som studeras, sambanden och ömsesidig påverkan av olika faktorer, sökandet efter stora "ovanliga" avvikelser och prognosen för förloppet av olika betydande processer. Detta område tillhör data mining.

Begreppet multidimensionell dataanalys är nära besläktat med operationsanalys, som utförs med hjälp av OLAP-system.

OLAP (On-Line Analytical Processing) är en teknik för online analytisk databehandling som använder metoder och verktyg för att samla in, lagra och analysera multidimensionell data för att stödja beslutsprocesser.

Huvudsyftet med OLAP-system är att stödja analytiska aktiviteter, godtyckliga (termen ad-hoc används ofta) förfrågningar från analytikeranvändare. Syftet med OLAP-analys är att testa nya hypoteser.

I ursprunget till OLAP-teknologin är grundaren av det relationella tillvägagångssättet E. Codd. 1993 publicerade han en artikel med titeln "OLAP for Analyst Users: What It Should Be". Det här dokumentet beskriver de grundläggande koncepten för analytisk bearbetning online och identifierar följande 12 krav som måste uppfyllas av produkter som tillåter analytisk bearbetning online. Tokmakov G.P. Databas. Databaskoncept, relationsdatamodell, SQL-språk. S. 51

Nedan listas de 12 regler som Codd beskrev som definierar OLAP.

1. Multidimensionalitet - OLAP-system på konceptuell nivå bör presentera data i form av en multidimensionell modell, vilket förenklar processerna för analys och uppfattning av information.

2. Transparens - Ett OLAP-system bör dölja för användaren den verkliga implementeringen av en multidimensionell modell, organisationsmetoden, källor, bearbetnings- och lagringsverktyg.

3. Tillgänglighet -- Ett OLAP-system måste tillhandahålla en enda, konsekvent och konsekvent datamodell för användaren, som tillåter åtkomst till data oavsett hur eller var den lagras.

4. Konsekvent rapportutvecklingsprestanda -- OLAP-systemens prestanda bör inte minska nämnvärt när antalet dimensioner som analyseras ökar.

5. Klient-serverarkitektur -- Ett OLAP-system måste kunna fungera i en klient-servermiljö, som merparten av den data som idag behöver utsättas för analytisk bearbetning online lagras distribuerad. Huvudtanken här är att serverkomponenten i OLAP-verktyget ska vara intelligent nog att tillåta att bygga ett gemensamt konceptuellt schema baserat på generalisering och konsolidering av olika logiska och fysiska företagsdatabasscheman för att ge en transparent effekt.

6. Lika dimensioner -- Ett OLAP-system måste stödja en flerdimensionell modell där alla dimensioner är lika. Om nödvändigt ytterligare egenskaper kan ges till individuella dimensioner, men detta alternativ måste ges till alla dimensioner.

7. Dynamisk kontroll glesa matriser -- Ett OLAP-system måste ge optimal hantering av glesa matriser. Accesshastigheten måste bibehållas oavsett var datacellerna är placerade och vara ett konstant värde för modeller med olika antal dimensioner och olika grad av datagleshet.

8. Stöd för fleranvändarläge - OLAP-systemet bör ge möjligheten att arbeta med flera användare tillsammans med en analytisk modell eller skapa olika modeller för dem från en enda data. Samtidigt är både läsning och skrivning av data möjligt, så systemet måste säkerställa deras integritet och säkerhet.

9. Obegränsade korsoperationer -- Ett OLAP-system måste säkerställa att de funktionella relationerna som beskrivs med ett visst formellt språk mellan hyperkubceller bevaras när du utför några segmenterings-, rotations-, konsoliderings- eller drill-down-operationer. Systemet bör självständigt (automatiskt) utföra omvandlingen av etablerade relationer, utan att användaren behöver omdefiniera dem.

10. Intuitiv datamanipulation -- Ett OLAP-system måste tillhandahålla ett sätt att utföra segmenterings-, rotations-, konsoliderings- och borroperationer på en hyperkub utan att användaren behöver göra mycket arbete med användargränssnittet. De dimensioner som definieras i den analytiska modellen måste innehålla all nödvändig information för att utföra ovanstående operationer.

11. Flexibla rapporteringsalternativ -- OLAP-systemet måste stödja olika sätt datavisualisering, dvs. rapporter bör lämnas i alla möjliga riktningar. Rapporteringsverktyg bör representera syntetiserad data eller information som härrör från datamodellen i alla möjliga riktningar. Det betyder att rader, kolumner eller sidor ska visa från 0 till N dimensioner samtidigt, där N-- nummer mätningar av hela analysmodellen. Dessutom måste varje innehållsdimension som visas i ett enda inlägg, en kolumn eller sida tillåta att alla delmängder av elementen (värdena) som finns i dimensionen visas i valfri ordning.

12. Obegränsad dimensionalitet och antal nivåer av aggregering - En studie av det möjliga antalet nödvändiga dimensioner som krävs i en analytisk modell visade att upp till 19 dimensioner kan användas samtidigt. Därav den starka rekommendationen att analysverktyget ska kunna ge minst 15 och helst 20 mätningar samtidigt. Dessutom bör var och en av de vanliga dimensionerna inte begränsas av antalet nivåer av aggregerings- och konsolideringsvägar som definieras av användaranalytikern.

Ytterligare regler för Codd.

Uppsättningen av dessa krav, som fungerade som de facto-definitionen av OLAP, orsakar ganska ofta olika kritik, till exempel är reglerna 1, 2, 3, 6 krav och reglerna 10, 11 är oformella önskemål. Tokmakov G.P. Databas. Databaskoncept, relationsdatamodell, SQL-språk. S. 68 Således tillåter de listade 12 kraven i Codd dig inte att exakt definiera OLAP. 1995 lade Codd till följande sex regler till listan:

13. Batchextraktion vs. tolkning -- Ett OLAP-system måste vara lika effektivt för att ge tillgång till både interna och externa data.

14. Stöd för alla OLAP-analysmodeller -- Ett OLAP-system måste stödja alla fyra dataanalysmodeller som definieras av Codd: kategoriska, tolkningsbara, spekulativa och stereotypa.

15. Hantering av denormaliserade data -- Ett OLAP-system måste integreras med denormaliserade datakällor. Ändringar av data som görs i en OLAP-miljö bör inte leda till ändringar av data som lagras i de ursprungliga externa systemen.

16. Spara OLAP-resultat: hålla dem åtskilda från originaldata -- Ett OLAP-system som arbetar i läs-skrivläge, efter att ha modifierat originaldata, måste spara resultaten separat. Säkerheten för källdata är med andra ord säkerställd.

17. Exkludering av saknade värden-- När data presenteras för användaren måste ett OLAP-system kassera alla saknade värden. Med andra ord, saknade värden måste skilja sig från nollvärden.

18 Hantering av saknade värden -- Ett OLAP-system måste ignorera alla saknade värden, oavsett deras källa. Denna funktion är relaterad till den 17:e regeln.

Dessutom bröt Codd alla 18 regler i följande fyra grupper och kallade dem funktioner. Dessa grupper hette B, S, R och D.

Huvuddragen (B) inkluderar följande regler:

Flerdimensionell konceptuell representation av data (regel 1);

Intuitiv datamanipulation (regel 10);

Tillgänglighet (regel 3);

Batchextraktion kontra tolkning (regel 13);

Stöd för alla OLAP-analysmodeller (regel 14);

Arkitektur "klient-server" (regel 5);

Öppenhet (regel 2);

Stöd för flera spelare (regel 8)

Specialfunktioner (S):

Behandling av icke-normaliserade data (regel 15);

Spara OLAP-resultat: lagra dem separat från originaldata (regel 16);

Uteslutning av saknade värden (regel 17);

Hantering av saknade värden (regel 18). Rapporteringsfunktioner (R):

Flexibilitet att generera rapporter (regel 11);

Rapportprestandastandard (regel 4);

Automatisk inställning fysiskt lager(ändrad ursprungliga regel 7).

Mätkontroll (D):

Universalitet av mätningar (regel 6);

Obegränsat antal dimensioner och aggregeringsnivåer (regel 12);

Obegränsade operationer mellan dimensioner (regel 9).

Online analytisk bearbetning, eller OLAP, är en effektiv databehandlingsteknik som resulterar i sammanfattande information baserad på enorma uppsättningar av alla typer av data. Det är en kraftfull produkt som hjälper dig att komma åt, extrahera och visa information på en PC, analysera den från olika perspektiv.

OLAP är ett verktyg som ger en strategisk position för långsiktig planering och tar hänsyn till den underliggande informationen i operativa data för en period på 5, 10 eller fler år. Data lagras i databasen med en dimension, som är deras attribut. Användare kan se samma datamängd med olika attribut, beroende på syftet med analysen.

OLAPs historia

OLAP är det inte nytt koncept och har använts i decennier. I själva verket har ursprunget till tekniken spårats tillbaka så långt som 1962. Men termen myntades först 1993 av databasförfattaren Ted Codd, som också fastställde 12 regler för produkten. Som med många andra applikationer har konceptet gått igenom flera stadier av utveckling.

Själva OLAP-teknikens historia går tillbaka till 1970, då Express-informationsresurserna och den första Olap-servern släpptes. De förvärvades av Oracle 1995 och blev sedan grunden för den online analytiska bearbetningen av en multidimensionell datormotor som ett välkänt datormärke tillhandahållit i sin databas. 1992 släpptes en annan berömd online analytisk bearbetningsprodukt, Essbase, av Arbor Software (förvärvade av Oracle 2007).

1998 släppte Microsoft MS Analysis Services, en onlineserver för analytisk databehandling. Detta bidrog till teknikens popularitet och stimulerade utvecklingen av andra produkter. Idag finns det flera världskända leverantörer som erbjuder Olap-applikationer, inklusive IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.

Online analytisk bearbetning

OLAP är ett verktyg som låter dig fatta beslut om schemalagda händelser. En atypisk Olap-beräkning kan vara mer komplex än bara dataaggregation. Analytiska förfrågningar per minut (AQM) används som ett standardriktmärke för att jämföra prestanda för olika instrument. Dessa system bör dölja användare så mycket som möjligt från komplex frågesyntax och ge konsekventa svarstider för alla (oavsett hur komplexa de är).

Det finns följande huvudegenskaper hos OLAP:

  1. Flerdimensionella representationer av data.
  2. Stöd för komplexa beräkningar.
  3. Tillfällig intelligens.

Den flerdimensionella vyn utgör grunden för analytisk bearbetning genom flexibel tillgång till företagsdata. Det tillåter användare att analysera data i vilken dimension som helst och på vilken nivå som helst av aggregering.

Stöd för komplexa beräkningar är ryggraden i OLAP-programvaran.

Tidsintelligens används för att utvärdera prestandan för alla analytiska applikationer under en viss tidsperiod. Till exempel den här månaden jämfört med förra månaden, den här månaden jämfört med samma månad förra året.

Flerdimensionell datastruktur

En av de viktigaste egenskaperna hos analytisk bearbetning online är den flerdimensionella datastrukturen. En kub kan ha flera dimensioner. Tack vare denna modell är hela processen med intelligent OLAP-analys enkel för chefer och chefer, eftersom objekten som representeras i cellerna är verkliga affärsobjekt. Dessutom tillåter denna datamodell användare att bearbeta inte bara strukturerade arrayer, utan även ostrukturerade och semi-strukturerade sådana. Allt detta gör dem särskilt populära för dataanalys och BI-applikationer.

Huvudegenskaper hos OLAP-system:

  1. Använd flerdimensionella metoder för dataanalys.
  2. Ge utökat databasstöd.
  3. Skapa lättanvända slutanvändargränssnitt.
  4. Stöd klient/server-arkitektur.

En av huvudkomponenterna i OLAP-koncept är klientsidans server. Förutom aggregering och förbehandling data från en relationsdatabas ger den avancerade beräknings- och inspelningsalternativ, ytterligare funktioner, avancerade grundläggande frågefunktioner och andra funktioner.

Beroende på vilken exempelapplikation som valts av användaren finns en mängd olika datamodeller och verktyg tillgängliga, inklusive varning i realtid, en funktion för att tillämpa vad-om-scenarier, optimering och sofistikerade OLAP-rapporter.

kubisk form

Konceptet bygger på en kubisk form. Layouten av data i den visar hur OLAP följer principen för flerdimensionell analys, vilket resulterar i en datastruktur utformad för snabb och effektiv analys.

En OLAP-kub kallas också en "hyperkub". Det beskrivs som bestående av numeriska fakta (mått) klassificerade i fasetter (dimensioner). Dimensioner hänvisar till attribut som definierar ett affärsproblem. Enkelt uttryckt är en dimension en etikett som beskriver ett mått. Till exempel i försäljningsrapporter skulle måttet vara försäljningsvolym, och dimensionerna skulle inkludera försäljningsperiod, säljare, produkt eller tjänst och försäljningsregion. Vid rapportering av tillverkningsverksamhet kan måttet vara totala tillverkningskostnader och produktionsenheter. Dimensionerna kommer att vara datum eller tidpunkt för produktionen, produktionsstadiet eller fasen, även de arbetare som är involverade i produktionsprocessen.

OLAP-datakuben är hörnstenen i systemet. Datan i kuben är organiserad med antingen en stjärna eller ett snöflingaschema. I mitten finns en faktatabell som innehåller aggregat (mått). Den är kopplad till en serie dimensionstabeller som innehåller information om måtten. Dimensioner beskriver hur dessa mått kan analyseras. Om en kub innehåller mer än tre dimensioner kallas den ofta för en hyperkub.

En av huvuddragen som hör till en kub är dess statiska natur, vilket gör att kuben inte kan ändras efter att den har designats. Därför är processen att bygga en kub och sätta upp en datamodell ett kritiskt steg mot korrekt databehandling i en OLAP-arkitektur.

Dataaggregation

Användningen av aggregationer är huvudorsaken till att frågor bearbetas mycket snabbare i OLAP-verktyg (jämfört med OLTP). Aggregeringar är sammanfattningar av data som förberäknades när de bearbetades. Alla medlemmar som lagras i OLAP-dimensionstabeller definierar de frågor som en kub kan ta emot.

I en kub lagras ansamlingar av information i celler, vars koordinater specificeras av specifika storlekar. Antalet aggregationer en kub kan innehålla beror på alla möjliga kombinationer av dimensionsmedlemmar. Därför kan en typisk kub i en applikation innehålla ett extremt stort antal aggregationer. Förberäkningen kommer endast att utföras för nyckelaggregat som är distribuerade över hela analyskuben för onlineanalys. Detta kommer att avsevärt minska tiden det tar att definiera eventuella aggregationer när en fråga körs på datamodellen.

Det finns också två aggregeringsrelaterade alternativ som du kan använda för att förbättra prestandan för den färdiga kuben: skapa en kapacitetscache-aggregation och använd en aggregering baserad på användarfrågeanalys.

Funktionsprincip

Typiskt kan analys av operativ information som härrör från transaktioner utföras med ett enkelt kalkylblad (datavärden presenteras i rader och kolumner). Detta är bra med tanke på att data är tvådimensionella. När det gäller OLAP finns det skillnader som är associerade med en flerdimensionell datamatris. Eftersom de ofta hämtas från olika källor kan kalkylarket inte alltid bearbeta dem effektivt.

Kuben löser detta problem och håller även OLAPs datalager igång på ett logiskt och överskådligt sätt. Verksamheten samlar in data från många källor och presenteras i olika format som t.ex textfiler, multimediafiler, elektroniska Excel-tabeller, bas Få åtkomst till data och även OLTP-databaser.

All data samlas in i ett lager som fylls direkt från källor. I den kommer den råinformation som tas emot från OLTP och andra källor att rensas från alla felaktiga, ofullständiga och inkonsekventa transaktioner.

Efter rengöring och transformation kommer informationen att lagras i en relationsdatabas. Den kommer sedan att laddas upp till en flerdimensionell OLAP-server (eller Olap-kub) för analys. Slutanvändare som ansvarar för affärsapplikationer, datautvinning och annan affärsverksamhet kommer att ha tillgång till den information de behöver från Olap-kuben.

Fördelar med Array-modellen

OLAP är ett verktyg som tillhandahåller snabb prestanda förfrågningar, vilket uppnås genom optimerad lagring, flerdimensionell indexering och cachning, vilket är bland de betydande fördelarna med systemet. Dessutom är fördelarna:

  1. Mindre datastorlek på disken.
  2. Automatisk beräkning av aggregat av en högre datanivå.
  3. Arraymodeller ger naturlig indexering.
  4. Effektiv datautvinning uppnås genom preliminär strukturering.
  5. Kompakthet för lågdimensionella datamängder.

Nackdelarna med OLAP inkluderar det faktum att vissa beslut (bearbetningssteg) kan vara ganska långa, speciellt med stora mängder information. Detta korrigeras vanligtvis genom att endast utföra inkrementell bearbetning (undersöka data som har ändrats).

Grundläggande analytiska operationer

Veck(roll-up/drill-up) är också känd som "konsolidering". Vikning innebär att samla in all data som kan erhållas och beräkna allt i en eller flera dimensioner. Oftast kan detta kräva tillämpning av en matematisk formel. Som ett OLAP-exempel, överväg en detaljhandelskedja med butiker i olika städer. För att identifiera mönster och förutse framtida försäljningstrender rullas de upp från alla orter till företagets huvudsäljavdelning för konsolidering och beräkning.

Avslöjande(borra ner). Detta är motsatsen till vikning. Processen börjar med en stor datamängd och bryter sedan ner den i mindre bitar, vilket gör att användarna kan se detaljerna. I exemplet med detaljhandelsnät analytikern kommer att analysera försäljningsdata och se enskilda varumärken eller produkter som anses vara bästsäljare i var och en av butikerna i olika städer.

tvärsnitt(Skär och tärna). Detta är en process där analysoperationer involverar två åtgärder: att extrahera en specifik uppsättning data från en OLAP-kub ("skärningsaspekten" av analysen) och se den från olika synvinklar eller vinklar. Detta kan hända när all uttagsdata har tagits emot och matats in i hyperkuben. Analytikern klipper ut en uppsättning data relaterad till försäljning från OLAP Cube. Det kommer att ses över senare när försäljningen av enskilda enheter i varje region analyseras. För närvarande kan andra användare fokusera på att utvärdera kostnadseffektiviteten för försäljning eller utvärdera effektiviteten av en marknadsförings- och reklamkampanj.

Sväng(Svänga). Den roterar dataaxlarna för att tillhandahålla en ersättningsrepresentation av informationen.

Databasvarianter

I grund och botten är detta en typisk OLAP-kub som implementerar flerdimensionell dataanalys med OLAP Cube eller någon datakub så att analysprocessen kan lägga till dimensioner efter behov. All information som laddas in i den flerdimensionella databasen kommer att lagras eller arkiveras och kan tas fram vid behov.

Menande

Relationell OLAP (ROLAP)

ROLAP är ett avancerat DBMS tillsammans med multidimensionell datamappning för att utföra en standardrelationsoperation

Flerdimensionell OLAP (MOLAP)

MOLAP - implementerar arbete i flerdimensionell data

Hybrid Online Analytical Processing (HOLAP)

I HOLAP-metoden lagras aggregerade totaler i en flerdimensionell databas, och detaljerad information lagras i en relationsdatabas. Detta säkerställer både effektiviteten hos ROLAP-modellen och prestandan hos MOLAP-modellen.

OLAP Desktop (DOLAP)

I Desktop OLAP laddar användaren ner en bit data från en databas lokalt eller till sitt skrivbord och analyserar den. DOLAP är relativt billigare att distribuera eftersom det erbjuder väldigt lite funktionalitet jämfört med andra OLAP-system

Web OLAP (WOLAP)

Web OLAP är ett OLAP-system som är tillgängligt via en webbläsare. WOLAP är en arkitektur i tre lager. Den består av tre komponenter: klient, mellanprogram och databasserver

Mobil OLAP

Mobile OLAP hjälper användare att få och analysera OLAP-data med dina mobila enheter

Rumslig OLAP

SOLAP är skapat för att underlätta hanteringen av både rumslig och icke-rumslig data i geografiska områden informationssystem(GIS)

Det finns mindre kända OLAP-system eller -tekniker, men dessa är de viktigaste som för närvarande används av stora företag, företag och till och med regeringen.

OLAP-verktyg

Online analytiska bearbetningsverktyg är mycket väl representerade på Internet i både betal- och gratisversioner.

Den mest populära av dem:

  1. Dundas BI från Dundas Data Visualization är en webbläsarbaserad plattform för affärsintelligens och datavisualisering som inkluderar integrerade instrumentpaneler, OLAP-rapporteringsverktyg och dataanalys.
  2. Yellowfin är en business intelligence-plattform som är en enda integrerad lösning designad för företag av olika branscher och storlekar. Detta system är anpassningsbart för företag inom redovisning, reklam, jordbruk.
  3. ClicData är en business intelligence (BI)-lösning designad för användning främst av små och medelstora företag. Verktyget låter slutanvändare skapa rapporter och instrumentpaneler. Board skapades för att kombinera business intelligence, företagsprestandahantering och är ett fullfjädrat system som betjänar medelstora och företagsstora företag.
  4. Domo är en molnbaserad företagsledningssvit som integreras med flera datakällor inklusive kalkylblad, databaser, sociala nätverk och alla befintliga molnlösningar eller lokal mjukvarulösning.
  5. InetSoft Style Intelligence är mjukvaruplattform för affärsanalytiker, vilket tillåter användare att skapa instrumentpaneler, OLAP visuell analysteknik och rapporter med hjälp av mashup-motorn.
  6. Birst by Infor Company är en webbaserad business intelligence och analyslösning som kopplar ihop idéer olika lag och hjälper dig att fatta välgrundade beslut. Verktyget låter decentraliserade användare skala upp företagsteammodellen.
  7. Halo är ett omfattande supply chain management och business intelligence system som hjälper till med affärsplanering och lagerprognoser för supply chain management. Systemet använder data från alla källor - stora, små och medelstora.
  8. Chartio är en molnbaserad affärsanalytikerlösning som ger grundare, affärsteam, dataanalytiker och produktteam verktygen för att organisera sitt dagliga arbete.
  9. Exago BI är en webblösning designad för att bäddas in i webbapplikationer. Implementeringen av Exago BI gör det möjligt för företag av alla storlekar att förse sina kunder med ad hoc-, realtids- och interaktiv rapportering.

Affärspåverkan

Användaren hittar OLAP i de flesta affärsapplikationer inom olika branscher. Analys används inte bara av företag utan även av andra intresserade.

Några av de vanligaste applikationerna inkluderar:

  1. Marknadsföring OLAP dataanalys.
  2. Ekonomisk rapportering som omfattar försäljning och utgifter, budgetering och ekonomisk planering.
  3. Affärsprocessledning.
  4. Försäljningsanalys.
  5. Databasmarknadsföring.

Branscher fortsätter att växa, vilket innebär att användarna snart kommer att se fler appar OLAP. Multivariat skräddarsydd bearbetning ger mer dynamisk analys. Det är av denna anledning som dessa OLAP-system och -tekniker används för att utvärdera vad-om och alternativa affärsscenarier.

OLAP (OnLine Analytical Processing) är inte namnet på en specifik produkt, utan på en hel online analytisk processteknik som involverar dataanalys och rapportering. Användaren förses med en flerdimensionell tabell som automatiskt sammanfattar data i olika sektioner och låter dig snabbt hantera beräkningarna och rapportens form.

Även om analytisk bearbetning i vissa publikationer kallas både online och interaktiv, återspeglar adjektivet "online" mest exakt innebörden av OLAP-teknik. Utvecklingen av ledningsbeslut faller inom kategorin områden som är mest falskt mottagliga för automatisering. Men idag finns det en möjlighet att hjälpa chefen att ta fram beslut och, viktigast av allt, att avsevärt påskynda processen för att ta fram beslut, deras urval och antagande.

Beslutsstödssystem har vanligtvis möjlighet att förse användaren med aggregerade data för olika prover från den initiala uppsättningen i en form som är bekväm för perception och analys. Som regel sådana aggregerade funktioner bilda en flerdimensionell datamängd, ofta kallad hyperkub eller metakub, vars axlar innehåller parametrar, och cellerna innehåller aggregerade data som är beroende av dem - och sådan data kan också lagras i relationstabeller, men i det här fallet talar vi om det logiska organisation av data och inte om den fysiska implementeringen av deras lagring.

Längs varje axel kan data organiseras i en hierarki som representerar olika detaljnivåer.

Enligt dimensionerna i den flerdimensionella modellen läggs faktorer som påverkar företagets aktiviteter åt sidan (till exempel: tid, produkter, företagsgrenar, etc.). Den resulterande OLAP-kuben fylls sedan med indikatorer för företagets aktivitet (priser, försäljning, plan, vinst, kassaflöde, etc.). Det bör noteras att, till skillnad från en geometrisk kub, måste ytorna på en OLAP-kub inte ha samma storlek. Denna fyllning kan utföras både med verkliga data från operativa system och förutsägas baserat på historiska data. Hyperkubdimensioner kan vara komplexa, hierarkiska och relationer kan upprättas mellan dem. Under analysen kan användaren ändra synvinkeln på data (den så kallade operationen att ändra den logiska vyn), och därigenom se data i olika sektioner och lösa specifika problem. Olika operationer kan utföras på kuber, inklusive prognoser och villkorlig schemaläggning (vad-om-analys).

Tack vare denna datamodell kan användare formulera komplexa frågor, generera rapporter och ta emot delmängder av data. Operationell analytisk bearbetning kan avsevärt förenkla och påskynda processen för att förbereda och fatta beslut av ledningspersonal. Online analytisk bearbetning tjänar syftet att omvandla data till information. Den skiljer sig i grunden från den traditionella beslutsstödsprocessen, som oftast bygger på övervägande av strukturerade rapporter.


OLAP-teknik hänvisar till typen av intellektuell analys och involverar 12 principer:

1. Konceptuell flerdimensionell representation. Användaranalytikern ser företagets värld som multidimensionell till sin natur, och OLAP-modellen måste vara multidimensionell i sin kärna.

2. Genomskinlighet. OLAP-systemets arkitektur bör vara öppen, så att användaren, var han än befinner sig, kan kommunicera med hjälp av ett analytiskt verktyg - klienten - med servern.

3. Tillgänglighet. En OLAP-analytiker måste kunna utföra analys baserat på ett gemensamt konceptuellt schema som innehåller företagsomfattande data i en relationsdatabas såväl som data från äldre äldre databaser, på vanliga åtkomstmetoder och på en gemensam analysmodell. Ett OLAP-system bör endast komma åt de data som faktiskt behövs, och inte tillämpa den allmänna "köketratt"-principen som innebär onödig inmatning.

4. Konsekvent prestation i rapportutveckling. Med en ökning av antalet dimensioner eller storleken på databasen bör analytikeranvändaren inte uppleva en signifikant minskning av prestanda.

5. Klient-server-arkitektur. Merparten av den data som idag behöver utsättas för analytisk bearbetning online finns på stordatorer med tillgång till användararbetsstationer via LAN. Detta innebär att OLAP-produkter måste kunna fungera i en klient-servermiljö.

6. Allmän multidimensionalitet. Varje dimension bör tillämpas oavsett dess struktur och operativa kapacitet. De underliggande datastrukturerna, formlerna och rapporteringsformaten bör inte vara partiska mot någon enskild dimension.

7. Dynamisk hantering av glesa matriser. Den fysiska designen av ett OLAP-verktyg måste vara fullt anpassningsbar till den specifika analysmodellen för att optimalt hantera glesa matriser. Sparsitet (mätt som andelen tomma celler till alla möjliga) är en av egenskaperna för datautbredning.

8. Fleranvändarsupport. Ett OLAP-verktyg måste ge möjligheten att dela frågor och utöka flera analytiker samtidigt som integriteten och säkerheten bibehålls.

9. Obegränsade korsoperationer. Olika operationer kan, på grund av sin hierarkiska karaktär, representera beroendeförhållanden i OLAP-modellen, det vill säga de är tvärfunktionella. Deras utförande bör inte kräva att analytikeranvändaren omdefinierar dessa beräkningar och operationer.

10. Intuitiv datamanipulation. Analytikeranvändarens syn på de dimensioner som definieras i analysmodellen måste innehålla all nödvändig information för att utföra åtgärder på OLAP-modellen, d.v.s. de bör inte kräva användning av ett menysystem eller andra funktioner för flera användargränssnitt.

11. Flexibla rapporteringsalternativ. Rapporteringsverktyg bör vara syntetiserade data eller information som härrör från datamodellen i alla möjliga riktningar. Detta innebär att raderna, kolumnerna eller sidorna i en rapport måste visa flera dimensioner av en OLAP-modell samtidigt, med möjlighet att visa vilken delmängd som helst av elementen (värdena) som finns i dimensionen, och i valfri ordning.

12. Obegränsad dimension och antal aggregeringsnivåer. En studie om det möjliga antalet nödvändiga mätningar som krävs i en analytisk modell visade att upp till 19 mätningar kan användas samtidigt av en analytiker. Detta leder till en rekommendation om antalet dimensioner som stöds av OLAP-systemet. Dessutom bör var och en av de vanliga dimensionerna inte begränsas av antalet aggregeringsnivåer som definieras av användaranalytikern.

Som specialiserade OLAP-system som för närvarande erbjuds på marknaden kan du specificera CalliGraph, Business Intelligence.

För att lösa enkla dataanalysuppgifter är det möjligt att använda en budgetlösning - Microsoft Excel och Access office-applikationer, som innehåller elementära OLAP-teknikverktyg som låter dig skapa pivottabeller och bygga olika rapporter utifrån dem.