Өгөгдлийн олон хэмжээст дүрслэл. Мэдээллийн агуулахын зохион байгуулалтын ерөнхий схем. OLAP ба OLTP технологийн шинж чанар, төрөл, үндсэн ялгаа. Од ба цасан ширхгийн схемүүд. Нэгтгэх. OLAP системийн olap хэрэгслүүд нь зориулагдсан

Өндөр өрсөлдөөний нөхцөл, гадаад орчны өсөн нэмэгдэж буй динамик нь аж ахуйн нэгжийн удирдлагын тогтолцоонд тавигдах шаардлагыг нэмэгдүүлж байна. Удирдлагын онол, практикийг хөгжүүлэх нь үйл ажиллагааны үр ашгийг дээшлүүлэхэд чиглэсэн шинэ арга, технологи, загварууд бий болсон. Арга, загварууд нь эргээд аналитик системийг бий болгоход хувь нэмэр оруулсан. ОХУ-д аналитик системийн эрэлт хэрэгцээ өндөр байна. Хэрэглээний үүднээс авч үзвэл эдгээр системүүд нь санхүүгийн салбарт хамгийн сонирхолтой байдаг: банк, даатгалын бизнес, хөрөнгө оруулалтын компаниуд. Аналитик системийн ажлын үр дүн нь юуны түрүүнд компанийн хөгжил нь шийдвэрээс хамаардаг хүмүүст шаардлагатай байдаг: менежерүүд, шинжээчид, шинжээчид. Аналитик системүүд нь нэгтгэх, тайлагнах, оновчтой болгох, урьдчилан таамаглах асуудлыг шийдвэрлэх боломжийг танд олгоно. Энэ чиглэлд хэрэглэгдэж буй нэр томъёоны тодорхойлолтын ерөнхий систем байхгүйтэй адил аналитик системийн эцсийн ангилал одоогоор гараагүй байна. Аж ахуйн нэгжийн мэдээллийн бүтцийг түвшний дарааллаар төлөөлж болох бөгөөд тус бүр нь мэдээллийг боловсруулах, удирдах өөрийн гэсэн арга замаар тодорхойлогддог бөгөөд удирдлагын үйл явцад өөрийн гэсэн үүрэгтэй. Тиймээс аналитик системийг шаталсан байдлаар зохион байгуулна өөр өөр түвшинэнэ дэд бүтэц.

Гүйлгээний системийн түвшин

Мэдээлэл хадгалах давхарга

Data Mart давхарга

OLAP системийн түвшин

Аналитик хэрэглээний давхарга

OLAP - системүүд - (OnLine Analytical Processing, аналитик боловсруулалтыг бодит цаг хугацаанд хийх) - нарийн төвөгтэй олон хэмжээст өгөгдөлд дүн шинжилгээ хийх технологи юм. OLAP - системийг олон хүчин зүйлийн өгөгдөлд дүн шинжилгээ хийх даалгавар байгаа тохиолдолд ашиглах боломжтой. Эдгээр нь тайланд дүн шинжилгээ хийх, гаргах үр дүнтэй хэрэгсэл юм. Дээр дурдсан мэдээллийн агуулах, өгөгдлийн зах болон OLAP системүүд нь бизнесийн тагнуулын системтэй (Business Intelligence, BI) холбоотой байдаг.

Шийдвэр гаргагчдын шууд ашиглах хүлээлтээр бий болсон мэдээлэл, аналитик систем нь ашиглахад маш хялбар боловч үйл ажиллагааны хувьд маш хязгаарлагдмал байдаг. Ийм статик системийг уран зохиолд Executive Information Systems (ISR) эсвэл Executive Information Systems (EIS) гэж нэрлэдэг. Эдгээр нь урьдчилан тодорхойлсон асуулгын багцыг агуулдаг бөгөөд өдөр тутмын тоймыг харахад хангалттай боловч шийдвэр гаргахад гарч болзошгүй мэдээллийн талаархи бүх асуултад хариулж чадахгүй. Ийм системийн үр дүн нь дүрмээр бол олон хуудастай тайлангууд бөгөөд үүнийг сайтар судалсны дараа шинжээчид шинэ цуврал асуултууд гарч ирдэг. Гэсэн хэдий ч ийм системийг зохион бүтээхдээ урьдчилан тооцоолоогүй шинэ хүсэлт бүрийг эхлээд албан ёсоор тайлбарлаж, программист кодлож, зөвхөн дараа нь гүйцэтгэх ёстой. Энэ тохиолдолд хүлээх хугацаа нь цаг, өдөр байж болох бөгөөд энэ нь үргэлж хүлээн зөвшөөрөгдөхгүй. Тиймээс мэдээлэл, аналитик системийн ихэнх үйлчлүүлэгчид идэвхтэй тэмцэж буй статик DSS-ийн гадаад энгийн байдал нь уян хатан байдлын гамшгийн алдагдал болж хувирдаг.



Харин Dynamic DSS нь зохицуулалтгүй (түр зуурын) шинжээчдийн өгөгдлийн хүсэлтийг боловсруулахад чиглэгддэг. Ийм системд тавигдах хамгийн гүн гүнзгий шаардлагуудыг E. F. Codd OLAP-ийн үзэл баримтлалын үндэс суурийг тавьсан нийтлэлд авч үзсэн. Эдгээр системтэй шинжээчдийн ажил нь хүсэлт гаргах, тэдгээрийн үр дүнг судлах интерактив дарааллаас бүрддэг.

Гэхдээ динамик DSS нь зөвхөн онлайн аналитик боловсруулалтын (OLAP) салбарт ажиллах боломжтой; Хуримтлагдсан мэдээлэлд үндэслэн удирдлагын шийдвэр гаргахад дэмжлэг үзүүлэх ажлыг үндсэн гурван чиглэлээр хийж болно.

Нарийвчилсан мэдээллийн хүрээ. Энэ нь ихэнх мэдээлэл хайх системийн хамрах хүрээ юм. Ихэнх тохиолдолд харилцааны DBMS нь энд гарч буй сорилтуудыг шийдвэрлэх ажлыг маш сайн хийдэг. Харилцааны өгөгдөл боловсруулах хэлний нийтээр хүлээн зөвшөөрөгдсөн стандарт бол SQL юм. Нарийвчилсан мэдээлэл хайхад эцсийн хэрэглэгчийн интерфэйсийг хангадаг мэдээлэл хайх системийг гүйлгээний системийн тусдаа мэдээллийн сан болон нийтлэг мэдээллийн агуулах дээр нэмэлт хэрэгсэл болгон ашиглаж болно.

Нэгтгэсэн үзүүлэлтүүдийн хүрээ. Мэдээллийн агуулахад цуглуулсан мэдээллийг иж бүрэн харах, түүнийг нэгтгэх, нэгтгэх, гиперкуб дүрслэл, олон хэмжээст дүн шинжилгээ хийх нь онлайн аналитик өгөгдөл боловсруулах (OLAP) системийн даалгавар юм. Энд та тусгай олон хэмжээст DBMS дээр анхаарлаа төвлөрүүлж болно, эсвэл харилцааны технологийн хүрээнд үлдэж болно. Хоёрдахь тохиолдолд урьдчилан нэгтгэсэн өгөгдлийг од хэлбэрийн мэдээллийн санд цуглуулах, эсвэл харилцааны мэдээллийн сангийн нарийвчилсан хүснэгтүүдийг сканнердах явцад мэдээллийг шууд нэгтгэж болно.

Хуулийн хүрээ. Ухаалаг боловсруулалтыг аргуудаар гүйцэтгэдэг оюуны шинжилгээөгөгдөл (IAD, Data Mining), үндсэн ажил нь хуримтлагдсан мэдээллээс функциональ болон логик хэв маягийг хайх, олсон гажигийг тайлбарлах загвар, дүрмийг бий болгох, / эсвэл зарим үйл явцын хөгжлийг урьдчилан таамаглах явдал юм.

Онлайн аналитик өгөгдөл боловсруулах

OLAP-ийн үзэл баримтлал нь олон хэмжээст өгөгдлийг дүрслэх зарчим дээр суурилдаг. 1993 оны нийтлэлдээ Э.Ф.Кодд харилцааны загварын дутагдалтай талуудыг хөндөж, юуны түрүүнд "өгөгдлийг олон хэмжээст байдлын үүднээс, өөрөөр хэлбэл корпорацийн шинжээчдэд хамгийн ойлгомжтой байдлаар нэгтгэх, үзэх, шинжлэх" боломжгүйг онцлон тэмдэглэж, ерөнхий шаардлагыг тодорхойлсон. OLAP системүүдийн хувьд харилцаа холбооны DBMS-ийн функцийг өргөжүүлж, олон хэмжээст шинжилгээг түүний шинж чанаруудын нэг болгон оруулдаг.

Өгөгдлийг танилцуулах аргын дагуу OLAP бүтээгдэхүүний ангилал.

Одоогийн байдлаар зах зээл дээр OLAP функцийг тодорхой хэмжээгээр хангадаг олон тооны бүтээгдэхүүн байдаг. Хамгийн алдартай 30 орчим нь http://www.olapreport.com/ вэб серверийн тоймд жагсаагдсан болно. Хэрэглэгчийн интерфэйсээс эх сурвалжийн мэдээллийн сан руу олон хэмжээст үзэл баримтлалыг үзүүлэхийн тулд бүх OLAP бүтээгдэхүүнийг эх мэдээллийн сангийн төрлөөс хамааран гурван ангилалд хуваадаг.

Хамгийн анхны онлайн аналитик боловсруулалтын системүүд (жишээлбэл, Arbor Software-ийн Essbase, Oracle-ийн Oracle Express Server) нь MOLAP байсан бөгөөд энэ нь зөвхөн өөрсдийн олон хэмжээст мэдээллийн сантай ажиллах боломжтой гэсэн үг юм. Эдгээр нь олон хэмжээст DBMS-ийн өмчийн технологид суурилсан бөгөөд хамгийн үнэтэй нь юм. Эдгээр системүүд нь OLAP боловсруулалтын бүрэн мөчлөгийг хангадаг. Эдгээр нь серверийн бүрэлдэхүүн хэсгээс гадна өөрийн нэгдсэн клиент интерфэйсийг агуулдаг эсвэл хэрэглэгчтэй харилцахдаа ашигладаг. гадаад програмуудхүснэгттэй ажиллах. Ийм системийг ажиллуулахын тулд системийг суурилуулах, засвар үйлчилгээ хийх, эцсийн хэрэглэгчдэд зориулсан мэдээллийн дүрслэлийг бий болгох тусгай ажилтан шаардлагатай.

Онлайн Relational Data Analytical Processing (ROLAP) системүүд нь харилцааны мэдээллийн санд хадгалагдсан өгөгдлийг олон хэмжээст хэлбэрээр төлөөлөх боломжийг олгодог бөгөөд энэ нь завсрын мета өгөгдлийн давхаргаар дамжуулан мэдээллийг олон хэмжээст загвар болгон хувиргах боломжийг олгодог. ROLAP систем нь том агуулахтай ажиллахад сайн зохицсон. MOLAP системүүдийн нэгэн адил тэдгээр нь мэдээллийн технологийн мэргэжилтнүүдээс их хэмжээний засвар үйлчилгээний зардал шаарддаг бөгөөд олон хэрэглэгчтэй ажиллах горимоор хангадаг.

Эцэст нь, эрлийз системүүд (Hybrid OLAP, HOLAP) нь өмнөх ангиудад байгаа давуу талыг нэгтгэж, сул талыг багасгах зорилготой юм. Speedware-ийн Media/MR нь энэ ангилалд хамаарна. Хөгжүүлэгчдийн үзэж байгаагаар энэ нь MOLAP-ийн аналитик уян хатан байдал, хариу өгөх хурдыг ROLAP-д хамаарах бодит өгөгдөлд тогтмол нэвтрэх боломжийг хослуулсан.

Олон хэмжээст OLAP (MOLAP)

Олон хэмжээст өгөгдлийн дүрслэлд суурилсан тусгай DBMS-д өгөгдлийг харилцааны хүснэгт хэлбэрээр биш, харин дараалсан олон хэмжээст массив хэлбэрээр зохион байгуулдаг.

1) гиперкуб (мэдээллийн санд хадгалагдсан бүх нүднүүд ижил хэмжээтэй байх ёстой, өөрөөр хэлбэл хэмжилтийн хамгийн бүрэн үндэслэлд байх ёстой) эсвэл

2) поликубууд (хувьсагч бүр өөрийн хэмжүүрээр хадгалагддаг бөгөөд үүнтэй холбоотой боловсруулалтын бүх хүндрэлүүд нь системийн дотоод механизмд шилждэг).

Онлайн аналитик боловсруулалтын системд олон хэмжээст мэдээллийн санг ашиглах нь дараах давуу талуудтай.

Олон хэмжээст DBMS ашиглах тохиолдолд олон хэмжээст өгөгдлийн сан нь хэвийн бус, урьдчилан нэгтгэсэн хэмжигдэхүүнүүдийг агуулж, хүссэн нүднүүдэд хандах хандалтыг оновчтой болгодог тул хайлт хийх, олж авах нь харилцааны мэдээллийн сангийн олон хэмжээст үзэл баримтлалтай харьцуулахад хамаагүй хурдан байдаг.

Олон хэмжээст DBMS нь оруулах даалгаврыг амархан даван туулдаг мэдээллийн загварянз бүрийн суулгасан функцууд байдаг бол SQL хэлний бодит хязгаарлалтууд нь харилцааны DBMS дээр суурилсан эдгээр даалгавруудыг хэрэгжүүлэхэд нэлээд хэцүү, заримдаа боломжгүй болгодог.

Нөгөөтэйгүүр, мэдэгдэхүйц хязгаарлалтууд байдаг.

Олон хэмжээст DBMS нь том мэдээллийн сантай ажиллахыг зөвшөөрдөггүй. Нэмж дурдахад, хэвийн бус байдал, урьдчилан гүйцэтгэсэн нэгтгэлийн улмаас олон хэмжээст мэдээллийн сан дахь өгөгдлийн хэмжээ нь дүрмээр бол (Codd-ийн дагуу) анхны нарийвчилсан өгөгдлийн хэмжээнээс 2.5-100 дахин бага байна.

Олон хэмжээст DBMS нь харилцааны DBMS-тэй харьцуулахад гадаад санах ойг ашиглахад маш үр ашиггүй байдаг. Ихэнх тохиолдолд мэдээллийн гиперкуб нь маш сийрэг байдаг бөгөөд өгөгдөл нь дараалсан хэлбэрээр хадгалагддаг тул хоосон утгыг зөвхөн оновчтой эрэмбэлэх дарааллыг сонгох замаар арилгах боломжтой бөгөөд энэ нь өгөгдлийг хамгийн том тасралтгүй байдлаар зохион байгуулах боломжийг олгодог. бүлгүүд. Гэхдээ энэ тохиолдолд асуудал зөвхөн хэсэгчлэн шийдэгддэг. Нэмж дурдахад, сийрэг өгөгдлийг хадгалах хамгийн оновчтой эрэмбэ дараалал нь асуулгад хамгийн түгээмэл хэрэглэгддэг дараалал биш байх магадлалтай. Тиймээс бодит системүүдэд мэдээллийн сангийн эзэлдэг дискний зайны хурд ба илүүдэл хоёрын хооронд буулт хийх шаардлагатай болдог.

Тиймээс олон хэмжээст DBMS ашиглах нь зөвхөн дараах нөхцлөөр зөвтгөгддөг.

Шинжилгээнд зориулсан анхны өгөгдлийн хэмжээ тийм ч том биш (хэдэн гигабайтаас ихгүй), өөрөөр хэлбэл өгөгдлийг нэгтгэх түвшин нэлээд өндөр байна.

Мэдээллийн хэмжүүрүүдийн багц нь тогтвортой байдаг (учир нь тэдгээрийн бүтцэд гарсан аливаа өөрчлөлт нь бараг үргэлж гиперкубын бүтцийн өөрчлөлтийг шаарддаг).

Системийн түр хүсэлтэд хариу өгөх хугацаа нь хамгийн чухал параметр юм.

Энэ нь гиперкуб эсүүд дээр хөндлөн хэмжээст тооцоолол хийх, түүний дотор захиалгат функцүүдийг бичих чадварыг багтаасан цогц функцуудыг өргөнөөр ашиглахыг шаарддаг.

Харилцааны OLAP (ROLAP)

Онлайн аналитик боловсруулалтын системд харилцааны мэдээллийн санг шууд ашиглах нь дараах давуу талуудтай.

Ихэнх тохиолдолд корпорацийн өгөгдлийн агуулахыг харилцааны DBMS ашиглан хэрэгжүүлдэг бөгөөд ROLAP хэрэгслүүд нь тэдгээрт шууд дүн шинжилгээ хийх боломжийг олгодог. Үүний зэрэгцээ, хадгалах хэмжээ нь MOLAP-тай адил чухал параметр биш юм.

Асуудлын хувьсах хэмжээсийн хувьд хэмжилтийн бүтцэд нэлээд олон удаа өөрчлөлт оруулах шаардлагатай үед R. OLAP системүүдХэмжээг динамик дүрслэх нь оновчтой шийдэл юм, учир нь ийм өөрчлөлтүүд нь тэдгээрийн доторх мэдээллийн санг физикээр өөрчлөн зохион байгуулах шаардлагагүй юм.

Харилцан хамаарал бүхий DBMS нь мэдээллийн хамгаалалтыг илүү өндөр түвшинд, хандалтыг хянах сайн чадамжийг өгдөг.

Олон хэмжээст DBMS-тэй харьцуулахад ROLAP-ийн гол сул тал нь гүйцэтгэл багатай байдаг. MOLAP-тай харьцуулахуйц гүйцэтгэлд хүрэхийн тулд харилцааны системүүд нь мэдээллийн сангийн схемийг сайтар боловсруулж, индексүүдийг тохируулахыг шаарддаг бөгөөд энэ нь DBA-аас ихээхэн хүчин чармайлт шаарддаг. Зөвхөн од схемийг ашиглах үед л сайн тохируулсан харилцааны системийн гүйцэтгэл нь олон хэмжээст мэдээллийн санд суурилсан системүүдийн гүйцэтгэлтэй ойролцоо байх болно.

Баримт ба мэдээллийн гол ялгаа нь бид өгөгдлийг хүлээн авч, тэмдэглэж авдаг, гэхдээ бид мэдээллийг өөрт ашигтайгаар ашиглаж чаддагт оршино. Товчхондоо мэдээлэлд дүн шинжилгээ хийж, системчилсэн мэдээлэл юм. Цаг тухайд нь хүлээн авсан мэдээллийн ачаар олон пүүс санхүүгийн хямралын нөхцөл байдал, ширүүн өрсөлдөөний нөхцөлд ч амьд үлдэж чадаж байна. Баримт цуглуулж, шаардлагатай бүх мэдээлэлтэй байх нь хангалтгүй юм. Та тэдгээрийг шинжлэх чадвартай хэвээр байх хэрэгтэй. Бизнесийн чухал шийдвэр гаргахад дуудагдсан хүмүүсийн ажлыг хөнгөвчлөхийн тулд янз бүрийн дэмжлэг үзүүлэх системийг боловсруулсан. Үүний тулд янз бүрийн нарийн төвөгтэй системүүдийг боловсруулсан бөгөөд энэ нь олон төрлийн бус өгөгдөлд дүн шинжилгээ хийж, тэдгээрийг бизнес хэрэглэгчдэд хэрэгтэй мэдээлэл болгон хувиргах боломжийг олгодог. Шинээр гарч ирж буй бизнесийн тагнуулын салбар нь мэдээллийн агуулах, технологийг ашиглан бизнесийн системийн үйл явцын хяналтыг сайжруулах зорилготой юм.

Өнөөдөр бизнесийн мэдээллийн системийн зах зээл нь аж ахуйн нэгжид удирдлагын нягтлан бодох бүртгэлийг зохион байгуулах, үйлдвэрлэл, борлуулалтын үйл ажиллагааны удирдлагыг хангах, үйлчлүүлэгчид болон ханган нийлүүлэгчидтэй үр дүнтэй харилцахад туслах олон төрлийн шийдлүүдийг санал болгож байна.

Бизнесийн системийн зах зээл дэх тусдаа байрыг аж ахуйн нэгжийн удирдлагын стратегийн түвшинд шийдвэр гаргахад дэмжлэг үзүүлэх зорилготой аналитик програм хангамжийн бүтээгдэхүүн эзэлдэг. Ийм хэрэгсэл ба үйл ажиллагааны удирдлагын тогтолцооны гол ялгаа нь сүүлийнх нь аж ахуйн нэгжийн удирдлагыг "ажиллагааны горим" -д, өөрөөр хэлбэл нарийн тодорхойлсон үйлдвэрлэлийн хөтөлбөрийг хэрэгжүүлэх боломжийг олгодог бол стратегийн түвшний аналитик системүүд нь аж ахуйн нэгжийн удирдлагад шийдвэр гаргахад тусалдаг. "хөгжлийн горим" -д.

Гүйцэтгэсэн өөрчлөлтийн цар хүрээ нь бүтцийн гүн гүнзгий өөрчлөлтөөс эхлээд бие даасан үйлдвэрлэлийн талбайн технологийг хэсэгчлэн шинэчлэх хүртэл өөр өөр байж болох ч ямар ч тохиолдолд шийдвэр гаргагчид аж ахуйн нэгжийн хувь заяа урт хугацаанд хамаарах хөгжлийн хувилбаруудыг авч үзэж байна.

Аж ахуйн нэгжийн мэдээллийн систем нь хичнээн хүчирхэг, хөгжсөн байсан ч эдгээр асуудлыг шийдвэрлэхэд тусалж чадахгүй, нэгдүгээрт, энэ нь суурин, тогтсон бизнесийн үйл явцад тохируулагдсан байдаг, хоёрдугаарт, шинэ үйл ажиллагааны талаар шийдвэр гаргах мэдээлэлгүй, боломжгүй байдаг. бизнесийн салбар, шинэ технологи, шинэ зохион байгуулалтын шийдвэр.

OLAP (On-Line Analytical Processing) өгөгдөл боловсруулах, дүн шинжилгээ хийх технологийн ачаар аливаа байгууллага ажилд шаардлагатай өгөгдлийг бараг тэр даруй (таван секундын дотор) авах боломжтой. OLAP-ийг таван түлхүүр үгээр товч тодорхойлж болно.

ШУУРХАЙ (Хурдан) - энэ нь шаардлагатай мэдээллийг хайж олох, гаргах хугацаа таван секундээс хэтрэхгүй гэсэн үг юм. Хамгийн энгийн хүсэлтийг нэг секундын дотор боловсруулдаг бөгөөд хэдхэн нарийн төвөгтэй хүсэлтийг боловсруулах хугацаа хорин секундээс илүү байдаг. Энэ үр дүнд хүрэхийн тулд өгөгдөл хадгалах тусгай хэлбэрээс эхлээд өргөн хүрээтэй урьдчилсан тооцоолол хүртэл янз бүрийн аргыг ашигладаг. Тиймээс өмнө нь хэдэн өдөр бэлтгэдэг байсан тайланг нэг минутын дотор авах боломжтой.

ШИНЖИЛГЭЭ (Аналитик) нь систем нь статистик болон логик аль алинд нь ямар ч дүн шинжилгээ хийх боломжтой бөгөөд дараа нь үүнийг хүртээмжтэй хэлбэрээр хадгалдаг гэж хэлдэг.

SHARED (Shared) гэдэг нь систем нь эсийн түвшинд хүртэл шаардлагатай нууцлалыг хангадаг гэсэн үг юм

MULTIDIMENSIONAL (Олон хэмжээст) - OLAP-ийн гол шинж чанар юм. Энэ нь байгууллагын бизнес болон үйл ажиллагаанд дүн шинжилгээ хийх хамгийн логик арга учраас систем нь шатлал, олон шатлалыг бүрэн дэмжих ёстой.

МЭДЭЭЛЭЛ (Мэдээлэл). Шаардлагатай мэдээлэлшаардлагатай газарт нь хүргэх ёстой.

Байгууллагын ажил нь үйл ажиллагааныхаа цар хүрээтэй холбоотой өгөгдөл байнга хуримтлагддаг бөгөөд заримдаа огт өөр газар хадгалагддаг бөгөөд тэдгээрийг нэгтгэх нь хэцүү бөгөөд цаг хугацаа их шаарддаг. Энэ нь шинээр гарч ирж буй бизнесийн таамаглалыг шалгахын тулд өгөгдөл олж авах ажлыг хурдасгахын тулд интерактив аналитик өгөгдөл боловсруулах технологи буюу OLAP-ийг боловсруулсан. Ийм OLAP системүүдийн гол зорилго нь дурын хэрэглэгчийн хүсэлтэд хурдан хариу өгөх явдал юм. Ийм хэрэгцээ нь зарим нэг чухал бизнесийн төслийг боловсруулах явцад ихэвчлэн бий болсон ажлын таамаглалыг хөгжүүлэгч шаардлагатай үед үүсдэг. Ихэнх тохиолдолд хэрэглэгчдэд шаардлагатай мэдээллийг ямар нэгэн хамаарлын хэлбэрээр танилцуулах ёстой - жишээлбэл, борлуулалтын хэмжээ нь бүтээгдэхүүний ангилал, борлуулалтын бүс, улирал гэх мэтээс хэрхэн хамаардаг. OLAP-ийн ачаар тэрээр сонгосон хугацаанд шаардлагатай мэдээллийг хүссэн загвараар нэн даруй авах боломжтой болсон.

Интерактив OLAP технологи нь танд хэрэгтэй, үнэн зөв мэдээлэл болгон хувиргах боломжийг олгодог.

Нэмж дурдахад, OLAP-ийн ачаар боловсруулалтын үр ашиг нэмэгдэж, хэрэглэгч их хэмжээний эрэмбэлэгдсэн (нийтгэсэн) мэдээллийг бараг тэр даруй хүлээн авах боломжтой. OLAP-ын ачаар хэрэглэгч өөрийн байгууллага хэр үр дүнтэй ажиллаж байгааг тодорхой харж, гадны өөрчлөлтөд түргэн шуурхай, уян хатан хариу үйлдэл үзүүлэх чадвартай, байгууллагынхаа санхүүгийн алдагдлыг багасгах чадвартай болсон. OLAP нь шийдвэр гаргах чадварыг сайжруулдаг үнэн зөв мэдээллээр хангадаг.

Бизнесийн тагнуулын системийн цорын ганц дутагдал нь тэдний өндөр өртөг юм. Хувийн мэдээллийн агуулахыг бий болгоход цаг хугацаа, маш их мөнгө шаардагдана.

OLAP технологийг бизнест ашиглах нь шаардлагатай мэдээллийг хурдан олж авах боломжийг олгодог бөгөөд хэрэглэгчийн хүсэлтээр ердийн хэлбэрээр - тайлан, график эсвэл хүснэгт хэлбэрээр танилцуулж болно.

Бизнесийн бүтцийг системийг нэгтгэх журам нь ERP, CRM, SCM-ийн хамтарсан шийдлүүдийг ашиглахад суурилдаг. Ихэнх тохиолдолд системийг өөр өөр үйлдвэрлэгчид нийлүүлдэг бөгөөд импортын өгөгдөл нь өгөгдлийг нэгтгэх, нэг төрлийн бус өгөгдөл болгон танилцуулах процессыг туулах ёстой. Бизнесийн орчинд хоёрдмол утгагүй шаардлагыг тавьдаг - мэдээллийн бүрэн дүн шинжилгээ нь нэгтгэсэн тайланг янз бүрийн өнцгөөс харах явдал юм.

Янз бүрийн үйлдвэрлэгчид өөр өөр өгөгдөл дүрслэх механизмтай байдаг. Нэг төрлийн бус танилцуулах процедур нь задлах, хувиргах, ачаалах (ETL) орно. Жишээлбэл, Microsoft-д SQL сервер 2005 Analysis Services нь өгөгдлийн нэгдлийн асуудлыг Data Source Views - аналитик харагдац загваруудыг дүрсэлсэн өгөгдлийн эх сурвалжийн төрлүүдийг ашиглан хэрэгжүүлдэг.

OLAP технологид суурилсан бизнесийн хэрэглээ, бүтээгдэхүүний жишээ. OLAP технологийн хамгийн түгээмэл хэрэглээ нь:

Мэдээллийн дүн шинжилгээ хийх.

OLAP хэрэгслүүдийг анх ашиглаж байсан бөгөөд одоо ч хамгийн алдартай ажил хэвээр байна. Олон хэмжээст өгөгдлийн загвар, их хэмжээний өгөгдөлд дүн шинжилгээ хийх чадвар, хүсэлтэд хурдан хариу үйлдэл үзүүлэх нь ийм системийг борлуулалт, маркетингийн үйл ажиллагаа, түгээлт болон бусад ажлуудад ихээхэн хэмжээний анхны өгөгдөлтэй дүн шинжилгээ хийхэд зайлшгүй шаардлагатай болгодог.

Бүтээгдэхүүний жишээ: Microsoft ExcelПивот хүснэгтүүд, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Санхүүгийн төлөвлөлт-төсвөө.

Олон хэмжээст загвар нь өгөгдлийг нэгэн зэрэг оруулах, тэдгээрийг хялбархан шинжлэх боломжийг олгодог (жишээлбэл, баримтын шинжилгээг төлөвлөх). Тиймээс цуврал орчин үеийн бүтээгдэхүүн CPM (Corporate Performance Management) ангиуд нь OLAP% загварыг ашигладаг. Чухал ажил бол нэгтгэсэн утга өөрчлөгдөх үед нарийвчилсан нүднүүдэд шаардлагатай өөрчлөлтийг тооцоолох боломжийг олгодог олон хэмжээст буцаах тооцоолол (буцах, задлах, буцаан бичих) юм. Энэ нь юу-хэрэв (ямар бол-бол) дүн шинжилгээ хийх хэрэгсэл юм, i.e. төлөвлөхдөө үйл явдлын янз бүрийн хувилбаруудыг тоглох.

Бүтээгдэхүүний жишээ: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

санхүүгийн нэгдэл.

Хяналтын байгууллагууд (SOX, Basel II) болон компаниудын IPO хийх шаардлагыг чангатгаж байгаатай холбогдуулан өмчлөлийн хувь хэмжээ, төрөл бүрийн валют, дотоод эргэлтийг харгалзан олон улсын нягтлан бодох бүртгэлийн стандартын дагуу өгөгдлийг нэгтгэх нь яаралтай ажил юм. OLAP технологи нь нэгдсэн тайлангийн тооцоог хурдасгах, бүх үйл явцын ил тод байдлыг нэмэгдүүлэх боломжийг олгодог.

Бүтээгдэхүүний жишээ: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Өгөгдлийн агуулах ба онлайн аналитик боловсруулалт (OLAP) технологи
нь аливаа салбарын салшгүй хэсэг болж байгаа бизнесийн шийдвэр гаргахад туслах чухал элементүүд юм. OLAP технологийг бизнесийн тагнуулын хэрэгсэл болгон ашиглах нь илүү их хяналт, стратегийн мэдээллийг цаг тухайд нь авах боломжийг олгодог.
үр дүнтэй шийдвэр гаргахад хувь нэмэр оруулах мэдээлэл.
Энэ нь бодит таамаглалыг загварчлах, нөөцийг илүү үр ашигтай ашиглах боломжийг олгодог. OLAP нь байгууллагад зах зээлийн эрэлт хэрэгцээнд илүү хурдан хариу өгөх боломжийг олгодог.

Ном зүй:

1. Эрик Томсен. OLAP шийдлүүд: Олон хэмжээст мэдээллийн системийг бий болгох Хоёр дахь хэвлэл. Wiley Computer Publishing John Wiley & Sons, Inc., 2002.

2. OLAP зөвлөлийн цагаан баримт бичиг, http://www.olapcouncil.org/research/whtpaply.htm

3. Герд Штумм, Бернхард Гантер нар. Албан ёсны үзэл баримтлалын шинжилгээ _ Математикийн үндэс.

Мэдлэгийн санд сайн ажлаа илгээх нь энгийн зүйл юм. Доорх маягтыг ашиглана уу

Мэдлэгийн баазыг суралцаж, ажилдаа ашигладаг оюутнууд, аспирантууд, залуу эрдэмтэд танд маш их талархах болно.

Нийтэлсэн http://www.allbest.ru/

Курсын ажил

мэргэжлээр: Мэдээллийн сан

Сэдэв: ТехнологиOLAP

Дууссан:

Чижиков Александр Александрович

Оршил

1. OLAP бүтээгдэхүүний ангилал

2. OLAP клиент - OLAP сервер: давуу болон сул талууд

3. OLAP системийн цөм

3.1 Барилгын зарчим

Дүгнэлт

Ашигласан эх сурвалжуудын жагсаалт

Хэрэглээ

ATудирдаж байна

Ороход хэцүү компьютерийн ертөнцнаад зах нь зөн совингийн түвшинд мэдээллийн сан гэж юу болох, яагаад хэрэгтэйг ойлгоогүй хүн. Уламжлалт харилцааны DBMS-ээс ялгаатай нь OLAP-ийн тухай ойлголт тийм ч түгээмэл биш боловч "OLAP куб" гэсэн нууцлаг нэр томъёог бараг бүх хүн сонссон байх. Онлайн аналитик боловсруулалт гэж юу вэ?

OLAP нь нэг програм хангамжийн бүтээгдэхүүн биш, програмчлалын хэл биш, тэр ч байтугай тодорхой технологи биш юм. Хэрэв та OLAP-ыг бүх илрэлээр нь хамруулах гэж оролдвол энэ нь шинжээчдэд өгөгдөлд хандахад хялбар болгодог програм хангамжийн бүтээгдэхүүний үндэс суурь болох ойлголт, зарчим, шаардлагуудын багц юм. Хэдийгээр ийм тодорхойлолттой санал нийлэх хүн бараг байхгүй ч энэ нь мэргэжилтэн бус хүмүүсийг энэ сэдвийг ойлгоход нэг хором ойртуулна гэдэг нь эргэлзээтэй. Тиймээс, OLAP-ийн мэдлэгийг хүсч байгаа бол өөр замаар явах нь дээр. Эхлээд та шинжээчид яагаад өгөгдөлд нэвтрэх боломжийг тусгайлан хөнгөвчлөх шаардлагатайг олж мэдэх хэрэгтэй.

Баримт нь шинжээчид корпорацийн мэдээллийн онцгой хэрэглэгчид юм. Шинжээчдийн даалгавар бол том өгөгдлийн багц дахь хэв маягийг олох явдал юм. Тиймээс шинжээч ганц баримтад анхаарлаа хандуулахгүй, олон зуун, мянга мянган үйл явдлын талаархи мэдээлэл хэрэгтэй. Дашрамд хэлэхэд, OLAP-ийг бий болгоход хүргэсэн чухал цэгүүдийн нэг бол бүтээмж, үр ашиг юм. Шинжээч мэдээлэл авах шаардлагатай үед юу болохыг төсөөлөөд үз дээ, мөн OLAP хэрэгслүүд аж ахуйн нэгжид байхгүй байна. Шинжээч нь бие даан (энэ нь магадлал багатай) эсвэл програмистын тусламжтайгаар тохирох SQL асуулга хийж, сонирхож буй өгөгдлийг тайлан хэлбэрээр хүлээн авах эсвэл хүснэгтэд экспортолдог. Үүнтэй холбоотой асуудал маш их байна. Нэгдүгээрт, шинжээч нь ажлаасаа өөр зүйл хийхээс өөр аргагүйд хүрдэг (SQL програмчлал) эсвэл програмистууд түүнд зориулж даалгавраа хийхийг хүлээх - энэ бүхэн хөдөлмөрийн бүтээмжид сөргөөр нөлөөлж, зүрхний шигдээс, цус харвалтын давтамжийг нэмэгдүүлдэг гэх мэт. Хоёрдугаарт, нэг тайлан эсвэл хүснэгт нь дүрмээр бол бодлын аваргууд болон Оросын шинжилгээний эцгүүдийг аврахгүй - бүх процедурыг дахин дахин давтах шаардлагатай болно. Гуравдугаарт, бид аль хэдийн олж мэдсэнээр шинжээчид жижиг зүйл шаарддаггүй - тэдэнд бүх зүйл нэг дор хэрэгтэй байдаг. Энэ нь (хэдийгээр технологи үсрэнгүй хөгжиж байгаа ч) шинжээчийн хандсан аж ахуйн нэгжийн харилцааны мэдээллийн баазын сервер нь гүн гүнзгий, удаан хугацаанд бодож сэтгэж, бусад гүйлгээг хааж чадна гэсэн үг юм.

OLAP-ийн үзэл баримтлал нь шийдвэрлэхийн тулд яг тодорхой гарч ирсэн ижил төстэй асуудлууд. OLAP куб нь үндсэндээ мета тайлан юм. Мета тайланг (шоо, өөрөөр хэлбэл) хэмжигдэхүүнээр нь огтолсноор шинжээч нь түүний сонирхсон "ердийн" хоёр хэмжээст тайланг хүлээн авдаг (эдгээр нь тухайн нэр томъёоны ердийн утгаараа тайлан байх албагүй - бид өгөгдлийн бүтцийн тухай ярьж байна). ижил функцтэй). Шоо дөрвөлжингийн давуу тал нь тодорхой байдаг - шоо бүтээхдээ зөвхөн нэг удаа харилцааны DBMS-ээс өгөгдөл хүсэх шаардлагатай. Дүрмээр бол шинжээчид нэмэлт, өөрчлөлттэй мэдээлэлтэй ажилладаггүй тул үүссэн куб нь нэлээд удаан хугацаанд хамааралтай байдаг. Үүний ачаар харилцааны DBMS серверийн үйл ажиллагааны тасалдал арилаад зогсохгүй (мянган, сая хариултын шугам бүхий асуулга байхгүй), харин шинжээчийн хувьд өгөгдөлд нэвтрэх хурд эрс нэмэгддэг. Нэмж дурдахад, шоо барих үед шаталсан дэд нийлбэр болон бусад нэгтгэсэн утгыг тооцоолох замаар гүйцэтгэлийг сайжруулдаг.

Мэдээжийн хэрэг, ийм байдлаар бүтээмжийг нэмэгдүүлэхийн тулд та төлөх ёстой. Заримдаа өгөгдлийн бүтэц зүгээр л "дэлбэрэх" гэж хэлдэг - OLAP шоо нь анхны өгөгдлөөс хэдэн арав, бүр хэдэн зуу дахин их зай эзэлдэг.

Одоо бид OLAP хэрхэн ажилладаг, юугаар үйлчилдэг талаар бага зэрэг ойлгосон тул мэдлэгээ тодорхой хэмжээгээр албан ёсны болгож, энгийн хүний ​​хэл рүү синхрон орчуулахгүйгээр OLAP шалгуурыг өгөх нь зүйтэй юм. Эдгээр шалгуурыг (нийт 12) 1993 онд E.F. Кодд бол харилцааны DBMS, үүнтэй зэрэгцэн OLAP гэсэн ойлголтыг бүтээгч юм. Дараа нь OLAP бүтээгдэхүүнд тавигдах шаардлагыг тодорхойлсон FASMI тест гэж нэрлэгдэх болсон тул бид тэдгээрийг шууд авч үзэхгүй. FASMI гэдэг нь шалгалтын зүйл бүрийн нэрний товчлол юм.

Хурдан (хурдан).Энэ шинж чанар нь систем хэрэглэгчийн хүсэлтэд дунджаар таван секундын дотор хариу өгөх ёстой гэсэн үг юм; Гэсэн хэдий ч ихэнх хүсэлтийг нэг секундын дотор боловсруулдаг бөгөөд хамгийн төвөгтэй хүсэлтийг хорин секундын дотор боловсруулах ёстой. Сүүлийн үеийн судалгаанаас үзэхэд хэрэглэгч гучин секундээс илүү хугацаанд хүсэлтийг амжилттай биелүүлэхэд эргэлзэж эхэлдэг.

Шинжилгээ (аналитик).Систем нь бизнесийн хэрэглээний онцлогт тохирсон аливаа логик болон статистик дүн шинжилгээ хийх чадвартай байх ёстой бөгөөд үр дүнг эцсийн хэрэглэгчдэд хүртээмжтэй хэлбэрээр хадгалах ёстой. Шинжилгээний хэрэглүүр нь цагийн цувааны дүн шинжилгээ хийх, зардлын хуваарилалт, валют хөрвүүлэх, байгууллагын бүтцийн өөрчлөлтийг загварчлах болон бусад зарим аргуудыг багтааж болно.

Хуваалцсан (хуваалцсан).Систем нь өгөгдөлд хандах хандалтыг хязгаарлах, олон хэрэглэгчдийн нэгэн зэрэг ажиллах боломжийг хязгаарлах өргөн боломжийг олгох ёстой.

Олон хэмжээст (олон хэмжээст).Систем нь өгөгдлийн үзэл баримтлалын хувьд олон хэмжээст дүрслэл, түүний дотор бүрэн дэмжлэголон шатлал.

Мэдээлэл (мэдээлэл).Төрөл бүрийн програм хангамжийн бүтээгдэхүүний хүч нь боловсруулсан оролтын өгөгдлийн хэмжээгээр тодорхойлогддог. Өөр өөр OLAP системүүд өөр өөр хүчин чадалтай: дэвшилтэт OLAP шийдлүүд нь хамгийн жижиг системээс дор хаяж мянга дахин их өгөгдлийг боловсруулах боломжтой. OLAP хэрэглүүрийг сонгохдоо өгөгдлийн давхардал, шаардагдах RAM, дискний зайны ашиглалт, гүйцэтгэл, мэдээллийн сангуудтай нэгтгэх гэх мэт олон хүчин зүйлийг анхаарч үзэх хэрэгтэй.

1. OLAP бүтээгдэхүүний ангилал

Тиймээс, OLAP-ийн мөн чанар нь дүн шинжилгээ хийх анхны мэдээллийг олон хэмжээст шоо хэлбэрээр харуулсан бөгөөд үүнийг дур зоргоороо удирдаж, шаардлагатай мэдээллийн хэсгүүд - тайлангуудыг олж авах боломжтой байдагт оршино. Үүний зэрэгцээ, эцсийн хэрэглэгч кубыг янз бүрийн хэсгүүдэд (хэмжээст) өгөгдөл (баримт) автоматаар нэгтгэдэг олон хэмжээст динамик хүснэгт гэж үздэг бөгөөд тооцоолол, тайлангийн хэлбэрийг интерактив байдлаар удирдах боломжийг олгодог. Эдгээр үйлдлүүдийг OLAP хөдөлгүүр (эсвэл OLAP тооцоолох хөдөлгүүр) гүйцэтгэдэг.

Өнөөдрийг хүртэл дэлхийд OLAP технологийг хэрэгжүүлсэн олон бүтээгдэхүүн бий болсон. Тэдгээрийн хооронд шилжихэд хялбар болгохын тулд OLAP бүтээгдэхүүний ангиллыг ашигладаг: дүн шинжилгээ хийх өгөгдлийг хадгалах арга, OLAP машины байршлаар. OLAP бүтээгдэхүүний ангилал тус бүрийг нарийвчлан авч үзье.

Би өгөгдлийг хадгалах арга замаар ангилж эхэлье. Олон хэмжээст шоо нь эх сурвалж болон нэгтгэсэн өгөгдөл дээр суурилдаг гэдгийг сануулъя. Кубын эх сурвалж болон нэгтгэсэн өгөгдлийг хоёуланг нь харилцааны болон олон хэмжээст мэдээллийн санд хадгалах боломжтой. Иймээс одоогоор мэдээлэл хадгалах гурван аргыг ашиглаж байна: MOLAP (Олон хэмжээст OLAP), ROLAP (Relational OLAP), HOLAP (Hybrid OLAP). Үүний дагуу OLAP бүтээгдэхүүнийг өгөгдөл хадгалах аргын дагуу ижил төстэй гурван ангилалд хуваадаг.

1. MOLAP-ын хувьд эх сурвалж болон нэгтгэсэн өгөгдлийг олон хэмжээст мэдээллийн санд эсвэл олон хэмжээст орон нутгийн кубд хадгалдаг.

2. ROLAP бүтээгдэхүүнүүдэд эх өгөгдөл нь харилцааны өгөгдлийн санд эсвэл файлын сервер дээрх хавтгай локал хүснэгтэд хадгалагддаг. Нэг мэдээллийн сан дахь үйлчилгээний хүснэгтүүдэд нэгтгэсэн өгөгдлийг байрлуулж болно. Харилцааны мэдээллийн сангаас өгөгдлийг олон хэмжээст шоо болгон хувиргах нь OLAP хэрэгслийн хүсэлтээр явагддаг.

3. HOLAP архитектурыг ашиглах тохиолдолд эх өгөгдөл нь харилцааны өгөгдлийн санд үлддэг бол агрегатууд нь олон хэмжээстэд байрлана. OLAP шоо нь харилцааны болон олон хэмжээст өгөгдөл дээр суурилсан OLAP хэрэгслийн хүсэлтээр бүтээгддэг.

Дараагийн ангилал нь OLAP машины байршилд тулгуурладаг. Үүний үндсэн дээр OLAP бүтээгдэхүүнийг OLAP серверүүд болон OLAP үйлчлүүлэгчид гэж хуваадаг.

Серверийн OLAP хэрэгслүүдэд нэгтгэсэн өгөгдлийг тооцоолох, хадгалах ажлыг тусдаа процесс буюу серверээр гүйцэтгэдэг. Үйлчлүүлэгчийн програм нь зөвхөн сервер дээр хадгалагдсан олон хэмжээст кубуудын асуулгын үр дүнг хүлээн авдаг. Зарим OLAP серверүүд зөвхөн харилцааны мэдээллийн санг дэмждэг бол зарим нь зөвхөн олон хэмжээст мэдээллийн санг дэмждэг. Орчин үеийн олон OLAP серверүүд MOLAP, ROLAP, HOLAP гэсэн гурван мэдээлэл хадгалах аргыг дэмждэг.

OLAP клиент нь өөрөөр хийгдсэн байдаг. Олон хэмжээст шоо бүтээх, OLAP тооцоолол нь санах ойд хийгддэг үйлчлүүлэгч компьютер. OLAP үйлчлүүлэгчид нь мөн ROLAP болон MOLAP гэж хуваагддаг. Мөн зарим нь өгөгдөлд нэвтрэх хоёр сонголтыг хоёуланг нь дэмжиж болно.

Эдгээр аргууд тус бүр өөрийн давуу болон сул талуудтай. Үйлчлүүлэгчийн хэрэгслээс серверийн хэрэгслүүдийн давуу талтай гэсэн түгээмэл итгэл үнэмшлээс үл хамааран хэд хэдэн тохиолдолд хэрэглэгчдэд OLAP клиентийг ашиглах нь OLAP сервер ашиглахаас илүү үр дүнтэй бөгөөд илүү ашигтай байдаг.

2. OLAP клиент - OLAP сервер: давуу болон сул талууд

Барилга барих үед мэдээллийн систем OLAP функцийг сервер болон үйлчлүүлэгчийн OLAP хэрэгслээр хэрэгжүүлэх боломжтой. Практикт сонголт нь гүйцэтгэл болон програм хангамжийн өртөг хоёрын хооронд буулт хийсний үр дүн юм.

Өгөгдлийн хэмжээг дараах шинж чанаруудын хослолоор тодорхойлно: бичлэгийн тоо, хэмжээсийн тоо, хэмжээсийн элементийн тоо, хэмжээсийн урт, баримтын тоо. OLAP сервер нь ижил хэмжээний компьютерийн чадалтай OLAP клиентээс илүү их хэмжээний өгөгдлийг боловсруулах чадвартай гэдгийг мэддэг. Учир нь OLAP сервер нь урьдчилан тооцоолсон шоо агуулсан хатуу диск дээр олон хэмжээст мэдээллийн санг хадгалдаг.

OLAP үйлдлүүдийг гүйцэтгэх үед үйлчлүүлэгч програмууд нь SQL-тэй төстэй хэлээр асуулга гүйцэтгэдэг бөгөөд кубыг бүхэлд нь биш харин түүний харуулсан фрагментуудыг хүлээн авдаг. Ажлын үед OLAP үйлчлүүлэгч байх ёстой санамсаргүй хандалт санах ойбүх шоо. ROLAP архитектурын хувьд кубыг тооцоолоход ашигласан бүх өгөгдлийн массивыг эхлээд санах ойд ачаалах ёстой. Мөн хэмжигдэхүүн, баримт эсвэл хэмжээсийн гишүүдийн тоо нэмэгдэхийн хэрээр нэгтгэлийн тоо экспоненциалаар нэмэгддэг. Тиймээс OLAP үйлчлүүлэгчийн боловсруулсан өгөгдлийн хэмжээ нь хэрэглэгчийн компьютер дээрх RAM-ийн хэмжээнээс шууд хамаардаг.

Гэсэн хэдий ч ихэнх OLAP үйлчлүүлэгчид хуваарилагдсан тооцоолол хийдэг гэдгийг анхаарна уу. Тиймээс үйлчлүүлэгчийн OLAP хэрэгслийн ажлыг хязгаарлаж буй боловсруулсан бичлэгийн тоог корпорацийн мэдээллийн сангийн анхдагч өгөгдлийн хэмжээ биш, харин түүнээс цуглуулсан түүврийн хэмжээ гэж ойлгодог. OLAP үйлчлүүлэгч нь анхдагч өгөгдлийг урьдчилан бүлэглэх алгоритм болон шүүлтүүрийн нөхцөлийг тодорхойлсон DBMS-д асуулга үүсгэдэг. Сервер нь цаашдын OLAP тооцоололд зориулж авсаархан сонголтыг олж, бүлэглэж, буцаана. Энэ түүврийн хэмжээ нь анхдагч, нэгтгэгдээгүй бичлэгийн хэмжээнээс хэдэн арав, хэдэн зуу дахин бага байж болно. Иймээс PC-ийн нөөцөд ийм OLAP үйлчлүүлэгчийн хэрэгцээ эрс багассан.

Үүнээс гадна хэмжээсийн тоо нь хүний ​​ойлголтын боломжоор хязгаарлагддаг. Дундаж хүн 3-4, хамгийн ихдээ 8 хэмжигдэхүүнийг нэгэн зэрэг ажиллуулж чаддаг нь мэдэгдэж байна. Динамик хүснэгтэд илүү олон тооны хэмжээсүүд байгаа тул мэдээллийг хүлээн авах нь илүү хэцүү байдаг. OLAP үйлчлүүлэгчид хэрэгтэй байж болох RAM-ийг урьдчилан тооцоолохдоо энэ хүчин зүйлийг анхаарч үзэх хэрэгтэй.

Хэмжээний урт нь OLAP кубыг тооцоолоход ашигладаг OLAP хэрэгслийн хаягийн зайд мөн нөлөөлдөг. Хэмжээ урт байх тусам олон хэмжээст массивыг эрэмбэлэхийн тулд илүү их нөөц шаардагдана, мөн эсрэгээр. Зөвхөн эх өгөгдлийн богино хэмжилтүүд нь OLAP үйлчлүүлэгчийн талд байгаа өөр нэг аргумент юм.

Энэ шинж чанар нь дээр дурдсан хоёр хүчин зүйлээр тодорхойлогддог: боловсруулж буй өгөгдлийн хэмжээ, компьютерийн хүч. Жишээлбэл, хэмжээсийн тоо нэмэгдэхийн хэрээр дүүргэгчийн тоо мэдэгдэхүйц нэмэгдсэний улмаас бүх OLAP хэрэгслийн гүйцэтгэл буурч байгаа боловч үүнтэй зэрэгцэн буурах хурд өөр байна. Энэ хамаарлыг графикаар харуулъя.

Диаграм 1. Өгөгдлийн өсөлтөөс үйлчлүүлэгч болон серверийн OLAP хэрэгслүүдийн гүйцэтгэлийн хамаарал

OLAP серверийн гүйцэтгэлийн шинж чанарууд нь өгөгдлийн өсөлтөд бага мэдрэмтгий байдаг. Энэ нь OLAP сервер болон OLAP клиентээр хэрэглэгчийн хүсэлтийг боловсруулах өөр өөр технологитой холбоотой юм. Жишээлбэл, өрөмдлөгийн үед OLAP сервер хадгалагдсан өгөгдөлд хандаж, энэ "салбар"-ын өгөгдлийг "татах". Харин OLAP клиент нь ачаалах үед бүхэл бүтэн агрегатуудыг тооцоолдог. Гэсэн хэдий ч тодорхой хэмжээний өгөгдөл хүртэл сервер болон клиент хэрэгслийн гүйцэтгэлийг харьцуулж болно. Түгээмэл тооцооллыг дэмждэг OLAP үйлчлүүлэгчдийн хувьд гүйцэтгэлийг харьцуулах талбар нь асар олон тооны хэрэглэгчдийн OLAP шинжилгээний хэрэгцээг хамарсан өгөгдлийн хэмжээг хамарч болно. Үүнийг MS OLAP Server болон OLAP клиент "Contour Standard"-ын дотоод туршилтын үр дүнгээр баталж байна. Туршилтыг IBM PC Pentium Celeron 400 MHz, 256 Mb дээр 10-аас 70 гишүүнтэй 7 хэмжигдэхүүн бүхий 1 сая өвөрмөц (өөрөөр хэлбэл нэгтгэсэн) бичлэгийн түүвэрт хийсэн. Хоёр тохиолдолд шоо ачаалах хугацаа 1 секундээс хэтрэхгүй бөгөөд янз бүрийн OLAP үйлдлүүд (өрөмдөх, өрөмдөх, зөөх, шүүх гэх мэт) секундын зуутын нэгээр гүйцэтгэгдэнэ.

Түүврийн хэмжээ нь RAM-ийн хэмжээнээс хэтэрсэн тохиолдолд дискийг солих ажиллагаа эхэлж, OLAP клиентийн гүйцэтгэл огцом буурдаг. Зөвхөн энэ мөчөөс эхлэн бид OLAP серверийн давуу талыг ярьж болно.

"Эвдрэлийн цэг" нь OLAP шийдлийн өртгийн огцом өсөлтийн хил хязгаарыг тодорхойлдог гэдгийг санах нь зүйтэй. Тодорхой хэрэглэгч бүрийн даалгаврын хувьд энэ цэгийг OLAP үйлчлүүлэгчийн гүйцэтгэлийн тестээр амархан тодорхойлдог. Ийм туршилтыг хөгжүүлэгч компаниас авч болно.

Түүнчлэн, сервер талын OLAP шийдлийн өртөг хэрэглэгчдийн тоо нэмэгдэх тусам нэмэгддэг. Баримт нь OLAP сервер нь нэг компьютер дээрх бүх хэрэглэгчдэд зориулсан тооцоолол хийдэг. Үүний дагуу хэрэглэгчдийн тоо их байх тусам RAM болон процессорын хүч их байх болно. Тиймээс, хэрэв боловсруулсан өгөгдлийн хэмжээ нь сервер ба үйлчлүүлэгчийн системийн харьцуулж болохуйц гүйцэтгэлийн талбарт оршдог бол бусад зүйлс ижил байвал OLAP клиентийг ашиглах нь илүү ашигтай байх болно.

"Сонгодог" үзэл баримтлалд OLAP серверийг ашиглах нь харилцааны DBMS-ээс өгөгдлийг олон хэмжээст мэдээллийн санд байршуулах явдал юм. Байршуулах нь тодорхой хугацаанд хийгддэг тул OLAP серверийн өгөгдөл нь одоогийн төлөвийг тусгаагүй болно. Зөвхөн ROLAP горимыг дэмждэг OLAP серверүүд энэ дутагдлаас салсан.

Үүний нэгэн адил олон тооны OLAP үйлчлүүлэгчид мэдээллийн санд шууд хандах боломжтой ROLAP болон Desktop архитектуруудыг ашиглахыг зөвшөөрдөг. Энэ нь анхны өгөгдөлд онлайн дүн шинжилгээ хийх боломжийг олгодог.

OLAP сервер нь үйлчлүүлэгчийн терминалын хүчин чадалд хамгийн бага шаардлага тавьдаг. Объектив байдлаар, OLAP үйлчлүүлэгчийн шаардлага илүү өндөр байдаг, учир нь Энэ нь хэрэглэгчийн компьютерийн RAM-д тооцооллыг гүйцэтгэдэг. Тухайн байгууллагын техник хангамжийн флотын нөхцөл нь OLAP хэрэгслийг сонгохдоо анхаарах ёстой чухал хүчин зүйл юм. Гэхдээ энэ нь бас давуу болон сул талуудтай. OLAP сервер нь өнөөгийн персонал компьютеруудын асар их боловсруулалтын хүчийг ашигладаггүй. Хэрэв байгууллага аль хэдийн орчин үеийн компьютерийн флоттой бол тэдгээрийг зөвхөн дэлгэцийн терминал болгон ашиглах нь үр ашиггүй бөгөөд төв серверт нэмэлт зардал гарах болно.

Хэрэглэгчийн компьютерийн хүч нь "хүссэн зүйлээ үлдээвэл" OLAP клиент удаан ажиллах эсвэл огт ажиллахгүй болно. Нэг хүчирхэг сервер худалдаж авах нь бүх компьютерийг шинэчлэхээс хамаагүй хямд байх болно.

Энд техник хангамжийн хөгжлийн чиг хандлагыг харгалзан үзэх нь зүйтэй. Шинжилгээнд зориулсан өгөгдлийн хэмжээ бараг тогтмол байдаг тул PC-ийн эрчим хүчний тогтвортой өсөлт нь OLAP үйлчлүүлэгчдийн чадавхийг өргөжүүлэх, OLAP серверүүдийг маш том мэдээллийн сангийн сегмент рүү шилжүүлэхэд хүргэнэ.

OLAP серверийг ашиглах үед зөвхөн дэлгэцийн өгөгдлийг сүлжээгээр дамжуулан үйлчлүүлэгчийн компьютер руу илгээдэг бол OLAP клиент нь бүх үндсэн дээжийн өгөгдлийг хүлээн авдаг.

Тиймээс, OLAP үйлчлүүлэгч ашиглаж байгаа газар, сүлжээний урсгалилүү өндөр байх болно.

Гэхдээ OLAP серверийг ашиглах үед хэрэглэгчийн үйлдлүүд, жишээлбэл, өрөмдөж, олон хэмжээст мэдээллийн санд шинэ асуулга үүсгэж, улмаар шинэ өгөгдөл дамжуулах болно. OLAP үйлчлүүлэгчийн OLAP үйлдлүүдийг гүйцэтгэх нь RAM-д хийгддэг бөгөөд үүний дагуу сүлжээнд шинэ мэдээллийн урсгал үүсгэдэггүй.

Түүнчлэн орчин үеийн сүлжээ гэдгийг тэмдэглэх нь зүйтэй Техник хангамждамжуулах чадварыг өндөр түвшинд хангадаг.

Тиймээс дийлэнх тохиолдолд OLAP клиент ашиглан "дунд" хэмжээтэй мэдээллийн санд дүн шинжилгээ хийх нь хэрэглэгчийн ажлыг удаашруулахгүй.

OLAP серверийн үнэ нэлээд өндөр байдаг. Үүнд зориулалтын компьютерийн зардал болон олон хэмжээст мэдээллийн санг удирдах тогтмол зардлыг багтаасан байх ёстой. Нэмж дурдахад, OLAP серверийн хэрэгжилт, засвар үйлчилгээ нь ажилтнуудаас хангалттай өндөр ур чадвар шаарддаг.

OLAP үйлчлүүлэгчийн өртөг нь OLAP серверийн зардлаас хамаагүй бага юм. Серверийн удирдлага болон нэмэлт техникийн тоног төхөөрөмж шаардлагагүй. OLAP үйлчлүүлэгчийг хэрэгжүүлэхэд боловсон хүчний мэргэшилд өндөр шаардлага тавьдаггүй. OLAP клиентийг OLAP серверээс хамаагүй хурдан байрлуулж болно.

Үйлчлүүлэгчийн OLAP хэрэгслийг ашиглан аналитик програмуудыг хөгжүүлэх нь жүжигчний тусгай сургалт шаарддаггүй хурдан процесс юм. Мэдээллийн сангийн бодит хэрэгжилтийг мэддэг хэрэглэгч мэдээллийн технологийн мэргэжилтний оролцоогүйгээр аналитик програмыг бие даан боловсруулж болно. OLAP сервер ашиглахдаа та 2-ыг сурах хэрэгтэй өөр өөр системүүд, заримдаа өөр өөр үйлдвэрлэгчдээс, сервер дээр куб үүсгэх, үйлчлүүлэгчийн програмыг хөгжүүлэх. OLAP клиент нь кубыг дүрслэх, хэрэглэгчийн интерфэйсийг өөрчлөхөд зориулсан нэг визуал интерфейсээр хангадаг.

Үйлчлүүлэгчийн хэрэгслийг ашиглан OLAP програм үүсгэх үйл явцыг авч үзье.

Диаграм 2: ROLAP клиент хэрэгслийг ашиглан OLAP програмыг үүсгэ

ROLAP үйлчлүүлэгчдийн ажиллах зарчим нь эх өгөгдлийн физик бүтэц нуугдаж буй семантик давхаргын урьдчилсан тайлбар юм. Энэ тохиолдолд өгөгдлийн эх сурвалж нь локал хүснэгт, RDBMS байж болно. Дэмжигдсэн мэдээллийн эх сурвалжуудын жагсаалтыг тухайн програм хангамжийн бүтээгдэхүүнээр тодорхойлно. Үүний дараа хэрэглэгч шоо болон аналитик интерфэйс үүсгэхийн тулд субьектийн талбарт ойлгосон объектуудыг бие даан удирдах боломжтой.

OLAP серверийн үйлчлүүлэгчийн ажиллах зарчим өөр. OLAP серверт куб үүсгэх үед хэрэглэгч өөрчилдөг физик тодорхойлолтуудДБ.

Энэ нь куб дотор тусгай тайлбарыг бий болгодог. OLAP серверийн клиентийг зөвхөн куб хэлбэрээр тохируулсан.

Динамик борлуулалтын тайланг үүсгэх жишээн дээр ROLAP үйлчлүүлэгч хэрхэн ажилладагийг тайлбарлая (Зураг 2-г үзнэ үү). Шинжилгээний анхны өгөгдлийг Борлуулалт ба Хэлэлцээр гэсэн хоёр хүснэгтэд хадгална.

Семаль давхарга үүсгэх үед өгөгдлийн эх сурвалжууд - Борлуулалт ба Хэлэлцээрийн хүснэгтүүд нь эцсийн хэрэглэгчдэд ойлгомжтой үг хэллэгээр тодорхойлогддог бөгөөд "Бүтээгдэхүүн", "Хэлэлцээ" болж хувирдаг. "Бүтээгдэхүүн" хүснэгтийн "ID" талбарыг "Код", "Нэр" нь "Бүтээгдэхүүн" гэх мэтээр өөрчилсөн.

Дараа нь Борлуулалтын бизнесийн объект бий болно. Бизнесийн объект нь хавтгай ширээ бөгөөд үүний үндсэн дээр олон хэмжээст шоо үүсдэг. Бизнесийн объект үүсгэх үед "Бүтээгдэхүүн" ба "Хэлэлцээ" хүснэгтүүдийг тухайн бүтээгдэхүүний "Код" талбарт нэгтгэдэг. Тайлан нь хүснэгтийн бүх талбарыг харуулах шаардлагагүй тул бизнесийн объект нь зөвхөн Зүйл, Огноо, Дүн талбаруудыг ашигладаг.

Дараа нь бизнесийн объект дээр үндэслэн OLAP тайланг үүсгэнэ. Хэрэглэгч бизнесийн объектыг сонгож, түүний шинж чанаруудыг тайлангийн хүснэгтийн багана эсвэл мөр хэсэгт чирнэ. Бидний жишээн дээр "Борлуулалт" бизнесийн объект дээр үндэслэн барааны борлуулалтын тайланг сараар хийсэн.

Интерактив тайлантай ажиллахдаа хэрэглэгч хулганын ижил энгийн хөдөлгөөнөөр шүүх болон бүлэглэх нөхцлийг тохируулах боломжтой. Энэ үед ROLAP клиент кэш дэх өгөгдөлд ханддаг. OLAP серверийн үйлчлүүлэгч олон хэмжээст мэдээллийн санд шинэ асуулга үүсгэдэг. Жишээлбэл, борлуулалтын тайланд бүтээгдэхүүний шүүлтүүрийг ашигласнаар та бидний сонирхсон бүтээгдэхүүний борлуулалтын тайланг авах боломжтой.

OLAP програмын бүх тохиргоог зориулалтын мета өгөгдлийн сан, программ эсвэл олон хэмжээст мэдээллийн сангийн системийн репозиторт хадгалах боломжтой. Хэрэгжилт нь тодорхой програм хангамжийн бүтээгдэхүүнээс хамаарна.

Тэгэхээр ямар тохиолдолд хэрэглэгчдэд OLAP клиент ашиглах нь OLAP сервер ашиглахаас илүү үр дүнтэй, ашигтай байж болох вэ?

OLAP серверийг ашиглах эдийн засгийн үндэслэл нь өгөгдлийн хэмжээ маш том бөгөөд OLAP үйлчлүүлэгчийн хувьд тэсвэрлэх чадваргүй үед үүсдэг, эс тэгвээс сүүлийнх нь ашиглах нь илүү үндэслэлтэй байдаг. Энэ тохиолдолд OLAP клиент нь өндөр гүйцэтгэл, хямд өртөгтэй хослуулсан.

Хүчирхэг шинжээчдийн компьютер нь OLAP үйлчлүүлэгчдийн талд байгаа өөр нэг аргумент юм. OLAP серверийг ашиглах үед эдгээр хүчин чадлыг ашигладаггүй. OLAP үйлчлүүлэгчийн бусад давуу талууд нь:

OLAP клиентийг хэрэгжүүлэх, засвар үйлчилгээ хийх зардал нь OLAP серверийн зардлаас хамаагүй бага юм.

OLAP клиентийг суулгагдсан машинтай ашиглах үед сүлжээгээр өгөгдөл дамжуулах нь нэг удаа тохиолддог. OLAP үйлдлийг гүйцэтгэх үед шинэ өгөгдлийн урсгал үүсдэггүй.

ROLAP үйлчлүүлэгчдийг тохируулах нь завсрын холбоосыг арилгах замаар хялбаршуулсан - олон хэмжээст мэдээллийн сан үүсгэх.

3. OLAP системийн цөм

3.1 Барилгын зарчим

програмын үйлчлүүлэгчийн үндсэн өгөгдөл

Өмнө дурьдсан зүйлсээс харахад OLAP механизм нь өнөө үед хамгийн түгээмэл өгөгдөлд дүн шинжилгээ хийх аргуудын нэг болох нь тодорхой байна. Энэ асуудлыг шийдэх хоёр үндсэн арга байдаг. Тэдгээрийн эхнийх нь олон хэмжээст OLAP (MOLAP) гэж нэрлэгддэг - сервер талын олон хэмжээст мэдээллийн баазыг ашиглан механизмыг хэрэгжүүлэх, хоёр дахь нь Relational OLAP (ROLAP) - харилцааны DBMS-д SQL асуулгад үндэслэн шоо үүсгэх. Эдгээр аргууд тус бүр өөрийн давуу болон сул талуудтай. Тэдний харьцуулсан дүн шинжилгээ нь энэ ажлын хамрах хүрээнээс гадуур юм. Зөвхөн ширээний ROLAP модулийн үндсэн хэрэгжилтийг энд тайлбарлах болно.

Borland Delphi-ийн нэг хэсэг болох Decision Cube бүрэлдэхүүн хэсгүүд дээр суурилсан ROLAP системийг ашигласны дараа ийм даалгавар гарч ирэв. Харамсалтай нь энэ багц бүрэлдэхүүн хэсгүүдийг ашиглах нь их хэмжээний өгөгдөл дээр муу гүйцэтгэлийг харуулсан. Барилгын шоо руу оруулахаасаа өмнө аль болох их өгөгдлийг таслахыг оролдох замаар энэ асуудлыг багасгаж болно. Гэхдээ энэ нь үргэлж хангалттай байдаггүй.

Интернет болон хэвлэлээс та OLAP системийн талаар маш их мэдээлэл олж авах боломжтой боловч дотор нь хэрхэн ажилладаг талаар бараг хаана ч байдаггүй.

Ажлын схем:

Ширээний OLAP системийн ерөнхий схемийг дараах байдлаар илэрхийлж болно.

Схем 3. Ширээний OLAP системийн ажил

Ажлын алгоритм нь дараах байдалтай байна.

1. Хавтгай хүснэгт буюу үр дүнгийн хэлбэрээр өгөгдөл олж авах SQL гүйцэтгэлхүсэлт.

2. Өгөгдлийг кэш хийж олон хэмжээст шоо болгон хувиргах.

3. Баригдсан кубыг хөндлөн таб эсвэл график ашиглан харуулах гэх мэт. Ерөнхийдөө нэг шоо дээр дурын тооны зураглалыг холбож болно.

Ийм системийг дотооддоо хэрхэн зохион байгуулж болохыг авч үзье. Таны харж, мэдэрч байгаа талаас нь, өөрөөр хэлбэл зураглалаас эхэлье. OLAP системд ашигладаг дэлгэцүүд нь ихэвчлэн хоёр төрлийн байдаг - хөндлөн хүснэгт ба диаграм. Кубыг харуулах үндсэн бөгөөд хамгийн түгээмэл арга болох хөндлөн табыг авч үзье.

Доорх зурагт нэгтгэсэн үр дүнг агуулсан мөр, баганыг шараар, баримт агуулсан нүдийг цайвар сааралаар, хэмжээсийн өгөгдөл агуулсан нүдийг хар саарал өнгөөр ​​тус тус тэмдэглэв.

Тиймээс хүснэгтийг дараахь элементүүдэд хувааж болох бөгөөд бид ирээдүйд ажиллах болно.

Матрицыг баримтаар дүүргэхдээ бид дараах байдлаар ажиллах ёстой.

Хэмжилтийн өгөгдөл дээр үндэслэн матрицад нэмсэн элементийн координатыг тодорхойлно.

Нэмэгдэж буй элементийн нөлөөлөлд өртсөн нийт дүнгийн багана, мөрүүдийн координатыг тодорхойлно.

Матриц болон нийт дүнгийн харгалзах багана, мөрүүдэд элемент нэмнэ үү.

Үүний зэрэгцээ, үүссэн матриц нь маш сийрэг байх болно гэдгийг тэмдэглэх нь зүйтэй бөгөөд яагаад түүний зохион байгуулалт нь хэлбэрээр хоёр хэмжээст массив(гадаргуу дээр хэвтэх хувилбар) нь үндэслэлгүй төдийгүй энэ матрицын том хэмжээсээс болж боломжгүй зүйл бөгөөд үүнд ямар ч хэмжээний RAM хадгалахад хангалттай биш юм. Жишээлбэл, хэрэв манай шоо нэг жилийн борлуулалтын мэдээллийг агуулж байгаа бөгөөд энэ нь зөвхөн 3 хэмжигдэхүүнтэй - Хэрэглэгч (250), Бүтээгдэхүүн (500), Огноо (365) байвал бид дараах хэмжигдэхүүнүүдийн баримтын матрицыг авах болно: тоо. элементүүд = 250 x 500 x 365 = 45,625,000. Мөн энэ нь матрицад хэдхэн мянган дүүргэсэн элемент байж болох ч гэсэн. Түүнээс гадна хэмжээсүүдийн тоо их байх тусам матриц нь сийрэг болно.

Тиймээс энэ матрицтай ажиллахын тулд сийрэг матрицтай ажиллах тусгай механизмуудыг ашиглах хэрэгтэй. Сийрэг матрицыг зохион байгуулах янз бүрийн сонголтууд боломжтой. Тэдгээрийг Дональд Кнутын сонгодог "Програмчлалын урлаг" номын эхний боть зэрэг програмчлалын уран зохиолд нэлээд сайн баримтжуулсан байдаг.

Одоо баримтын координатыг хэрхэн тодорхойлох, түүнд тохирох хэмжээсүүдийг мэдэж авцгаая. Үүнийг хийхийн тулд толгойн бүтцийг нарийвчлан авч үзье.

Энэ тохиолдолд та харгалзах нүдний тоо, тэдгээрийн нийлбэр дүнг тодорхойлох аргыг хялбархан олох боломжтой. Энд хэд хэдэн аргыг санал болгож болно. Нэг нь модыг ашиглан тохирох эсийг олох явдал юм. Энэ модыг дээжээр дамжуулж барьж болно. Үүнээс гадна шаардлагатай координатыг тооцоолохын тулд аналитик рекурсив томъёог хялбархан тодорхойлж болно.

Хүснэгтэд хадгалагдсан өгөгдлийг ашиглахын тулд хөрвүүлэх шаардлагатай. Тиймээс, гиперкуб бүтээхдээ гүйцэтгэлийг сайжруулахын тулд шоо хэмжээс бүхий баганад хадгалагдсан өвөрмөц элементүүдийг олох нь зүйтэй юм. Нэмж дурдахад та ижил хэмжигдэхүүнтэй бичлэгийн баримтуудыг урьдчилан нэгтгэж болно. Дээр дурдсанчлан хэмжээсийн талбарт байгаа өвөрмөц утгууд нь бидний хувьд чухал юм. Дараа нь тэдгээрийг хадгалах дараах бүтцийг санал болгож болно.

Схем 4. Өвөрмөц утгыг хадгалах бүтэц

Энэ бүтцийг ашигласнаар бид санах ойн хэрэгцээг эрс багасгадаг. Энэ нь нэлээд хамааралтай, учир нь. Ажлын хурдыг нэмэгдүүлэхийн тулд өгөгдлийг RAM-д хадгалах нь зүйтэй. Нэмж дурдахад, та зөвхөн элементийн массивыг хадгалж, тэдгээрийн утгыг диск рүү байршуулах боломжтой, учир нь бидэнд зөвхөн хөндлөн табыг харуулах үед л хэрэгтэй болно.

Дээр дурдсан санаанууд нь CubeBase бүрэлдэхүүн хэсгүүдийн санг үүсгэх үндэс суурь болсон.

Схем 5. CubeBase бүрэлдэхүүн хэсгийн номын сангийн бүтэц

TСubeSource нь кэш хийх, өгөгдлийг дотоод формат руу хөрвүүлэх, мөн өгөгдлийг урьдчилсан байдлаар нэгтгэх ажлыг гүйцэтгэдэг. TСubeEngine бүрэлдэхүүн хэсэг нь гиперкубыг тооцоолж, түүнтэй үйлдлүүдийг гүйцэтгэдэг. Үнэн хэрэгтээ энэ нь хавтгай хүснэгтийг олон хэмжээст өгөгдлийн багц болгон хувиргадаг OLAP машин юм. TCubeGrid бүрэлдэхүүн хэсэг нь хөндлөн табыг харуулж, гиперкубын дэлгэцийг хянадаг. TСubeChart нь гиперкубыг график хэлбэрээр харах боломжийг олгодог бөгөөд TСubePivote бүрэлдэхүүн хэсэг нь кубын цөмийн ажиллагааг хянадаг.

Тиймээс би OLAP машин бүтээхэд ашиглаж болох бүрэлдэхүүн хэсгүүдийн архитектур, харилцан үйлчлэлийн талаар авч үзсэн. Одоо бүрэлдэхүүн хэсгүүдийн дотоод бүтцийг нарийвчлан авч үзье.

Системийн эхний үе шат нь өгөгдлийг ачаалж, дотоод формат руу хөрвүүлэх явдал юм. Асуулт логик байх болно - энэ нь яагаад шаардлагатай вэ, учир нь та зүгээр л хавтгай хүснэгтээс өгөгдлийг ашиглаж, шоо зүсмэлийг бүтээхдээ харж болно. Энэ асуултад хариулахын тулд хүснэгтийн бүтцийг OLAP машины үүднээс авч үзье. OLAP системийн хувьд хүснэгтийн баганууд нь баримт эсвэл хэмжээс байж болно. Энэ тохиолдолд эдгээр баганатай ажиллах логик өөр байх болно. Гиперкубын хувьд хэмжээсүүд нь үнэндээ тэнхлэгүүд бөгөөд хэмжээсийн утга нь тэдгээр тэнхлэг дээрх координатууд юм. Энэ тохиолдолд кубыг маш жигд бус дүүргэх болно - ямар ч бүртгэлтэй тохирохгүй координатын хослолууд байх бөгөөд эх хүснэгтийн хэд хэдэн бүртгэлтэй тохирох хослолууд байх болно, эхний нөхцөл байдал илүү нийтлэг байдаг, өөрөөр хэлбэл , шоо нь орчлон ертөнц шиг харагдах болно - цэгүүдийн бөөгнөрөл (баримт) тохиолддог тусдаа газруудад хоосон орон зай. Тиймээс, хэрэв бид байгаа бол ачаалах оосорМэдээллийн хувьд бид өгөгдлийг урьдчилан нэгтгэх болно, өөрөөр хэлбэл бид ижил хэмжлийн утгатай бичлэгүүдийг нэгтгэж, урьдчилсан нэгтгэсэн баримтын утгыг тооцоолох бөгөөд ирээдүйд бид цөөн тооны бүртгэлтэй ажиллах шаардлагатай болж, энэ нь хурдыг нэмэгдүүлэх болно. ажиллах ба RAM-д тавигдах шаардлагыг багасгах.

Гиперкубын зүсмэлүүдийг бүтээхийн тулд бидэнд дараах боломжууд хэрэгтэй - хүснэгтийн оруулгуудын координатыг (үнэндээ хэмжилтийн утгыг) тодорхойлох, мөн тодорхой координат (хэмжилтийн утга) бүхий бүртгэлийг тодорхойлох. Эдгээр боломжууд хэрхэн хэрэгжиж болохыг харцгаая. Гиперкуб хадгалах хамгийн хялбар арга бол өөрийн дотоод форматтай мэдээллийн санг ашиглах явдал юм.

Схемийн хувьд хувиргалтыг дараах байдлаар илэрхийлж болно.

Диаграм 6. Дотоод форматын мэдээллийн санг хэвийн болгосон мэдээллийн сан руу хөрвүүлэх

Өөрөөр хэлбэл, нэг хүснэгтийн оронд бид хэвийн мэдээллийн сантай болсон. Үнэн хэрэгтээ хэвийн болгох нь системийн хурдыг бууруулдаг гэж мэдээллийн сангийн мэргэжилтнүүд хэлж байгаа бөгөөд энэ нь бид толь бичгийн элементүүдийн утгыг (бидний тохиолдолд хэмжээсийн утгыг) авах шаардлагатай үед зөв байх болно. Гэхдээ гол зүйл бол зүсмэлийг бүтээх үе шатанд эдгээр үнэ цэнэ бидэнд огт хэрэггүй юм. Дээр дурдсанчлан бид зөвхөн гиперкуб дахь координатыг сонирхож байгаа тул хэмжилтийн утгуудын координатыг тодорхойлох болно. Хамгийн энгийн нь элементүүдийн утгыг дахин дугаарлах явдал юм. Нэг хэмжээст дотор дугаарлалт нь хоёрдмол утгагүй байхын тулд бид эхлээд хэмжилтийн утгуудын жагсаалтыг цагаан толгойн үсгийн дарааллаар эрэмбэлдэг. Үүнээс гадна бид баримтуудыг дахин дугаарлаж, баримтуудыг урьдчилан нэгтгэдэг. Бид дараах диаграммыг авна.

Схем 7. Хэмжилтийн утгын координатыг тодорхойлохын тулд нормчлогдсон мэдээллийн сангийн дугаарыг өөрчлөх

Одоо өөр өөр хүснэгтийн элементүүдийг хооронд нь холбоход л үлддэг. Харилцааны мэдээллийн сангийн онолд үүнийг тусгай завсрын хүснэгт ашиглан хийдэг. Хэмжээний хүснэгтийн оруулга бүрийг эдгээр хэмжигдэхүүнүүдийг бүрдүүлэхэд ашигласан баримтуудын тооноос бүрдэх жагсаалттай холбоход хангалттай (өөрөөр хэлбэл координатын ижил утгатай бүх баримтыг тодорхойлох). Энэ хэмжээсээр дүрсэлсэн). Баримтуудын хувьд, бичлэг бүрийн хувьд бид гиперкуб дотор байрлах координатын утгыг тус тус бичдэг. Дараах зүйлд, гиперкуб дахь оруулгын координатын доор бид хэмжлийн утгын хүснэгтийн харгалзах оруулгуудын тоог хэлнэ. Дараа нь бидний таамагласан жишээний хувьд бид гиперкубын дотоод дүрслэлийг тодорхойлсон дараах багцыг авна.

Схем 8. Гиперкубын дотоод дүрслэл

Энэ нь бидний гиперкубын дотоод төлөөлөл байх болно. Бид үүнийг харилцааны мэдээллийн санд зориулаагүй тул хэмжилтийн утгыг холбох талбар болгон зөвхөн хувьсах урттай талбаруудыг ашигладаг (хүснэгтийн баганын тоог тэнд урьдчилан тодорхойлсон тул RDB-д үүнийг хийх боломжгүй байсан).

Гиперкубыг хэрэгжүүлэхийн тулд түр зуурын хүснэгтүүдийн багцыг ашиглахыг оролдож болох боловч энэ арга нь хэт бага гүйцэтгэлийг өгөх болно (жишээ нь Шийдвэрийн шоо бүрэлдэхүүн хэсгүүдийн багц юм), тиймээс бид өөрсдийн өгөгдөл хадгалах бүтцийг ашиглах болно.

Гиперкубыг хэрэгжүүлэхийн тулд бид хамгийн их гүйцэтгэл, хамгийн бага санах ойн хэрэглээг хангах өгөгдлийн бүтцийг ашиглах хэрэгтэй. Мэдээжийн хэрэг, бидний үндсэн бүтэц нь толь бичиг, баримтын хүснэгтийг хадгалахад зориулагдсан болно. Толь бичиг хамгийн их хурдтайгаар гүйцэтгэх ёстой ажлуудыг авч үзье.

толь бичигт элемент байгаа эсэхийг шалгах;

толь бичигт элемент нэмэх;

координатын тодорхой утгатай бичлэгийн дугаарыг хайх;

хэмжилтийн утгаар координат хайх;

хэмжилтийн утгыг координатаар нь хайх.

Эдгээр шаардлагыг хангахын тулд та ашиглаж болно янз бүрийн төрөлболон өгөгдлийн бүтэц. Жишээлбэл, та бүтцийн массивыг ашиглаж болно. Бодит тохиолдолд эдгээр массивууд нь өгөгдөл ачаалах, мэдээлэл олж авах хурдыг нэмэгдүүлэх нэмэлт индексжүүлэх механизм шаарддаг.

Гиперкубын ажиллагааг оновчтой болгохын тулд ямар ажлуудыг нэн тэргүүнд шийдвэрлэх шаардлагатай, ямар шалгуураар ажлын чанарыг нэмэгдүүлэх шаардлагатайг тодорхойлох шаардлагатай. Бидний хувьд хамгийн гол зүйл бол програмын хурдыг нэмэгдүүлэх явдал бөгөөд тийм ч их хэмжээний RAM шаардагдахгүй байх нь зүйтэй юм. Танилцуулгатай холбоотойгоор гүйцэтгэлийг нэмэгдүүлэх боломжтой нэмэлт механизмуудөгөгдөлд хандах, жишээлбэл, индексжүүлэлтийг нэвтрүүлэх. Харамсалтай нь энэ нь RAM-ийн ачааллыг нэмэгдүүлдэг. Тиймээс бид ямар үйлдлүүдийг хамгийн их хурдаар гүйцэтгэх ёстойг тодорхойлдог. Үүнийг хийхийн тулд гиперкубыг хэрэгжүүлдэг бие даасан бүрэлдэхүүн хэсгүүдийг анхаарч үзээрэй. Эдгээр бүрэлдэхүүн хэсгүүд нь хэмжээс ба баримтын хүснэгт гэсэн хоёр үндсэн төрөлтэй. Хэмжилтийн хувьд ердийн даалгавар нь:

шинэ үнэ цэнэ нэмэх;

хэмжилтийн утгаар координатыг тодорхойлох;

координатаар утгыг тодорхойлох.

Шинэ элементийн утгыг нэмэхдээ бидэнд ийм утга байгаа эсэхийг шалгах шаардлагатай бөгөөд хэрэв байгаа бол шинээр нэмэхгүй, харин одоо байгаа координатыг ашиглах, эс бөгөөс шинэ элемент нэмж, координатыг нь тодорхойлох шаардлагатай. Энэ нь хүссэн элемент байгаа эсэхийг хурдан олох арга замыг шаарддаг (үүнээс гадна координатыг элементийн утгаар тодорхойлоход ийм асуудал үүсдэг). Үүний тулд хэш хийх нь оновчтой байх болно. Энэ тохиолдолд хамгийн оновчтой бүтэц нь хэш модыг ашиглах бөгөөд үүнд бид элементүүдийн холбоосыг хадгалах болно. Энэ тохиолдолд элементүүд нь хэмжээсийн толь бичгийн мөрүүд байх болно. Дараа нь хэмжээсийн утгын бүтцийг дараах байдлаар илэрхийлж болно.

PFactLink = ^TFactLink;

TFactLink = бичлэг

Баримт No: бүхэл тоо; // хүснэгт дэх баримтын индекс

TDimensionRecord = бичлэг

Утга: мөр; // хэмжилтийн утга

индекс: бүхэл тоо; // координатын утга

FactLink: PFactLink; // баримт хүснэгтийн элементүүдийн жагсаалтын эхэнд заагч

Мөн хэш модонд бид өвөрмөц элементүүдийн холбоосыг хадгалах болно. Үүнээс гадна бид урвуу хувиргалтын асуудлыг шийдэх хэрэгтэй - хэмжилтийн утгыг координатаар тодорхойлох. Өгөх хамгийн их гүйцэтгэлТа шууд хаягийг ашиглах хэрэгтэй. Тиймээс та өөр массивыг ашиглаж болно, индекс нь хэмжилтийн координат бөгөөд утга нь толь бичигт харгалзах оруулгатай холбоос юм. Гэсэн хэдий ч, хэрэв та элементийн индексийг координат болгохын тулд элементүүдийн массивыг зохих ёсоор байрлуулбал үүнийг хийхэд хялбар (мөн санах ойг хэмнэж болно).

Баримтуудын жагсаалтыг хэрэгжүүлдэг массивын зохион байгуулалт нь энгийн бүтэцтэй тул ямар ч асуудал үүсгэдэггүй. Цорын ганц зүйл бол шаардлагатай байж болох, аажмаар тооцоолох боломжтой (жишээлбэл, нийлбэр) нэгтгэх бүх аргыг тооцоолох нь зүйтэй юм.

Тиймээс бид өгөгдлийг гиперкуб хэлбэрээр хадгалах аргыг тайлбарласан. Энэ нь өгөгдлийн агуулах дахь мэдээлэлд тулгуурлан олон хэмжээст орон зайд цэгийн багц үүсгэх боломжийг олгодог. Хүн эдгээр өгөгдөлтэй ажиллах боломжтой байхын тулд тэдгээрийг боловсруулахад тохиромжтой хэлбэрээр танилцуулах ёстой. Үүний зэрэгцээ пивот хүснэгт, графикийг өгөгдөл танилцуулах үндсэн төрлөөр ашигладаг. Түүнээс гадна эдгээр хоёр арга нь үнэндээ гиперкубын төсөөлөл юм. Төлөвлөлтийг бий болгоход хамгийн их үр ашигтай байхын тулд бид эдгээр төсөөлөл юуг илэрхийлж байгаагаас эхэлнэ. Өгөгдлийн шинжилгээнд хамгийн чухал нь пивот хүснэгтээс эхэлцгээе.

Ийм бүтцийг хэрэгжүүлэх арга замыг хайцгаая. Пивот хүснэгтийг бүрдүүлдэг гурван хэсэг байдаг: мөрийн толгой, баганын толгой, бодит нэгтгэсэн баримтын хүснэгт. хамгийн их энгийн аргаарбаримтын хүснэгтийн харагдац нь хоёр хэмжээст массивыг ашиглах бөгөөд түүний хэмжээсийг толгой хэсгийг бүтээх замаар тодорхойлж болно. Харамсалтай нь, хамгийн энгийн арга нь хамгийн үр ашиггүй байх болно, учир нь хүснэгт нь маш сийрэг байх бөгөөд санах ой нь маш үр ашиггүй байх болно, үүний үр дүнд зөвхөн маш жижиг кубуудыг барьж болно, эс тэгвээс санах ой хангалтгүй байж магадгүй юм. Тиймээс бид хангах мэдээллийг хадгалах өгөгдлийн бүтцийг сонгох хэрэгтэй дээд хурдшинэ элемент хайх / нэмэх, үүнтэй зэрэгцэн RAM-ийн хамгийн бага хэрэглээ. Энэ бүтэц нь сийрэг матрицууд гэж нэрлэгддэг бөгөөд та Кнутын талаар илүү ихийг уншиж болно. Боломжтой янз бүрийн арга замуудматрицын зохион байгуулалт. Бидэнд тохирох сонголтыг сонгохын тулд эхлээд хүснэгтийн толгойн бүтцийг авч үзье.

Толгойнууд нь тодорхой шаталсан бүтэцтэй байдаг тул тэдгээрийг хадгалахын тулд мод ашиглах нь зүйн хэрэг юм. Энэ тохиолдолд модны зангилааны бүтцийг дараах байдлаар бүдүүвчээр дүрсэлж болно.

Хавсралт C

Үүний зэрэгцээ олон хэмжээст шоо хэмжих хүснэгтийн харгалзах элементийн лавлагааг хэмжээсийн утга болгон хадгалах нь логик юм. Энэ нь зүсмэлийг хадгалах санах ойн зарцуулалтыг бууруулж, ажлыг хурдасгах болно. Холбоосыг эцэг эх болон хүүхдийн зангилаа болгон ашигладаг.

Модонд элемент нэмэхийн тулд түүний гиперкуб дахь байршлын талаархи мэдээлэл байх шаардлагатай. Ийм мэдээллийн хувьд түүний координатыг ашиглах шаардлагатай бөгөөд үүнийг Хэмжээний утгын толь бичигт хадгалсан болно. Пивот хүснэгтийн толгой модонд элемент нэмэх схемийг авч үзье. Энэ тохиолдолд бид хэмжилтийн координатын утгыг анхны мэдээлэл болгон ашигладаг. Эдгээр хэмжигдэхүүнүүдийг жагсаах дарааллыг хүссэн нэгтгэх аргаар тодорхойлж, толгойн модны шатлалын түвшинд таарч байна. Ажлын үр дүнд та элемент нэмэхийг хүсч буй пивот хүснэгтийн багана эсвэл мөрүүдийн жагсаалтыг авах хэрэгтэй.

ӨргөдөлД

Бид хэмжилтийн координатыг энэ бүтцийг тодорхойлох анхны өгөгдөл болгон ашигладаг. Нэмж хэлэхэд, тодорхой байхын тулд бид матрицад бидний сонирхсон баганыг тодорхойлж байна гэж үзэх болно (бид мөрийг хэрхэн тодорхойлохыг хэсэг хугацааны дараа авч үзэх болно, учир нь тэнд бусад өгөгдлийн бүтцийг ашиглах нь илүү тохиромжтой. Энэ сонголтын шалтгаан мөн доор). Координатын хувьд бид бүхэл тоонуудыг авдаг - дээр дурдсанчлан тодорхойлж болох хэмжилтийн утгуудын тоо.

Тиймээс, энэ процедурыг гүйцэтгэсний дараа бид сийрэг матрицын баганууд руу чиглэсэн олон тооны холбоосыг олж авна. Одоо таны хийх ёстой бүх зүйл шаардлагатай арга хэмжээутастай. Үүнийг хийхийн тулд багана бүрийн дотор хүссэн элементээ олж, тэнд нэмэх хэрэгтэй харгалзах утга. Цуглуулга дахь хэмжээс бүрийн хувьд та өвөрмөц утгуудын тоо болон эдгээр утгуудын бодит багцыг мэдэх хэрэгтэй.

Одоо багана доторх утгуудыг хэрхэн илэрхийлэх, өөрөөр хэлбэл шаардлагатай мөрийг хэрхэн тодорхойлохыг харцгаая. Үүнийг хийхийн тулд хэд хэдэн аргыг ашиглаж болно. Хамгийн энгийн нь багана бүрийг вектор хэлбэрээр илэрхийлэх боловч маш сийрэг байх тул санах ой нь маш үр ашиггүй байх болно. Үүнээс зайлсхийхийн тулд бид сийрэг нэг хэмжээст массивыг (вектор) илүү үр дүнтэй дүрслэх өгөгдлийн бүтцийг ашигладаг. Эдгээрээс хамгийн энгийн нь дангаар нь эсвэл давхар холбогдсон ердийн жагсаалт байх боловч элементийн хандалтын хувьд хэмнэлттэй биш юм. Тиймээс бид модыг ашиглах бөгөөд энэ нь элементүүдэд илүү хурдан нэвтрэх боломжийг олгоно.

Жишээлбэл, та баганатай яг ижил модыг ашиглаж болно, гэхдээ дараа нь багана бүрийн хувьд өөрийн модыг эхлүүлэх шаардлагатай бөгөөд энэ нь санах ой болон боловсруулалтын хугацаанд ихээхэн зардал гаргах болно. Бага зэрэг заль мэх хийцгээе - дээр дурдсантай ижил байх мөрүүдэд ашигласан хэмжилтийн бүх хослолыг хадгалахын тулд нэг модыг эхлүүлцгээе, гэхдээ түүний элементүүд нь эгнээний заагч биш (энэ нь тийм байдаггүй), харин тэдгээрийн индексүүд, мөн индексийн утгууд нь бидэнд сонирхолгүй бөгөөд зөвхөн өвөрмөц түлхүүр болгон ашигладаг. Дараа нь бид эдгээр товчлууруудыг ашиглан багана дотроос хүссэн элементээ олох болно. Баганууд нь өөрөө энгийн хоёртын мод хэлбэрээр дүрслэхэд хялбар байдаг. Графикийн хувьд үүссэн бүтцийг дараах байдлаар илэрхийлж болно.

Диаграм 9. Хоёртын мод хэлбэртэй пивот хүснэгтийн зураг

Харгалзах мөрийн дугаарыг тодорхойлохын тулд пивот хүснэгтийн баганыг тодорхойлох дээр дурдсан процедуртай ижил процедурыг ашиглаж болно. Энэ тохиолдолд мөрийн дугаарууд нь нэг пивот хүснэгтэд өвөрмөц бөгөөд пивот хүснэгтийн багана болох векторуудын элементүүдийг тодорхойлно. Эдгээр тоог гаргах хамгийн энгийн арга бол мөрийн толгойн модонд шинэ элемент нэмэх үед тоолуур барьж, нэгээр нэмэгдүүлэх явдал юм. Эдгээр баганын векторууд нь хоёртын мод хэлбэрээр хамгийн амархан хадгалагддаг бөгөөд мөрийн дугаарын утгыг түлхүүр болгон ашигладаг. Үүнээс гадна хэш хүснэгтийг ашиглах боломжтой. Эдгээр модтой ажиллах журмыг бусад эх сурвалжид нарийвчлан авч үзсэн тул бид энэ талаар ярихгүй бөгөөд баганад элемент нэмэх ерөнхий схемийг авч үзэх болно.

Ерөнхий хэлбэрээр матрицад элемент нэмэх үйлдлүүдийн дарааллыг дараах байдлаар тодорхойлж болно.

1. Элемент нэмэх мөрийн дугаарыг тодорхойл

2. Зүйл нэмэх баганын багцыг тодорхойл

3. Бүх баганын хувьд хүссэн мөрийн дугаар бүхий элементүүдийг олж, тэдгээрт одоогийн элементийг нэмнэ (нэмэхэд шаардлагатай тооны баримтын утгыг холбож, аажмаар тодорхойлж болох нэгтгэсэн утгыг тооцоолох орно).

Энэ алгоритмыг хэрэгжүүлсний дараа бид матрицыг олж авдаг бөгөөд энэ нь бидний бүтээхэд шаардлагатай пивот хүснэгт юм.

Одоо зүсмэлийг барихдаа шүүлтүүрийн талаар хэдэн үг хэлье. Үүнийг хэрэгжүүлэх хамгийн хялбар арга бол матрицыг бүтээх үе шатанд байгаа тул энэ үе шатанд шаардлагатай бүх талбарт хандах боломжтой бөгөөд үүнээс гадна утгуудыг нэгтгэх ажил хийгддэг. Үүний зэрэгцээ кэшээс оруулга хүлээн авах үед түүний шүүлтүүрийн нөхцөлтэй нийцэж байгаа эсэхийг шалгаж, зөрчилтэй тохиолдолд оруулгыг устгадаг.

Дээр тайлбарласан бүтэц нь пивот хүснэгтийг бүрэн дүрсэлсэн тул түүнийг дүрслэх ажил нь өчүүхэн байх болно. Энэ тохиолдолд та бараг бүх Windows програмчлалын хэрэгсэлд байдаг стандарт хүснэгтийн бүрэлдэхүүн хэсгүүдийг ашиглаж болно.

OLAP асуулга хийсэн анхны бүтээгдэхүүн бол Express (IRI компани) юм. Гэсэн хэдий ч OLAP гэсэн нэр томъёог "харилцааны өгөгдлийн сангийн эцэг" Эдгар Кодд өөрөө бий болгосон. Мөн Коддын ажлыг жилийн өмнө өөрийн OLAP бүтээгдэхүүн болох Essbase (хожим нь Hyperion худалдаж авсан, 2007 онд Oracle авсан) гаргасан Arbor компани санхүүжүүлсэн. Бусад алдартай OLAP бүтээгдэхүүнүүдэд Microsoft Analysis Services (өмнө нь OLAP Services гэж нэрлэгддэг, SQL Server-ийн нэг хэсэг), Oracle OLAP Option, IBM-ийн DB2 OLAP сервер (үнэндээ IBM нэмэлтүүдтэй EssBase), SAP BW, Brio бүтээгдэхүүн, BusinessObjects, Cognos, MicroStrategy болон бусад үйлдвэрлэгчид.

Техникийн үүднээс авч үзвэл зах зээл дээрх бүтээгдэхүүнийг "физик OLAP" болон "виртуал" гэж хуваадаг. Эхний тохиолдолд дүүргэгчийн урьдчилсан тооцоог гүйцэтгэдэг програм байдаг бөгөөд дараа нь тэдгээрийг хурдан олж авах боломжийг олгодог тусгай олон хэмжээст мэдээллийн санд хадгалдаг. Ийм бүтээгдэхүүний жишээ бол Microsoft Analysis Services, Oracle OLAP Option, Oracle/Hyperion EssBase, Cognos PowerPlay юм. Хоёрдахь тохиолдолд өгөгдөл нь харилцааны DBMS-д хадгалагддаг бол агрегатууд нь огт байхгүй эсвэл DBMS эсвэл аналитик програм хангамжийн кэш дэх эхний хүсэлтээр үүсгэгддэг. Ийм бүтээгдэхүүний жишээ бол SAP BW, BusinessObjects, Microstrategy юм. "Физик OLAP" дээр суурилсан системүүд нь тогтвортой байдлыг хангадаг хамгийн сайн цаг"виртуал OLAP" системээс илүү асуултанд хариулах. Виртуал OLAP борлуулагчид маш их хэмжээний өгөгдлийг дэмжихийн тулд бүтээгдэхүүнээ илүү өргөжүүлэх боломжтой гэж мэдэгддэг.

Энэ ажилд би BaseGroup Labs - Deductor-ийн бүтээгдэхүүнийг нарийвчлан авч үзэхийг хүсч байна.

Дедуктор нь аналитик платформ, i.e. хэрэглээний бүрэн шийдлийг бий болгох үндэс. Deductor-д хэрэгжсэн технологиуд нь нэг архитектурын үндсэн дээр аналитик системийг бий болгох бүх үе шатыг давах боломжийг олгодог: мэдээллийн агуулах үүсгэхээс эхлээд загваруудыг автоматаар сонгох, үр дүнг дүрслэн харуулах хүртэл.

Системийн найрлага:

Deductor Studio нь Deductor платформын аналитик цөм юм. Deductor Studio нь дурын мэдээллийн эх сурвалжаас мэдээлэл авах, боловсруулалтын бүх мөчлөгийг (цэвэрлэгээ, өгөгдөл хувиргах, загвар бүтээх) гүйцэтгэх, үр дүнг хамгийн тохиромжтой байдлаар харуулах (OLAP, хүснэгт, диаграмм) боломжийг олгодог иж бүрэн механизмуудыг агуулдаг. , шийдвэрийн мод ...) болон экспортын үр дүн.

Deductor Viewer нь эцсийн хэрэглэгчийн ажлын байр юм. Хөтөлбөр нь боловсон хүчний шаардлагыг багасгах боломжийг олгодог, учир нь шаардлагатай бүх үйлдлүүд нь өмнө нь бэлтгэсэн боловсруулах скриптүүдийг ашиглан автоматаар хийгддэг тул өгөгдөл олж авах арга, түүнийг боловсруулах механизмын талаар бодох шаардлагагүй болно. Deductor Viewer хэрэглэгч зөвхөн сонирхсон тайлангаа сонгох хэрэгтэй.

Deductor Warehouse нь тухайн сэдвийн талбарт дүн шинжилгээ хийхэд шаардлагатай бүх мэдээллийг хуримтлуулдаг олон хэмжээст хөндлөн платформ мэдээллийн агуулах юм. Нэг репозитор ашиглах нь тохиромжтой нэвтрэх боломжийг олгодог. өндөр хурдболовсруулалт, мэдээллийн тууштай байдал, төвлөрсөн хадгалалт, өгөгдөлд дүн шинжилгээ хийх бүх үйл явцыг автоматаар дэмжих.

4. Үйлчлүүлэгч сервер

Deductor Server нь алсаас аналитик боловсруулалт хийхэд зориулагдсан. Энэ нь сервер дээр байгаа скриптүүдээр дамжуулан өгөгдлийг автоматаар "ажиллуулах" болон одоо байгаа загваруудыг дахин сургах боломжийг олгодог. Deductor серверийг ашиглах нь програмын серверийн үүрэг гүйцэтгэдэг бүрэн хэмжээний гурван түвшний архитектурыг хэрэгжүүлэх боломжийг танд олгоно. Серверт нэвтрэх эрхийг Deductor Client олгодог.

Ажлын зарчим:

1. Өгөгдөл импорт

Deductor дахь аливаа мэдээлэлд дүн шинжилгээ хийх нь өгөгдөл импортлохоос эхэлдэг. Импортын үр дүнд өгөгдөл нь програмд ​​байгаа бүх механизмыг ашиглан дараагийн дүн шинжилгээ хийхэд тохиромжтой хэлбэрт ордог. Өгөгдлийн шинж чанар, формат, DBMS гэх мэт нь хамаагүй, учир нь бүгдтэй ажиллах механизм нь нэгдмэл байдаг.

2. Өгөгдлийн экспорт

Экспортын механизм байгаа нь үр дүнг илгээх боломжийг олгодог гуравдагч талын програмууджишээлбэл, борлуулалтын таамаглалыг худалдан авах захиалга үүсгэх системд шилжүүлэх эсвэл компанийн вэбсайт дээр бэлтгэсэн тайланг нийтлэх.

3. Мэдээлэл боловсруулах

Deductor-д боловсруулалт гэдэг нь ямар нэг төрлийн өгөгдөл хувиргахтай холбоотой аливаа үйлдлийг хэлнэ, тухайлбал шүүх, загвар бүтээх, цэвэрлэх гэх мэт. Үнэн хэрэгтээ энэ блокт дүн шинжилгээ хийх үүднээс хамгийн чухал үйлдлүүд хийгддэг. Deductor-д хэрэгжсэн боловсруулах механизмын хамгийн чухал онцлог нь боловсруулалтын үр дүнд олж авсан өгөгдлийг системд ашиглах боломжтой аргуудын аль нэгээр дахин боловсруулж болно. Тиймээс, дур зоргоороо нарийн төвөгтэй боловсруулалтын хувилбаруудыг бий болгох боломжтой.

4. Дүрслэл

Та боловсруулалтын аль ч үе шатанд Deductor Studio (Үзэгч) дээр өгөгдлийг дүрслэх боломжтой. Систем нь үүнийг хэрхэн яаж хийхийг, жишээлбэл, хэрэв сургагдсан бол бие даан тодорхойлдог мэдрэлийн сүлжээ, дараа нь хүснэгт, диаграмаас гадна мэдрэлийн сүлжээний графикийг харж болно. Хэрэглэгч жагсаалтаас хүссэн сонголтыг сонгож, хэд хэдэн параметрүүдийг тохируулах шаардлагатай.

5. Интеграцийн механизмууд

Deductor нь өгөгдөл оруулах хэрэгслээр хангадаггүй - платформ нь зөвхөн аналитик боловсруулалтад чиглэгддэг. Нэг төрлийн бус системд хадгалагдсан мэдээллийг ашиглахын тулд импорт-экспортын уян хатан механизмаар хангадаг. Багц гүйцэтгэх, OLE серверийн горимд ажиллах, Deductor серверт хандах зэргээр харилцан үйлчлэлийг зохион байгуулж болно.

6. Мэдлэгийг хуулбарлах

Дедуктор нь аливаа аналитик системийн хамгийн чухал функцүүдийн нэгийг хэрэгжүүлэх боломжийг олгодог - мэдлэгийг хуулбарлах процессыг дэмжих, i.e. дүн шинжилгээ хийх арга, тодорхой үр дүнд хүрэх арга замыг мэдэхгүй ажилчдад шинжээчийн бэлтгэсэн загварт үндэслэн хариулт авах боломжийг олгох.

Вдүгнэлт

Энэхүү нийтлэлд мэдээллийн шинжилгээний систем гэх мэт орчин үеийн мэдээллийн технологийн салбарыг авч үзсэн болно. Мэдээллийн аналитик боловсруулалтын үндсэн хэрэгсэл болох OLAP технологид дүн шинжилгээ хийсэн. OLAP-ийн үзэл баримтлалын мөн чанар, орчин үеийн бизнесийн үйл явцад OLAP-системийн ач холбогдлыг нарийвчлан тайлбарласан болно. ROLAP серверийн бүтэц, үйл ажиллагааг дэлгэрэнгүй тайлбарласан болно. OLAP өгөгдөл - технологийг хэрэгжүүлэх жишээ болгон Deductor аналитик платформыг өгсөн болно. Үзүүлсэн баримт бичгийг боловсруулж, шаардлагад нийцсэн.

OLAP технологи нь бодит цагийн өгөгдөл боловсруулах хүчирхэг хэрэгсэл юм. OLAP сервер нь танд өгөгдлийг янз бүрийн аналитик дээр зохион байгуулж, танилцуулах боломжийг олгодог бөгөөд өгөгдлийг компаниудад илүү сайн шийдвэр гаргахад тусалдаг үнэ цэнэтэй мэдээлэл болгон хувиргадаг.

OLAP системийг ашиглах нь олон мянган хэрэглэгчдийн хандах боломжтой гигабайт хэмжээтэй өгөгдлийн хэмжээг дэмждэг тогтвортой өндөр гүйцэтгэл, өргөтгөх чадварыг хангадаг. OLAP технологийн тусламжтайгаар мэдээлэлд хандах хандалтыг бодит цаг хугацаанд гүйцэтгэдэг, жишээлбэл. асуулга боловсруулах нь дүн шинжилгээ хийх явцыг удаашруулахаа больж, түүний үр ашиг, үр дүнтэй байдлыг хангах болно. Визуал удирдлагын хэрэгслүүд нь танд хамгийн төвөгтэй аналитик програмуудыг хүртэл боловсруулж, хэрэгжүүлэх боломжийг олгодог бөгөөд энэ процессыг энгийн бөгөөд хурдан болгодог.

Үүнтэй төстэй баримт бичиг

    OLAP (On-Line Analytical Processing) концепцийн үндэс нь онлайн аналитик өгөгдөл боловсруулах, түүнийг үйлчлүүлэгч болон сервер дээр ашиглах онцлог шинж чанарууд юм. OLAP системд тавигдах үндсэн шаардлагуудын ерөнхий шинж чанар, түүнчлэн тэдгээрт өгөгдөл хадгалах арга замууд.

    хураангуй, 10/12/2010 нэмэгдсэн

    OLAP: ерөнхий шинж чанар, зорилго, зорилго, даалгавар. OLAP бүтээгдэхүүний ангилал. OLAP системийг бүтээх зарчим, CubeBase бүрэлдэхүүн хэсгийн номын сан. Үйлчлүүлэгч болон серверийн OLAP хэрэгслүүдийн гүйцэтгэл нь өгөгдлийн хэмжээ нэмэгдэхээс хамаарна.

    2013 оны 12-р сарын 25-ны өдөр нэмэгдсэн курсын ажил

    Мөнхийн өгөгдөл хадгалах. OLAP (On-line Analytical Processing) хэрэгслийн мөн чанар, утга учир. Өгөгдлийн сан ба мэдээллийн сан, тэдгээрийн шинж чанар. Мэдээллийн хадгалалтын бүтэц, архитектур, тэдгээрийн үйлчилгээ үзүүлэгч. OLAP кубуудын гүйцэтгэлийг сайжруулах зарим зөвлөмжүүд.

    тест, 2010 оны 10/23-нд нэмэгдсэн

    Өгөгдлийн шинжилгээний системийг бий болгох. OLAP шоо зохион бүтээх алгоритмыг бий болгох, барьсан пивот хүснэгтэд асуулга үүсгэх. Олон хэмжээст өгөгдөлд дүн шинжилгээ хийх OLAP технологи. Хэрэглэгчдэд удирдлагын шийдвэр гаргах мэдээллээр хангах.

    курсын ажил, 2008 оны 09-р сарын 19-нд нэмэгдсэн

    OLAP-ийн талаархи үндсэн мэдээлэл. Үйл ажиллагааны аналитик өгөгдөл боловсруулах. OLAP бүтээгдэхүүний ангилал. Үйл ажиллагааны аналитик боловсруулалтын хэрэгсэлд тавигдах шаардлага. Онлайн аналитик боловсруулах системд олон хэмжээст мэдээллийн санг ашиглах, тэдгээрийн давуу тал.

    2011 оны 06-р сарын 10-нд нэмэгдсэн курсын ажил

    Вэбсайт шинжилгээний дэд системийг хөгжүүлэх Microsoft-ын тусламж Access ба Olap технологи. Хөгжмийн порталын мэдээллийн систем дэх өгөгдлийн шинжилгээний дэд системийг хөгжүүлэх онолын талууд. Судалгааны объектын шинжилгээний дэд систем дэх Olap-технологи.

    2009 оны 11-р сарын 6-нд нэмэгдсэн курсын ажил

    OLAP хэрэгслийг авч үзэх нь: дэлгүүрийн нүүр ба мэдээллийн сангуудын ангилал, өгөгдлийн кубын тухай ойлголт. Шийдвэрийг дэмжих системийн архитектур. Програм хангамжийн хэрэгжилтАбитура системүүд. Reporting Services технологи ашиглан вэб тайлан гаргах.

    2012 оны 12-р сарын 05-нд нэмэгдсэн курсын ажил

    Мэдээллийн агуулах, зохион байгуулалтын зарчим. Өгөгдлийн процессууд. OLAP бүтэц, олон хэмжээст өгөгдөл хадгалах техникийн талууд. Интеграцийн үйлчилгээ, хадгалах сан, өгөгдлийн цэгийг дүүргэх. Майкрософт технологийг ашигладаг системийн чадвар.

    2012 оны 12-р сарын 05-нд нэмэгдсэн курсын ажил

    Худалдааны аж ахуйн нэгжийн мэдээллийн агуулахын схемийг барих. Хадгалалтын харилцааны схемүүдийн тайлбар. Бүтээгдэхүүний талаарх мэдээллийг харуулах. Цаашид мэдээлэлд дүн шинжилгээ хийх зорилгоор OLAP шоо үүсгэх. Супермаркетийн үр ашгийг үнэлэхийн тулд асуулга боловсруулж байна.

    хяналтын ажил, 2015/12/19 нэмэгдсэн

    Мэдээллийн сангийн зорилго. SAP BW архитектур. SAP BW систем дэх OLAP куб дээр суурилсан аналитик тайланг бий болгох. Өгөгдлийн агуулах ба OLTP системийн гол ялгаа. BEx-ийн функциональ хэсгүүдийн тойм. BEx Query Designer дээр асуулга үүсгэж байна.

1993 онд мэдээллийн баазыг бий болгох харилцааны хандлагыг үндэслэгч Эдгар Кодд болон түүний хамтрагчид (математикч, IBM-ийн гишүүн Эдгар Кодд) "Arbor Software" компанийн санаачилсан нийтлэлийг хэвлүүлсэн (өнөөдөр энэ нь алдартай "Hyperion Solutions" компани юм). OLAP технологийн 12 онцлогийг томъёолсон "Аналист хэрэглэгчдэд зориулсан OLAP (үйл ажиллагааны аналитик боловсруулалт)" гэсэн гарчигтай. Эдгээр заалтууд нь шинэ, маш ирээдүйтэй технологийн гол агуулга болсон.

Технологийн үндсэн шинж чанарууд OLAP (Үндсэн):

  • өгөгдлийн олон хэмжээст үзэл баримтлалын төлөөлөл;
  • мэдээллийг зөн совингоор удирдах;
  • өгөгдлийн хүртээмж, нарийвчилсан мэдээлэл;
  • багц өгөгдөл олборлохтайлбарын эсрэг;
  • OLAP шинжилгээний загварууд;
  • үйлчлүүлэгч-серверийн архитектур (OLAP нь ширээний компьютерээс хандах боломжтой);
  • ил тод байдал (гадны өгөгдөлд ил тод хандах);
  • олон хэрэглэгчийн дэмжлэг.

Онцгой шинж чанар(Онцгой):

  • албан ёсны бус өгөгдлийг боловсруулах;
  • OLAP үр дүнг хадгалах: тэдгээрийг анхны өгөгдлөөс тусад нь хадгалах;
  • дутуу утгыг хасах;
  • дутуу утгыг зохицуулах.

Мэдээллийн онцлог(Тайлан):

  • тайлангийн уян хатан байдал;
  • тайлангийн стандарт гүйцэтгэл;
  • өгөгдөл олборлох физик давхаргын автомат тохиргоо.

Хэмжилтийн удирдлага(Хэмжээ):

  • хэмжилтийн түгээмэл байдал;
  • хязгааргүй тооны хэмжээс ба нэгтгэх түвшин;
  • хэмжээс хоорондын хязгааргүй тооны үйлдлүүд.

Түүхийн хувьд өнөөдөр "OLAP" гэсэн нэр томъёо нь зөвхөн эцсийн хэрэглэгчийн өгөгдлийг олон хэмжээст харахаас гадна зорилтот мэдээллийн сан дахь өгөгдлийн олон хэмжээст дүрслэлийг агуулдаг. Бие даасан нэр томьёо үүсэх нь үүнтэй холбоотой юм. "Харилцан OLAP"(ROLAP) болон "Олон хэмжээст OLAP"(MOLAP).

OLAP-үйлчилгээ нь бодит цаг хугацаанд их хэмжээний өгөгдөлд дүн шинжилгээ хийх хэрэгсэл юм. OLAP - системтэй харилцаж, хэрэглэгч мэдээллийг уян хатан байдлаар харах, дур зоргоороо өгөгдлийн зүсмэлүүдийг олж авах, нарийвчилсан, эргүүлэх, төгсгөл хооронд хуваарилах, цаг хугацааны харьцуулалт зэрэг олон параметрийн аналитик үйлдлүүдийг нэгэн зэрэг гүйцэтгэх боломжтой болно. OLAP-системтэй бүх ажил нь сэдвийн хүрээнд явагддаг бөгөөд бизнесийн нөхцөл байдлын статистикийн үндэслэлтэй загваруудыг бий болгох боломжийг олгодог.

OLAP програм хангамж - нь онлайн өгөгдөлд дүн шинжилгээ хийх хэрэгсэл юмхадгалах санд агуулагдсан. Гол онцлогЭдгээр хэрэгслүүдийг мэдээллийн технологийн салбарын мэргэжилтэн, статистикийн шинжээч биш, харин удирдлагын хэрэглээний чиглэлээр мэргэшсэн мэргэжилтэн - хэлтэс, хэлтэс, удирдлага, эцэст нь, найруулагч. Шинжээчтэй харилцахад зориулагдсан хэрэгслүүд компьютертэй биш, асуудалтай. Зураг дээр. 6.14 нь өгөгдлийг гурван хэмжээстээр үнэлэх боломжийг олгодог энгийн OLAP кубыг харуулж байна.

Олон хэмжээст OLAP-шоо ба статистик боловсруулалтад тохирох математик алгоритмын систем нь ямар ч цаг хугацааны интервалд ямар ч нарийн төвөгтэй өгөгдөлд дүн шинжилгээ хийх боломжийг олгодог.


Цагаан будаа. 6.14.

Мэдээллийг удирдах, дүрслэх уян хатан механизмтай (Зураг 6.15, Зураг 6.16) менежер эхлээд янз бүрийн өнцгөөс өгөгдлийг авч үздэг бөгөөд энэ нь шийдэж буй асуудалтай холбоотой (эсвэл үгүй ​​ч байж болно).

Дараа нь тэрээр бизнесийн янз бүрийн үзүүлэлтүүдийг хооронд нь харьцуулж, далд харилцааг тодорхойлохыг хичээдэг; Мэдээллийг нарийвчлан судалж, жишээлбэл, цаг хугацаа, бүс нутаг, үйлчлүүлэгчээр нь задлах, эсвэл эсрэгээр анхаарал сарниулах нарийн ширийн зүйлийг арилгахын тулд мэдээллийн танилцуулгыг цааш нь нэгтгэж болно. Үүний дараа модулийг ашиглана статистик тооцоолол ба симуляциүйл явдлыг хөгжүүлэх хэд хэдэн хувилбаруудыг боловсруулсан бөгөөд тэдгээрээс хамгийн хүлээн зөвшөөрөгдсөн хувилбарыг сонгоно.


Цагаан будаа. 6.15.

Жишээлбэл, компанийн менежер нь компанийн янз бүрийн салбар дахь хөрөнгийн өсөлтийн тархалт нь техник, эдийн засгийн боловсролтой мэргэжилтнүүдийн харьцаанаас хамаардаг гэсэн таамаглал дэвшүүлж болно. Энэ таамаглалыг шалгахын тулд менежер агуулахаас хүсэлт гаргаж, энэ улиралд хөрөнгийн өсөлт нь өнгөрсөн оныхоос 10% -иас дээш буурсан салбарууд болон хөрөнгө нь өссөн салбаруудын сонирхлын харьцааг график дээр харуулах боломжтой. 25% -иас дээш. Тэр өгсөн цэснээс энгийн сонголтыг ашиглах боломжтой байх ёстой. Хэрэв олж авсан үр дүн нь харгалзах хоёр бүлэгт мэдэгдэхүйц буурсан бол энэ нь дэвшүүлсэн таамаглалыг цаашид шалгах түлхэц болох ёстой.

Одоогоор чиглэл дуудсан динамик симуляци(Динамик симуляци) нь дээрх FASMI зарчмыг бүрэн хэрэгжүүлдэг.

Динамик загварчлалыг ашиглан шинжээч нь зарим хувилбарын дагуу цаг хугацааны явцад хөгжиж буй бизнесийн нөхцөл байдлын загварыг бий болгодог. Үүний зэрэгцээ ийм загварчлалын үр дүн нь модыг үүсгэдэг хэд хэдэн бизнесийн шинэ нөхцөл байдал байж болно боломжит шийдлүүдтус бүрийн магадлал, хэтийн төлөвийн үнэлгээний хамт.


Цагаан будаа. 6.16.

Хүснэгт 6.3-т үзүүлэв харьцуулсан шинж чанаруудстатик ба динамик шинжилгээ.

Хүснэгт 6.3.
Онцлог шинж чанартай Статик шинжилгээ Динамик шинжилгээ
Асуултын төрлүүд ДЭМБ? Юу? Хэрхэн? Хэрхэн? Хэзээ? Хаана? Яагаад тэр вэ? Хэрэв ... юу болох вэ? Хэрвээ…?
Хариу цаг Зохицуулалтгүй Секунд
Өгөгдлийн ердийн үйлдлүүд Зохицуулалттай тайлан, диаграмм, хүснэгт, зураг Интерактив тайлан, диаграмм, дэлгэцийн маягтуудын дараалал. Нэгтгэлийн түвшин болон өгөгдлийн зүсмэлүүдийн динамик өөрчлөлт
Аналитик шаардлагын түвшин Дундаж Өндөр
Дэлгэцийн төрөл Үндсэндээ урьдчилан тодорхойлсон, зохицуулалттай Хэрэглэгчийн тодорхойлсон, тохируулах сонголтууд байдаг
Өгөгдөл нэгтгэх түвшин Нарийвчилсан ба хураангуй Хэрэглэгчийн тодорхойлсон
Өгөгдлийн "нас" Түүхэн ба одоогийн Түүх, одоогийн болон урьдчилсан мэдээ
Хүсэлтийн төрлүүд Ихэвчлэн урьдчилан таамаглах боломжтой. Урьдчилан таамаглах аргагүй - үе үе
Зорилго Төлөвлөсөн аналитик боловсруулалт Олон дамжилтын шинжилгээ, загварчлал, таамаглал

Бараг үргэлж олон хувьсах өгөгдлийн шинжилгээний аналитик системийг бий болгох ажил бол бүтээх ажил юм нэг төрлийн бус програм хангамжийн хэрэгсэл, шийдэлд суурилсан нэгдсэн зохицуулалттай мэдээллийн систем. IP-ийг хэрэгжүүлэх арга хэрэгслийг сонгох нь маш хэцүү ажил болж хувирдаг. Энд олон хүчин зүйлийг харгалзан үзэх шаардлагатай, үүнд янз бүрийн харилцан нийцтэй байдал орно програм хангамжийн бүрэлдэхүүн хэсэг, тэдгээрийг хөгжүүлэх, ашиглах, нэгтгэх хялбар байдал, үйл ажиллагааны үр ашиг, тогтвортой байдал, бүр хэлбэр, янз бүрийн үйлдвэрлэгчдийн хоорондын харилцааны түвшин, боломжит хэтийн төлөв.

OLAP нь олон хүчин зүйлийн өгөгдөлд дүн шинжилгээ хийх ажил байгаа бүх газарт хэрэглэгддэг. Ерөнхийдөө, дор хаяж нэг дүрслэх багана, тоо бүхий нэг баганатай өгөгдөл бүхий хүснэгт байгаа бол OLAP хэрэгсэл нь тайланг шинжлэх, гаргах үр дүнтэй хэрэгсэл байх болно. OLAP технологийг ашиглах жишээ болгон борлуулалтын үр дүнгийн судалгааг авч үзье.

Гол асуултууд "Хэр их зарагдсан бэ?", "Хэр их зарагдсан бэ?" бизнес улам бүр төвөгтэй болж, түүхэн өгөгдөл нь тодорхой хүчин зүйл, эсвэл бууруулахад хуримтлагдах тусам өргөжин тэлнэ: ".. Санкт-Петербургт, Москвад, Уралд, Сибирт ...", ".. сүүлийн улиралд, одоогийнхтой харьцуулахад", " .. нийлүүлэгч А-аас Б нийлүүлэгчтэй харьцуулахад..." гэх мэт.

Эдгээр асуултын хариулт нь удирдлагын шийдвэр гаргахад зайлшгүй шаардлагатай: нэр төрөл, үнийг өөрчлөх, дэлгүүр, салбарыг хаах, нээх, дилерүүдтэй гэрээ цуцлах, гарын үсэг зурах, сурталчилгааны кампанит ажил явуулах, цуцлах гэх мэт.

Хэрэв та компанийн бизнесийг өргөжүүлэх, оновчтой болгохыг оролдохын тулд шинжээчийн удирдаж буй үндсэн тоо (баримт) ба хасах (хэмжилтийн аргумент) -ийг тодруулахыг оролдвол борлуулалтын дүн шинжилгээ хийхэд тохиромжтой хүснэгтийг зохих тохируулга шаарддаг загвар хэлбэрээр авах болно. тодорхой аж ахуйн нэгж бүр.

Цаг хугацаа. Дүрмээр бол эдгээр нь хэд хэдэн үе юм: жил, улирал, сар, арван жил, долоо хоног, өдөр. Олон OLAP хэрэгслүүд нь огнооноос илүү өндөр хугацааг автоматаар тооцож, тэдгээрийн нийлбэр дүнг тооцдог.

Бүтээгдэхүүний ангилал. Хэд хэдэн ангилал байж болно, тэдгээр нь бизнесийн төрөл тус бүрээс ялгаатай: зэрэглэл, загвар, савлагааны төрөл гэх мэт. Хэрэв зөвхөн нэг бүтээгдэхүүн зарагдсан эсвэл төрөл нь маш бага байвал ангилал шаардлагагүй болно.

Бүтээгдэхүүн. Заримдаа бүтээгдэхүүний нэр (эсвэл үйлчилгээ), түүний код эсвэл нийтлэлийг ашигладаг. Төрөл бүрийн төрөл нь маш том тохиолдолд (зарим аж ахуйн нэгжүүд үнийн жагсаалтад хэдэн арван мянган бараа байдаг) бүх төрлийн барааны анхны шинжилгээг хийхгүй байж болох ч зарим тохиролцсон ангилалд нэгтгэж болно.

Бүс нутаг. Бизнесийн дэлхийн шинж чанараас хамааран тив, улс орнуудын бүлэг, улс, нутаг дэвсгэр, хот, дүүрэг, гудамж, гудамжны хэсэг гэж хэлж болно. Мэдээжийн хэрэг, хэрэв зөвхөн нэг гарц байгаа бол энэ хэмжээс байхгүй болно.

Худалдагч. Энэхүү хэмжилт нь бизнесийн бүтэц, цар хүрээнээс хамаарна. Энэ нь: Салбар, Дэлгүүр, Дилер, Борлуулалтын менежер байж болно. Зарим тохиолдолд хэмжилт байхгүй, жишээлбэл, худалдагч борлуулалтын хэмжээнд нөлөөлдөггүй, зөвхөн нэг дэлгүүр байдаг гэх мэт.

Худалдан авагч. Зарим тохиолдолд, тухайлбал, жижиглэнгийн худалдаанд үйлчлүүлэгч хувийн шинж чанартай, ямар ч хэмжилт байхгүй, бусад тохиолдолд худалдан авагчийн мэдээлэл байдаг бөгөөд борлуулалтад чухал ач холбогдолтой байдаг. Энэ хэмжигдэхүүн нь компани-худалдан авагчийн нэр эсвэл үйлчлүүлэгчдийн олон бүлэг, шинж чанарыг агуулж болно: Аж үйлдвэр, Аж ахуйн нэгжийн бүлэг, Эзэмшигч гэх мэт.Сонирхолтой холбоотой хамгийн чухал бүрэлдэхүүн хэсгүүдийг тодорхойлох борлуулалтын бүтцийн шинжилгээ. Үүнийг хийхийн тулд жишээлбэл, "Багана" гэсэн гурван хэмжээсийг нэг дор шалгаж үзэхэд төвөгтэй тохиолдолд "Бялуу" төрлийн диаграммыг ашиглах нь тохиромжтой. Жишээлбэл, "Компьютерийн технологи" дэлгүүрт энэ улиралд компьютерийн борлуулалт 100,000 доллар, гэрэл зургийн тоног төхөөрөмж - 10,000 доллар, хэрэглээний материал - 4,500 доллар байв. Дүгнэлт: дэлгүүрийн эргэлт нь компьютерийн борлуулалтаас ихээхэн хамаардаг (үнэндээ магадгүй зарцуулагдах материалкомпьютер зарахад зайлшгүй шаардлагатай боловч энэ нь дотоод хамаарлын дүн шинжилгээ юм).

Динамик шинжилгээ ( регрессийн шинжилгээ- чиг хандлагыг тодорхойлох). Чиг хандлага, улирлын хэлбэлзлийг тодорхойлох. Динамикийг "Шугам" төрлийн графикаар дүрслэн харуулав. Тухайлбал, жилийн хугацаанд Intel-ийн бүтээгдэхүүний борлуулалт буурсан бол Microsoft-ын борлуулалт өссөн байна. Магадгүй энгийн үйлчлүүлэгчийн сайн сайхан байдал сайжирсан эсвэл дэлгүүрийн дүр төрх, түүнийг дагаад үйлчлүүлэгчдийн бүрэлдэхүүн ч өөрчлөгдсөн байж магадгүй юм. Хүрээг тохируулах шаардлагатай. Өөр нэг жишээ: Өвлийн улиралд 3 жилийн турш видео камерын борлуулалт буурдаг.

Хараат байдлын шинжилгээ(корреляцийн шинжилгээ). Шаардлагатай нэр төрлийн "сагс" -ыг тодорхойлохын тулд цаг хугацааны туршид янз бүрийн барааны борлуулалтын хэмжээг харьцуулах. Үүний тулд "Line" төрлийн диаграмыг ашиглах нь бас тохиромжтой. Жишээлбэл, эхний хоёр сарын хугацаанд хэвлэгчийг худалдаанаас гаргахад нунтаг хайрцагны борлуулалт буурсан байна.

OLAP (OnLine Analytical Processing) нь тодорхой бүтээгдэхүүний нэр биш, харин өгөгдөлд дүн шинжилгээ хийх, тайлагнах бүхий л онлайн аналитик боловсруулах технологийн нэр юм. Хэрэглэгчид янз бүрийн хэсгүүдийн өгөгдлийг автоматаар нэгтгэн дүгнэж, тооцоолол, тайлангийн хэлбэрийг хурдан удирдах боломжийг олгодог олон хэмжээст хүснэгтээр хангагдсан болно.

Зарим хэвлэлд аналитик боловсруулалтыг онлайн болон интерактив гэж нэрлэдэг боловч "онлайн" гэсэн нэр томъёо нь OLAP технологийн утгыг хамгийн зөв тусгадаг. Удирдлагын удирдлагын шийдвэрийг боловсруулах нь автоматжуулалтад хамгийн буруу нийцсэн салбаруудын ангилалд багтдаг. Гэсэн хэдий ч өнөөдөр менежерт шийдвэр боловсруулахад туслах, хамгийн чухал нь шийдвэр боловсруулах, сонгох, батлах үйл явцыг ихээхэн хурдасгах боломж байна.

Шийдвэр гаргахад дэмжлэг үзүүлэх систем нь ихэвчлэн анхдагч багцаас авсан янз бүрийн түүврийн нэгдсэн өгөгдлийг хэрэглэгчдэд ойлголт, дүн шинжилгээ хийхэд тохиромжтой хэлбэрээр өгөх хэрэгсэлтэй байдаг. Дүрмээр бол ийм нэгтгэсэн функцуудихэвчлэн гиперкуб эсвэл метакуб гэж нэрлэгддэг олон хэмжээст өгөгдлийн багцыг бүрдүүлдэг бөгөөд тэнхлэгүүд нь параметрүүдийг агуулсан, эсүүд нь тэдгээрээс хамаарах нэгтгэсэн өгөгдлийг агуулдаг - мөн ийм өгөгдлийг харилцааны хүснэгтэд хадгалах боломжтой, гэхдээ энэ тохиолдолд бид логикийн тухай ярьж байна. өгөгдлийн зохион байгуулалт, харин тэдгээрийг хадгалах бодит хэрэгжилтийн талаар биш.

Тэнхлэг бүрийн дагуу өгөгдлийг янз бүрийн түвшний нарийвчилсан түвшнийг харуулсан шатлал болгон зохион байгуулж болно.

Олон хэмжээст загвар дахь хэмжүүрүүдийн дагуу аж ахуйн нэгжийн үйл ажиллагаанд нөлөөлж буй хүчин зүйлсийг (жишээлбэл: цаг хугацаа, бүтээгдэхүүн, компанийн салбар гэх мэт) хойш тавьдаг. Үүний үр дүнд үүссэн OLAP-шоо нь аж ахуйн нэгжийн үйл ажиллагааны үзүүлэлтүүд (үнэ, борлуулалт, төлөвлөгөө, ашиг, мөнгөн гүйлгээ гэх мэт) -ээр дүүрдэг. Геометрийн кубаас ялгаатай нь OLAP шооны нүүр нь ижил хэмжээтэй байх албагүй гэдгийг тэмдэглэх нь зүйтэй. Энэ дүүргэлтийг бодит өгөгдөлтэй адил хийж болно үйлдлийн системүүд, мөн түүхэн өгөгдөлд үндэслэн таамагласан. Hypercube хэмжээсүүд нь нарийн төвөгтэй, шаталсан байж болох ба тэдгээрийн хооронд харилцаа холбоо тогтоож болно. Шинжилгээний явцад хэрэглэгч өгөгдлийн талаархи үзэл бодлыг өөрчлөх боломжтой (логик үзэмжийг өөрчлөх үйл ажиллагаа гэж нэрлэдэг), ингэснээр өгөгдлийг өөр өөр хэсгүүдэд харж, тодорхой асуудлыг шийдэж чадна. Урьдчилан таамаглах, нөхцөлт хуваарь гаргах (ямар бол дүн шинжилгээ хийх) зэрэг куб дээр янз бүрийн үйлдлүүдийг хийж болно.

Энэхүү өгөгдлийн загварын ачаар хэрэглэгчид нарийн төвөгтэй асуулга боловсруулж, тайлан гаргаж, мэдээллийн дэд багц хүлээн авах боломжтой. Үйл ажиллагааны аналитик боловсруулалт нь удирдлагын ажилтнуудын шийдвэр гаргах, бэлтгэх үйл явцыг ихээхэн хялбарчилж, хурдасгах боломжтой. Онлайн аналитик боловсруулалт нь өгөгдлийг мэдээлэл болгон хувиргах зорилготой. Энэ нь ихэвчлэн бүтэцлэгдсэн тайлангуудыг авч үзэхэд суурилдаг уламжлалт шийдвэр гаргах үйл явцаас эрс ялгаатай.


OLAP технологи нь оюуны шинжилгээний төрөлд хамаарах бөгөөд 12 зарчмыг агуулдаг.

1. Үзэл баримтлалын олон хэмжээст дүрслэл. Хэрэглэгч-шинжээч нь аж ахуйн нэгжийн ертөнцийг олон хэмжээст шинж чанартай гэж үздэг бөгөөд OLAP загвар нь үндсэндээ олон хэмжээст байх ёстой.

2. Ил тод байдал. OLAP системийн архитектур нь нээлттэй байх ёстой бөгөөд хэрэглэгч хаана ч байсан аналитик хэрэгсэл болох үйлчлүүлэгчтэй сервертэй харилцах боломжийг олгоно.

3. Бэлэн байдал. OLAP аналитик хэрэглэгч нь харилцааны мэдээллийн сан дахь аж ахуйн нэгжийн хэмжээний өгөгдөл, мөн хуучин өгөгдлийн сангийн өгөгдөл, нийтлэг хандалтын аргууд, нийтлэг аналитик загвар дээр суурилсан нийтлэг ойлголтын схем дээр үндэслэн дүн шинжилгээ хийх чадвартай байх ёстой. OLAP систем нь зөвхөн шаардлагатай өгөгдөлд хандах ёстой бөгөөд шаардлагагүй оролтыг шаарддаг "гал тогооны юүлүүр" гэсэн ерөнхий зарчмыг ашиглах ёсгүй.

4. Тайлан боловсруулахад тогтвортой гүйцэтгэл. Хэмжээний тоо эсвэл мэдээллийн сангийн хэмжээ ихсэх тусам шинжээч хэрэглэгчийн гүйцэтгэл мэдэгдэхүйц буурах ёсгүй.

5. Үйлчлүүлэгч-серверийн архитектур. Өнөөдөр онлайн аналитик боловсруулалтанд хамрагдах шаардлагатай байгаа ихэнх өгөгдлүүд нь LAN-аар дамжуулан хэрэглэгчийн ажлын станц руу нэвтрэх боломжтой үндсэн фрэймүүд дээр агуулагддаг. Энэ нь OLAP бүтээгдэхүүн нь үйлчлүүлэгч-серверийн орчинд ажиллах чадвартай байх ёстой гэсэн үг юм.

6. Ерөнхий олон хэмжээст байдал. Хэмжээ бүрийг бүтэц, үйл ажиллагааны чадвараас үл хамааран хэрэглэх ёстой. Өгөгдлийн үндсэн бүтэц, томьёо, тайлангийн формат нь аль нэг хэмжигдэхүүн рүү хазайх ёсгүй.

7. Сийрэг матрицуудын динамик удирдлага. OLAP хэрэгслийн физик дизайн нь сийрэг матрицуудыг оновчтой удирдахын тулд тусгай аналитик загварт бүрэн нийцсэн байх ёстой. Сийрэг байдал (хоосон нүднүүдийн бүх боломжит нүднүүдийн хувиар хэмжигддэг) нь өгөгдөл түгээх шинж чанаруудын нэг юм.

8. Олон хэрэглэгчийн дэмжлэг. OLAP хэрэгсэл нь бүрэн бүтэн байдал, аюулгүй байдлыг хангахын зэрэгцээ асуулга хуваалцах, олон шинжээч хэрэглэгчдийг нэмэгдүүлэх боломжийг хангах ёстой.

9. Хязгааргүй хөндлөн үйл ажиллагаа. Янз бүрийн үйлдлүүд нь шаталсан шинж чанараасаа шалтгаалан OLAP загварт хамааралтай харилцааг илэрхийлж чаддаг, өөрөөр хэлбэл тэдгээр нь хоорондоо уялдаатай байдаг. Тэдгээрийн гүйцэтгэл нь шинжээч хэрэглэгчээс эдгээр тооцоо, үйлдлийг дахин тодорхойлохыг шаардах ёсгүй.

10. Өгөгдлийг зөн совингоор удирдах. Аналитик загварт тодорхойлсон хэмжигдэхүүнүүдийн талаархи шинжээч хэрэглэгчийн үзэл бодол нь OLAP загвар дээр үйлдэл хийхэд шаардлагатай бүх мэдээллийг агуулсан байх ёстой, i.e. тэдгээр нь цэсийн систем болон бусад олон хэрэглэгчийн интерфэйсийн үйлдлийг ашиглах шаардлагагүй.

11. Тайлагнах уян хатан сонголтууд. Тайлангийн хэрэгсэл нь аливаа боломжит чиг баримжаагаар өгөгдлийн загвараас үүссэн өгөгдөл эсвэл мэдээллийг нэгтгэсэн байх ёстой. Энэ нь тайлангийн мөр, багана эсвэл хуудаснууд нь OLAP загварын хэд хэдэн хэмжигдэхүүнийг нэгэн зэрэг харуулах ёстой бөгөөд хэмжигдэхүүнд агуулагдах элементүүдийн (утга) дэд багцыг дурын дарааллаар харуулах боломжтой гэсэн үг юм.

12. Хязгааргүй хэмжээс ба нэгтгэх түвшний тоо. Аналитик загварт шаардагдах шаардлагатай хэмжилтийн боломжит тооны талаархи судалгаагаар шинжээч хэрэглэгч 19 хүртэлх хэмжилтийг нэгэн зэрэг ашиглах боломжтойг харуулсан. Энэ нь OLAP системээр дэмжигдсэн хэмжээсийн тооны талаарх зөвлөмжийг хүргэж байна. Түүнчлэн, нийтлэг хэмжигдэхүүн бүрийг хэрэглэгчийн шинжээчийн тодорхойлсон нэгтгэх түвшний тоогоор хязгаарлаж болохгүй.

Одоогоор зах зээл дээр санал болгож буй тусгай OLAP системүүдийн хувьд та CalliGraph, Business Intelligence-ийг зааж өгч болно.

Өгөгдлийн шинжилгээний энгийн даалгавруудыг шийдвэрлэхийн тулд төсвийн шийдлийг ашиглах боломжтой - Microsoft Excel болон Access оффисын програмууд нь OLAP технологийн анхан шатны хэрэгслийг агуулсан пивот хүснэгт үүсгэх, тэдгээрт үндэслэн янз бүрийн тайлан гаргах боломжийг олгодог.