Аналитична обработка на информация. Начини за аналитична обработка на данни за подпомагане на вземането на решения. Онлайн аналитична обработка (OLAP) Технология за аналитична обработка

Тема 6

КОРПОРАТИВНИ ИНФОРМАЦИОННИ СИСТЕМИ ЗА ОБРАБОТКА НА ИКОНОМИЧЕСКА ИНФОРМАЦИЯ

Концепцията за корпоративни информационни технологии

Същност и значение на корпоративните информационни технологии

Сред разнообразието от програми за бизнес под термина " Информационни технологиив корпоративното управление" традиционно се разбира като "сложни системи за автоматизация на управление". Известни са и другите им наименования - корпоративни системи, корпоративни информационни системи (CIS), корпоративни (или комплексни) системи за управление (CMS), автоматизирани системи за управление (ACS). ).

По правило сложните системи за автоматизация на управление са "основни" универсални решения, подходящи за различни видовепредприятия. На първо място, това се отнася за финансово управление, управление на запасите, управление на покупки и продажби. Но същите тези системи често имат специфични за индустрията решения, които отразяват тази или онази специфика и съдържат подходящата регулаторна и референтна база.

Например, системното решение SAP R/3 за авиационната индустрия поддържа записване и контрол на серийните производствени номера на всички части на самолета, техния експлоатационен живот, планирана подмяна или ремонт, което гарантира не само надеждност на производството, но и безопасността на пътниците.

Тъй като интегрираните системи за управление са фокусирани предимно върху големи предприятия, съдържащи диверсифицирани структури, те не само предлагат разработен набор от функции, но също така предоставят сигурно съхранениеи обработка на големи обеми информация, използвайки мощни платформи и системни инструменти за многопотребителска работа.

Съвременните информационни технологии, комуникациите и интернет ни позволяват да решаваме проблеми отдалечен достъпкъм единна база данни, което е от значение и за корпоративното управление.

Концепция на сградата

Въпреки че повечето разработчици наричат ​​своите софтуерни продукти управление (предприятие, склад, финанси и т.н.), всъщност почти всички софтуер, използвани в корпоративното управление, са регистриращи факти и документи за финансови и икономически дейности, счетоводни системи с възможност за изграждане на отчети и сертификати в раздели, които са приемливи по аналитични характеристики. Тоест в базата данни се въвежда структурирана информация. Тази структура е заложена в една или друга степен от взаимосвързани справочници, класификатори, параметри и форми на стандартни документи. Според информацията, налична в базата данни, т. нар. "разфасовка" е "изградена", "начертана", "сглобена" с инструменти. След получаване на отчети и сертификати, базирани на такива данни, често наричани аналитични, ръководството може да вземе решения. Това е типичната концепция и типична технология за работа със системи от разглеждания клас.



Неслучайно такова различно функционално съдържание, системни решения, предназначението и използването на софтуера за "управление", като "Galaktika", "BEST" и "1C: Enterprise", е сходно по отношение на принципите на организиране на информацията, технологията на нейното формиране и обработка, както и методите на взаимодействие със системите.

Въпреки това предприятията, например OAO Uralelektromed, поставят толкова строги и разнообразни изисквания към инструментите за корпоративно управление, че става необходимо те да бъдат изградени на многостепенна основа. Обикновено ядрото е ядрото на системата, съдържащо само програмни кодове. Следващият концептуално важен елемент е вграденият инструментариум на системата, който позволява, без да се променят програмните кодове, поне да се конфигурира на работното място, да се извършват специфични операции, да се въвеждат нови и да се променят съществуващи форми на първични и отчетни документи и използвайте други параметрични настройки. По-развитите системи имат вградени инструменти за създаване на различни корпоративни модели: информационни, организационни, функционални и др. И накрая, самата база данни.

Аналитична обработка на информация

Планирането на дейността на предприятието, получаването на оперативна информация и вземането на правилно решение въз основа на нейния анализ е свързано с обработката на големи количества данни. Справки, генерирани в счетоводството корпоративни системиах управление, обикновено лишено от гъвкавост. Те не могат да бъдат „усукани“, „разширени“ или „свити“, за да се получи желаното представяне на данните, включително графично представяне. Колкото повече „съкращения“ и „съкращения“ можете да направите, толкова по-реалистично можете да си представите картината на дейността на предприятието и да вземете най-доброто решение за управление на бизнес процесите. Подобни задачи изискват математическо и икономическо моделиране, както и висока скорост. Аналитичният модул е ​​наличен в системата "RepCo", по-известна е системата "Triumph-Analytics" (Корпорация "ПАРУС" - "Tora Center"). Изглежда, че счетоводните системи изграждат сертификати в различни „секции“ според информацията, съхранена в базата данни, те просто представят това, което е. А аналитичните системи изграждат нова информация според дадени параметриили критерии, оптимизирайки го за конкретни цели. Затова по-често специален инструментза разглеждане и визуализиране на информация, което представлява “онлайн анализ на данни” (OLAP - online analytical processing). Предоставя набор от удобни и бързи инструменти за достъп, преглед и многоизмерен анализ на информацията, натрупана в хранилището.

OLAP-технологиите се използват за моделиране на ситуацията по схемата „какво ще се случи, ако…“, за съставяне на различни аналитични отчети. Има специализирани западни софтуерни продукти.

Обикновено информацията се прехвърля от корпоративните системи за управление към специализирани програмианалитична обработка на данни. Много местни разработчици се опитват да решат тези проблеми сами, например компаниите Nikos-Soft (система NS-2000), Cepheus (система за корпоративно управление Etalon), COMSOFT (софтуерно-методологичен и инструментален комплекс COMSOFT-STANDARD "2.0) и други.

6.4. Перспективи за развитие и използване на корпоративните информационни технологии

В допълнение към разработването и използването на съвременни инструменти и платформи, както и системни инструменти, развитието на вътрешните корпоративни системи включва тяхното функционално насищане, особено по отношение на производството.

Въпреки широко разпространения ентусиазъм за прилагането на стандартите за управление, водещите играчи на вътрешния пазар софтуер, се занимават с разработване на индустриални решения за различни видове индустрии.

Страховете на фирмите да отворят "конфиденциалността" на своите разработки намаляват, което допринася за консолидирането на усилията им да интегрират продуктите си, вместо да разработват всичко от "а" до "я" сами. Днес никой няма достатъчно ресурси. За разбиране нова концепция, разработването на проект и система, а именно система, която променя качеството си в зависимост от това какво има в нея, отнема години. В допълнение, изискването за интегриране на софтуерни продукти се предлага и от предприятия, които искат да продължат да „работят“, като правило, специализирани системи и информационно да ги комбинират с новопридобити.

Интеграция е необходима и за продукти от различни производители – в името на съчетаването на комплексни решения със специализирани:

– бюджетиране, финансово-икономически анализи, обслужване на клиенти, аналитична обработка на данни и др.

Трябва да се отбележи, че не самите системи за контрол са по-обещаващи, а прост и универсален инструмент за тяхното създаване, предназначен за квалифицирани посредници между разработчика и крайния потребител. Сега тези функции се опитват да изпълняват системни администратории анализи.

Ако такъв инструмент е наличен, "готов" стандартни решенияза всички бизнеси във всички индустрии.

Интернет като допълнителен инструмент за развитие на бизнеса може да се използва ефективно само ако има интегрирана система за управление.

Въпреки че съвременната информация и комуникационни технологии, включително интернет, и ви позволяват да организирате отдаване под наем на софтуер, е преждевременно да се говори за краткосрочно използване на такива възможности, особено в нашата страна. И не толкова поради съображения за конфиденциалност, а поради липсата на ред и надеждни средства за комуникация.

Опитите да се въведе и използва опитът, макар и не пълен, на информационните технологии в местните предприятия доказаха на практика, че "невъзможно е да се автоматизира хаосът". Необходима е предварителна реорганизация на бизнеса и самото предприятие, както и изграждане на управленски наредби (инструкции). За служителите на предприятието е трудно да се справят сами с такава работа. Особено предвид фактора време в пазарните условия. Следователно навсякъде се развива практиката на взаимодействие с консултантски компании, които помагат на предприятията и учат служителите си да „разширяват тесните места“, да установяват основния бизнес процес, да развиват технологии, да изграждат информационни потоци и др. Автоматизирането на установен процес е по-лесно, по-просто, по-евтино, по-бързо.

Всеки трябва да си върши работата. Счетоводител, складодържател, мениджър продажби и други специалисти по „предмет“ не трябва да подобряват формата на формулярите на документи, да раздалечават колоните или да променят местата им поради промени в законодателството или бизнес моделите. Поради това пазарът на софтуер постепенно се превръща от "бакалия" в "обслужващ". Започва да се развива аутсорсингът - прехвърлянето на някои функции на предприятието на специалисти от участващи компании. Те се занимават с поддръжка на оборудване, системен софтуер, модификация на приложната (функционална) част на системите и др.

Най-важното и актуално при използването на корпоративните системи за управление е информационната технология и методическото обслужване на техните потребители и потребители.

UDK 621. 37/39. 061.2/4

МЕТОДИ ЗА АНАЛИТИЧНА ОБРАБОТКА НА ИНФОРМАЦИЯТА

ГВОЗДИНСКЯ.Н., КЛИМКО Е.Г., СОРОКОВОЙ А.И.

Извършва се аналитичен преглед на методите за извличане на данни (наричани още: IAD, извличане на данни, откриване на знания в бази данни), като се взема предвид използването на определен метод за условията на Украйна. Разгледан е преглед на методите за аналитична обработка на информация в сложни информационни системи от гледна точка на скоростта на извличане на данни, събиране на обобщена информация и повишаване на надеждността на процеса.

Процесът на извличане на данни е аналитично изследване на големи количества информация, за да се определят модели и връзки между променливи, които след това могат да бъдат приложени към нови данни. Получената информация се преобразува до нивото на информация, което се характеризира като знание. Този процес се състои от три основни стъпки:

Проучване (разкриване на модели);

Използване на идентифицираните модели за изграждане на модел;

Анализ на изключенията за откриване и обяснение на отклонения в откритите модели.

Намирането на нови знания с помощта на IAD е ново и бързо развиващо се направление, използващо методи изкуствен интелект, математика, статистика. Този процес включва следните стъпки:

Дефиниране на проблем (проблемна постановка);

Подготовка на данни;

Събиране на данни: тяхната оценка, интегриране и почистване, селекция и трансформация;

Изграждане на модел: оценка и интерпретация, външно валидиране;

Използване на модела;

Наблюдение на модела.

За да се изгради модел и да се подобри качеството му, помага официалното валидиране на данни чрез поредица от заявки или предварително извличане на данни. Средствата за такъв анализ включват следните основни методи: невронни мрежи, дървета на решенията, генетични алгоритми, както и техните комбинации.

Невронните мрежи принадлежат към класа на нелинейните адаптивни системи, по структура те условно наподобяват нервната тъкан на невроните.

Това е набор от възли, свързани помежду си, които получават входни данни, обработват ги и произвеждат някакъв резултат на изхода. Възлите на долния слой се доставят със стойностите на входните параметри, на тяхна база се извършват изчисленията, необходими за вземане на решения, прогнозиране на развитието на ситуацията и др.

Тези стойности се считат за сигнали, които се предават на горния слой, увеличавайки се или намалявайки в зависимост от числените стойности (тегла), приписани на междуневронните връзки. На изхода на неврона от най-горния слой се генерира стойност, която се счита за отговор, реакцията на цялата мрежа към входа начални стойности. Тъй като всеки елемент от невронната мрежа е частично изолиран от своите съседи, такива алгоритми имат способността да паралелизират изчисленията. На фиг. 1 показва условно

Фиг. 1. Невронна мрежа

Размерът и структурата на мрежата трябва да съответстват на същността на изследваното явление. Изградената мрежа се подлага на процеса на т. нар. "обучение". Невроните на мрежата обработват входните данни, за които са известни както стойностите на входните параметри, така и верните отговори на тях. Обучението се състои в избор на теглата на междуневронните връзки, които осигуряват най-голяма близост на отговорите на мрежата до известните верни отговори. След обучение на наличните данни, мрежата е готова за работа и може да се използва за прогнозиране на поведението на даден обект в бъдеще, въз основа на данните за неговото развитие в миналото, извършване на анализи и идентифициране на отклонения и прилики. Могат да се формират надеждни прогнози, без да се уточнява типът зависимости, на базата на които се базира.

Невронните мрежи се използват за решаване на проблеми с прогнозиране, класификация или контрол.

Предимство - мрежите могат да апроксимират всяка непрекъсната функция, няма нужда да се правят никакви предположения за модела предварително. Изследваните данни може да са непълни или с шум.

Недостатъкът е необходимостта от голямо количество обучителна извадка. Крайното решение зависи от първоначални настройкимрежи. Данните трябва да бъдат преобразувани в цифров вид. Полученият модел не обяснява откритите знания (т.нар. „черна кутия“).

Дърветата на решенията използват разделянето на данни в групи въз основа на стойностите на променливите. Резултатът е йерархична структура от твърдения „Ако...Тогава...“, която прилича на дърво. За да класифицирате обект или ситуация, трябва да отговорите на въпросите в възлите на това дърво, като започнете от неговия корен. Ако отговорът е положителен, преминете към десния възел на следващото ниво, ако е отрицателен - към левия възел и т.н. Завършвайки отговорите, те стигат до един от крайните възли, където

RI, 2000, № 4

показва към кой клас трябва да бъде причислен въпросният обект.

Дърветата на решенията са предназначени да решават проблеми с класификацията и следователно имат много ограничена употреба във финансите и бизнеса.

Предимството на метода е просто и разбираемо представяне на функциите за потребителите. Като целева променлива се използват както измерени, така и неизмерени характеристики - това разширява обхвата на метода.

Недостатъкът е проблемът със значимостта. Данните могат да бъдат разделени на много специални случаи, има „храстовидност” на дървото, което не може да даде статистически валидни отговори. Полезни резултати се получават само в случай на независими характеристики.

Генетичните алгоритми имитират процеса на естествен подбор в природата. За решаване на проблем, който е по-оптимален от гледна точка на някакъв критерий, всички решения се описват с набор от числа или количества с нечислов характер. Търсенето на оптималното решение е подобно на еволюцията на популация от индивиди, които са представени от техните набори от хромозоми. Има три механизма, които работят в тази еволюция, показани на фиг. 2.

Могат да се разграничат следните механизми:

Избор на най-силните набори от хромозоми, които съответстват на най-оптималните решения;

Кръстосване - получаване на нови индивиди чрез смесване на хромозомни набори от избрани индивиди;

Мутациите са случайни промени в гените на някои индивиди в популацията.

В резултат на смяната на поколенията се разработва решение на проблема, което вече не може да бъде подобрено.

Предимство - методът е удобен за решаване на различни проблеми на комбинаториката и оптимизацията, за предпочитане е по-скоро като инструмент за научни изследвания.

Недостатъкът е възможността за ефективно формулиране на проблема, определяне на критерия за избор на хромозоми и самата процедура за избор са евристични и само специалист може да го направи. Формулирането на проблема в термини не дава възможност да се анализира статистическата значимост на решението, получено с тяхна помощ.

Компютърните технологии за интелигентна аналитична обработка на данни позволяват използването на методите на изкуствения интелект, статистиката, теорията на базите данни и дават възможност за създаване на съвременни интелигентни системи.

Понастоящем остро стои въпросът за създаването на информационни складове (склад за данни, склад за данни) - оптимално организирани бази данни, които осигуряват най-бързия и удобен достъп до информацията, необходима за вземане на решения. В хранилището се натрупва надеждна информация от различни източници за дълъг период от време, която остава непроменена. Данните се агрегират и съхраняват според областите, които описват (специфични за домейна) и отговарят на изискванията на цялото предприятие (интегрирано).

Като се има предвид относително краткият период на съществуване на повечето местни предприятия, недостигът на анализирани данни, нестабилността на предприятията, които са обект на промяна поради промени в законодателна рамка, съществува трудност при разработването на ефективна стратегия за вземане на решения с помощта на системи за извличане на данни. Ето защо се прогнозира, че генетичните алгоритми са най-приемливият метод за изследване на данни в областта на финансите и бизнеса, а за задачите по класифициране на изображения и факти е по-добре да се използват методи на дървото на решенията или невронни мрежи.

Литература: 1. Shchavelev L.V. Извличане на данни. http://www.citforum.ru/seminars/cis99/sch_04.shtml, 2. Буров К. Откриване на знания в хранилища за данни / / отворени системи. 1999. № 5-6., http: / /www.osp.ru/os/l999/05-06/14.htm. 3. Киселев М, Соломатин Е. Средства за извличане на знания в бизнеса и финансите // Отворени системи. 1997. № 4. стр. 41-44. 4. Кречетов Н, Иванов П. Продукти за извличане на данни // Компютърна седмица - Москва. 1997. № 14-15. стр. 32-39. 5. Edelstein H. Интелигентни инструменти за анализиране и представяне на данни в информационни складове // Компютърна седмица - Москва. 1996. № 16. стр. 32-35.

Получено в редакцията на 22.06.2000 г

Рецензент: д-р техн. науки, проф. Путятин В.П.

Гвоздински Анатолий Николаевич, д-р. техн. наук, професор в катедрата по изкуствен интелект KhTURE. Научни интереси: оценка на ефективността на комплексни информационни системи за управление. Интереси и хобита: класическа музика, туризъм. Адрес: Украйна, 61166, Харков, ул. акад. Ляпунова, 7, ап. 9, тел. 32-69-08.

Климко Елена Генриховна, асистент на катедрата по компютърни технологии и информационни системи, Полтавски държавен технически университет на името на Юрий Кондратюк. Следдипломен студент (по време на работа) на катедрата по изкуствен интелект на KhTURE. Научни интереси: анализ на аналитични данни. Интереси и хобита: четене, плетене. Адрес: Украйна, 36021, Полтава, ул. Диамант, 1-А, ап. 34, тел. (053-22) 3-43-12.

Сороков Александър Иванович, д-р. техн. наук, доцент в катедрата по компютърни технологии и информационни системи, Полтавски държавен технически университет „Юрий Кондратюк“. Научни интереси: KDD (Откриване на знания). Интереси и хобита: кучета. Адрес: Украйна, 36022, Полтава, пер. Брокен, 37А, тел. (053-2) 18-60-87, e-mail: [имейл защитен]

След проверка на пълнотата и достоверността на информацията се извършва нейната аналитична обработка. Той включва дефинирането на система от показатели, чието изследване е необходимо за постигане на целите на анализа. Тези показатели или вече се съдържат в избраната информация, или се изчисляват в процеса на нейната аналитична обработка.

Системата от показатели означава такъв подреден набор от тях, в който всеки показател дава качествена и количествена характеристика на определен аспект от дейността на икономическия субект, взаимосвързан е с други показатели, но не ги дублира и има свойствата на сводимост и делимост.

Броят на показателите в процеса на аналитична обработка на информацията може да се увеличи почти неограничено чрез тяхното диференциране или интегриране в зависимост от програмата за анализ, дълбочината на изследване на резултатите от дейностите и факторите, които ги влияят.

Тъй като дейността на икономическите субекти, техните структурни подразделения, както и техните различни асоциации, като цяло са доста стабилни, системата от показатели, с които се анализира, има известна стабилност, но постепенно се обогатява с нови показатели, когато възникват нови задачи, се променят. в общата икономическа ситуация, външните и вътрешните условия на дейност на икономическите субекти.

Необходима предпоставка за разработването на система от аналитични показатели и правилното й прилагане е групирането на тези показатели по различни критерии (виж фиг. 4.1).

Подразделение на показателите на абсолютени роднинае от съществено значение за определяне на мащаба и сложността на аналитичната обработка на информацията.

Информацията, събрана от различни източници, съдържа предимно абсолютни показатели, които характеризират обема на дейността на анализирания икономически субект (например обемът на продажбите на стоки, размерът на разходите за производство на стоки или услуги, обемът на търговията на едро или дребно търговия, сумата на аванс




Ориз. 4.1. Класификация на аналитичните показатели по различни

характеристики на групиране

капитал, размера на печалбата или загубата, броя на служителите, цената на дълготрайните активи, размера на материалните запаси).

Относителните показатели, които са от първостепенно значение за оценка на работата на анализираната организация като цяло или нейните вътрешни структурни подразделения, вече се изчисляват чрез различни математически операции в процеса на аналитична обработка на информацията. Такава аналитична обработка може да бъде частично предвидена от съответните разпоредби като задълженията на счетоводния отдел и други вътрешни структурни подразделения на икономическия субект (например определяне на себестойността на отделните продукти, нивото на печалба по отношение на капитала, изчисление на икономически стандарти като част от отчетността на търговските банки).

Изчисляването на относителните показатели подобрява съпоставимостта на данните за различни хронологични периоди, тъй като всички абсолютни показатели, използвани за тази цел в математическите формули, се изчисляват във валута, която има еднаква покупателна способност, т.е. елиминира се влиянието на инфлацията. Освен това всички абсолютни показатели, свързани с даден период, се формират под влияние на една и съща вътрешна и външна ситуация. Ето защо при анализа динамичните и пространствените сравнения се правят предимно с относителни, а не с абсолютни показатели.

За да се подобри съпоставимостта на данните, те се използват, когато е възможно, естественои превърнати в натурални с помощта на специално установени коефициенти, т.нар условно естественометра. За същата цел в някои случаи се дава предпочитание на труди цена на елементаметри, което позволява да се елиминира, ако е необходимо, влиянието върху абсолютните показатели на промените в цената на стоките и в относителните показатели, получени от тази стойност, разликите в цената на стоките, причинени от колебания в съотношението на прехвърлената цена на дълготрайни активи, заплати на живия труд и печалба в цената на продуктите. Трябва да се има предвид, че дори когато се използва твърда чуждестранна валута за измерване на разходите на абсолютни показатели, влиянието на структурните промени върху оценката на обема на дейността на икономическия субект и неговите качествени характеристики не се елиминира. Ето защо в по-нататъшното изложение ще бъдат специално разгледани въпросите и използването на различни натурални, условно натурални, трудови и непълноценни измерватели за постигане на някои цели на анализа.

Групиране на аналитичните показатели в количествени качествое много близо до разделението им на абсолютно и относително, но не съвпада напълно с него. Например общият размер на печалбата е количествен показател, но по отношение на икономическото си съдържание се отнася до качествените характеристики на дейността на обекта, тъй като самият факт на реализиране на печалба, а не загуба, дори без да се извлича относителна рентабилност показатели, вече изглежда положителен резултат от дейността.

Изключително важна роля в икономическия анализ играе разделянето на показателите според обобщаващи частен.

За обобщаващи показатели се считат показателите, с помощта на които се дават обобщена характеристикасъстоянието на анализирания икономически субект, степента на използване от него на ресурсите, с които разполага и ефективността на управлението, изразяваща се в постигане на преследваните цели. Основните цели могат да бъдат получаване на по-висока печалба в сравнение с лихвения процент на рефинансиране или с други алтернативни начиниизползване на наличния капитал на субекта; постигане на по-високо качество на стоките и услугите от това на конкурентите при същото или по-ниско ниво на разходите за тяхното производство и обращение; на тази база завладяването на нови пазари и повишаването на цената на фирмата. Обобщаващите показатели също включват показатели, които най-общо характеризират определена страна или посока на предприятието или отделните му структурни подразделения, размера на използваните от тях ресурси и техния оборот. Всеки обобщаващ показател може да се разложи на редица отделни показатели, които играят подчинена роля по отношение на него. Тези частни показатели допринасят за идентифицирането и измерването на влиянието на отделните вътрешни и външни фактори, които определят размера и динамиката на обобщаващия показател. С помощта на частни показатели се постига подчинение на местните цели на отделните звена и дейности на икономическия субект на общите цели на неговото функциониране. Общата цел на функционирането на един икономически субект не е еднозначна, тя предполага едновременното и взаимосвързано постигане на редица цели, поради което степента на нейното постигане се отразява не от един, а от цяла система от обобщаващи и частни показатели. .

За да се управлява дейността на икономическия субект като цяло, неговите отделни области и действия на всеки изпълнител, първо се разработва модел на тази дейност. Той се описва чрез система от обобщаващи и частни показатели, определени в бизнес плана, чието ниво и взаимовръзка трябва да осигури постигането на планираните резултати от изпълнението.

Системата от планирани показатели като правило е по-бедна от системата от счетоводни показатели, тъй като счетоводството отразява въздействието не само на фактори, които могат да бъдат предвидени предварително, но и на много непредвидими фактори - обективни и субективни, например природни бедствия , некоректност на изпълнителите, измами и кражби. Следователно счетоводството отразява въздействието върху обобщаващи и частни показатели на цялото многообразие на реалността.

Системата от аналитични показатели е дори по-широка, отколкото в плана и счетоводството, тъй като трябва да отразява резултатите от управлението и оценка на нивото на неговата ефективност във всички планирани области и многобройни цели, а не само като цяло за относително изследвана самостоятелна икономическа система (предприятие, търговска банка), но и за нейните големи и малки подразделения; идентифицирайте ролята на отделните единици в крайни резултатидейности и влиянието на различни фактори върху икономическото развитие. Следователно системата от аналитични показатели включва както обобщаващи показатели (резултати), диференцирани по области на дейност, така и частни (факторни) показатели.

Отделни показатели, образувани чрез разлагане на обобщаващ показател или агрегирани в обобщаващ показател, се наричат ​​също факторни показатели в анализа на икономическата дейност, тъй като тяхното използване позволява да се разкрие и измери влиянието на определени икономически фактори върху обобщаващите показатели. Както знаете, промените в състоянието на анализирания обект възникват под въздействието на икономически и социални фактори. Обикновено терминът „причина” се прилага за група фактори, чието влияние може да се установи директно от счетоводните и отчетните данни. При по-нататъшно разлагане на групата на нейните компоненти, получените частични факторни показатели се наричат ​​още причини, ако връзката им с анализирания показател е функционална и те могат да бъдат изчислени чрез извършване на различни математически операции върху отчетните показатели.

В случаите, когато се разкрива и измерва влиянието върху анализирания показател на други, свързани с него в корелация, и силата на тяхното влияние се измерва с помощта на статистически и математически методи, конкретните показатели, получени за детайлизиране на анализа, обикновено вече не се наричат ​​причини , но фактори.

Следователно разграничението между понятията "причина" и "фактор" е много условно. Основно се основава на възможностите за пряко или косвено измерване на тяхното влияние, като се отчита естеството на връзката с анализирания обобщаващ показател.

Например, отклоненията от плана за обема на производството могат да бъдат причинени от несъответствие между плана за броя и състава на персонала и в същото време средната производителност на работник за анализирания период. Стойностите на горните агрегирани групи фактори и техните отклонения от плана се отразяват директно в отчетите и се наричат ​​в анализа причини за отклонения. Въпреки това, всяка от тези причини може допълнително да се разглежда като функция на много променливи. И така, промяната в броя на служителите е детайлизирана по категории персонал, продукцията на служител е представена като произведение от продукцията на работник и дела на работниците в общия брой на служителите. Тези аналитични показатели могат да бъдат изчислени чрез директно използване на отчетни данни и затова се наричат ​​още по-диференцирани причини за промяна на обобщения показател.

Да приемем, че анализът се задълбочава допълнително, за да се установи влиянието върху изменението на обобщаващия показател - обема на производството на фактори, които от своя страна влияят върху изпълнението на плана за продукция на един работник, връзката между които с този показател не може да се установи директно. Например, задачата е да се определи влиянието върху средното ниво на производителност на работното организационно и техническо ниво на производството (степента на механизация и автоматизация на основните технологични процесии спомагателна работа, въвеждане на методи за научна организация на труда, външно сътрудничество и др.) и лични фактори (общо и специално образование, трудов стаж, пол, възраст).

Според обобщените данни на счетоводството и статистическото отчитане е невъзможно да се измери влиянието на изброените фактори върху производството и чрез него върху обема на производството или върху темпа на неговия растеж. За целта чрез специални икономико-математически методи (главно корелационни) се събират и обработват първични счетоводни и документационни данни. технически услуги, отдели за персонал, труд и заплати, както и специално събрана допълнителна извънсчетоводна информация (анкета, снимки и автоснимки на работния ден, протоколи от производствени срещи и др.). С такова допълнително уточняване на причините техните характеристики вече се наричат ​​фактори.

Измерването на влиянието на отделните фактори върху динамиката на икономическото развитие, резултатите от изпълнението на плана и ефективността на управлението помага да се установи относителната им значимост в работата на предприятието, да се съсредоточи върху основните и решаващи и да се увеличи ефективността на анализа при идентифициране на резервите.

Единството на системата от показатели и методологията за тяхното изчисляване трябва да се осигури за предприятия от един и същи профил. Опитите за прилагане на едни и същи оценени показатели в икономически субекти от различни сектори на националната икономика не се материализираха, тъй като не се изисква идентичността на използваните показатели, а тяхното съответствие с основния подход за оценка на резултатите, постигнати от анализираните субект от гледна точка на целите на неговата дейност, локални и глобални критерии за постигането им.

Компанията не винаги успява да постигне всичките си цели и да реши всички поставени пред нея задачи. Освен това, наред с изпълнението на плана по едни показатели може да се получи отрицателен резултат по други. В тази връзка, когато се определя рейтингът на икономическия субект, неговите структурни подразделения, е препоръчително да се изчисли условен интегрален показател, чието ниво отразява както степента на изпълнение на планираните цели за всеки от показателите, така и относителната им стойност.

Интегралният показател, изведен на базата на редица други, много различни по своето икономическо съдържание и практическо предназначение, не характеризира конкретните резултати от работата на анализирания субект и степента на постигане на множеството поставени пред него цели. Този индикатор може да се използва за определяне на рейтинга. Във всички останали случаи използването му не съответства на многоцелевия характер на функционирането на икономическите субекти.

За да се оцени изпълнението на плана и освен това нивото на икономическа ефективност, е необходимо да се вземат предвид всички показатели, включени в системата, тъй като преизпълнението на плана за един от тях не освобождава анализираната икономическа връзка от задължение за осигуряване постигането на планираното ниво по други показатели. Планираното по-горе подобрение на един от показателите обикновено не компенсира вредата, причинена от изоставането на друг показател, което отразява неизпълнението, може би, на още по-важна задача, възложена на този икономически субект. Например, значителен излишък от планираното ниво на производство на стоки (работи, услуги) не изключва необходимостта от осигуряване на определено ниво на разходите за единица продукция; преизпълнението на плана по отношение на обема на производството и печалбата не може да компенсира неизпълнението на плана за въвеждане в експлоатация на пречиствателни съоръжения и други мерки за опазване на околната среда.

Най-приемливият начин за конструиране на интегрален показател е да се реши математическата задача за изчисляване на разстоянията между точките, които характеризират стойностите на едни и същи показатели на сравняваните икономически субекти и на условно най-доброто предприятие за всички тези показатели, т. наречен стандарт на развитие и по този начин определя показателя за "нивото на развитие" на всеки от тях. Неговото предимство пред другите методи за изчисляване на интегралния показател е обективността на оценките, тъй като се основава на математически изчисления.

Други начини за агрегиране на показатели не са достатъчно обективни. Например, когато се изчислява интегрален показател, значението на един или друг показател в общата им система може да се определи и чрез точкова оценка. Така че, ако поради недостига на използвани редки метали, тяхното най-икономично използване е особено важно, тогава най-високата оценка се дава на показателя за намаляване на материалоемкостта на производството на тези метали. Ако на първо място е необходимо да се осигури по-нататъшно разширяване на асортимента, тогава чрез присвояване на по-висока оценка на този показател той се поставя на първо място в редица показатели за оценка. По този начин, въпреки факта, че оценката на ефективността на производството в отделните сектори на националната икономика и в техните предприятия се основава на една и съща система от показатели, всеки от тях може да получи различна оценка дори в една и съща индустрия или в предприятие в различни периоди от време. Оценяването на всеки показател трябва да отразява значението му за постигане на целите на функциониране на анализираните икономически субекти. В същото време, като всяка субективна оценка, тези точки могат да бъдат зададени произволно.

За разглеждания период има индикатори, които фиксират състоянието на анализирания икономически субект и резултатите от неговата дейност или действията на неговите служители в определена област с определен брой, т.е. в статичен, или за анализирания период, т.е. в динамика. Например балансът отразява финансовото състояние, разпределението на имуществото, източниците на неговото формиране към датата на съставяне и отчета за движението Париобхваща техните остатъци, получаване и изхвърляне, т.е. тяхната динамика за целия анализиран период.

Във връзка с дейността на анализирания икономически субект и възможностите за влияние върху резултатите от него, показателите, отразяващи обективно независимпричини и субективенв зависимост от това.

В процеса на анализ е много важно да се елиминира влиянието на фактори от обективен ред, които не могат да бъдат приписани на полезни резултати или, обратно, на недостатъците на дейността на самия икономически субект.

Наред с избора на система от показатели за анализ според планираната програма, от голямо значение е обобщаването на информацията в аналитични таблици и фигури. Аналитичните таблици се използват за сравняване на аналитично обработените данни по хронологични периоди и определяне на тази основа на динамиката на изследваните показатели, сравняване на техните постигнати или прогнозирани стойности с основни данни, които могат да бъдат съответните показатели от плана на предишни и прогнозирани бъдещи периоди, задължителни норми, показатели на други икономически субекти, средни за индустрията или всякакви други, избрани от анализатора въз основа на целта на изследването.

За такива сравнения обикновено се използват хоризонтални редове на аналитична таблица, в които се записват имената на сравняваните данни и техните абсолютни и относителни стойности. Такива сравнения между редовете на таблицата се наричат ​​хоризонтален анализ.

По колоните на аналитичната таблица се съпоставят обобщаващите показатели с техните съставни части - частни показатели, за да се идентифицират относителна стойносттези частни показатели при формирането на обобщаващи, по-специално се определя структурата на обобщаващите показатели. Този начин за отразяване на аналитично обработената информация се нарича вертикален или структурен анализ.

Аналитичната таблица има текстова (вляво) и цифрова (вдясно) части. За компютърна обработка на информация, текстовата част на таблицата може да бъде криптирана с помощта на буквени или цифрови обозначения. Числата се поставят в колоните на таблицата на отделни пресичащи ги редове.

Лявата страна на таблицата, в която са поставени имената на нейните редове, се нарича "субект", а дясната, състояща се от колони, над които също са посочени техните имена, се нарича "предикат".

Обобщение събрана информациявъв взаимосвързани, допълващи се или детайлизиращи аналитични таблици, дава възможност за така наречения безтекстов анализ; Внимателно аналитично обработената информация, поставена в таблиците, дава възможност да се направят необходимите изводи и да се разработят разумни управленски решения. В тези случаи не е необходимо резултатите от анализа да се представят под формата на текст или същият текст се представя изключително стегнато.

Изготвянето на набор от аналитични таблици, които отразяват с достатъчна обективност и пълнота всички въпроси на програмата за анализ и нейните резултати, изисква висок професионализъм от разработчиците на оформлението на тези таблици и инструкциите за попълването им.

Ето защо на практика за тази цел се използват стандартни методи и се правят само промени в препоръчаните в тях таблици, произтичащи от индивидуалните характеристики на анализирания икономически субект или ситуацията, която се е развила върху него.

Използвайки аналитични таблици и особено, правейки промени в тях, е необходимо да се спазват общите правила за тяхното проектиране:

1) над таблицата трябва да се постави нейното име и пореден номер;

2) ако едни и същи мерни единици се използват във всички редове и колони на таблицата, тогава в скоби под името на таблицата в десния ъгъл е необходимо да поставите стандартното обозначение на мерната единица, например (хиляда рубли) или ($). Ако в редовете на таблицата се използват различни мерни единици, тогава техните обозначения се поставят в заглавките на реда, разделени със запетая след името му. Ако в колоните се използват различни мерни единици, те също трябва да бъдат посочени в заглавията на колоните;

3) колоните на таблицата се номерират последователно, като се започне от първата, в която са посочени номерата на редовете. В случаите, когато индикаторите на различни колони се изчисляват въз основа на стойностите, показани в предходните колони, с изключение на името и сериен номертази колона трябва да бъде даден алгоритъм за изчисление, указващ номерата на колоните, съдържащи първоначалните данни, както и математическите операции, които трябва да се извършат с тях, за да се получат стойностите, посочени в тази колона, например: [ (колона 4 - колона 3) ∙ 100: 3] ;

4) заглавията в "предиката" са прости в случаите, когато неговите колони нямат общо съдържание или сложни - когато съдържанието, общо за няколко колони, е подробно описано във всяка от тях. Тогава заглавието се посочва под формата на няколко нива, например:

За да се подобри видимостта на материалите от анализа, често се използва графични методи. Например, таблици, които записват динамиката на индикаторите, са придружени от фигури, в които тази динамика е представена под формата на криви или ленти. Структурата на обобщаващите показатели в колоните на аналитичните таблици е илюстрирана под формата на кръгова диаграма. Използват се и други форми на диаграми.

Анна Иванова

Днес почти всяка компания, независимо дали е голяма или много малка, частна или публична, използва информационни системи в своята дейност и, като правило, не за първа година. Това означава, че повечето предприятия вече притежават определено количество натрупани данни и това количество често е със значителна стойност - поне това се потвърждава от факта, че през последните години в пресата се обръща доста голямо внимание на изтичането на корпоративни данни, които се считат за доходоносна стока за престъпния пазар.

Имайте предвид, че стойността на корпоративните данни се крие не само в общата стойност на отделните записи, но и в често много по-голямата стойност на набора от данни като източник на допълнителна информация, която не може да бъде получена от един или повече записи, като информация за модели, тенденции или взаимозависимости между всякакви данни, които ви позволяват да вземате определени бизнес решения. Ето защо съставът модерни средствауправлението на предприятието и веригата за доставки, банковите информационни системи и други бизнес приложения обикновено включват не само инструменти за въвеждане и редактиране на данни, но и инструменти за аналитична обработка, които позволяват по един или друг начин да се идентифицират и представят модели и тенденции в данните. Днес тези инструменти са много разнообразни. Те включват инструменти за изграждане на релационни хранилища за данни - специално проектирани бази данни, които ви позволяват бързо да изпълнявате заявки за избор на данни; сървърни и клиентски инструменти за изграждане на многомерни хранилища за данни, съдържащи агрегирани данни (суми, средни) в нерелационна структура; Клиентски приложения за предоставяне на потребителски интерфейси към релационни и многоизмерни хранилища на данни; инструменти за създаване на решения, базирани на такива хранилища, анализиране на многомерни и релационни данни, генериране на отчети за многомерни и релационни данни. По-долу ще обсъдим какви са продуктите от всяка от тези категории.

Складове за данни

Data Warehouse обикновено се нарича база данни, чиято основна цел е изпълнението на аналитични заявки за избор на данни. Хранилищата на данни могат да бъдат както релационни, така и многоизмерни.

Ралф Кимбъл, един от създателите на концепцията за хранилище на данни, описва хранилището на данни като „място, където хората имат достъп до своите данни“ (вижте например Ралф Кимбъл, Инструментариумът Data Warehouse: Практически техники за изграждане на дименсионални складове за данни, John Wiley & Sons, 1996 и Инструментариумът Data Webhouse: Изграждане на хранилище за данни с активиран уеб, John Wiley & Sons, 2000). Той също така формулира основните изисквания към хранилищата за данни:

  • поддръжка за високоскоростно извличане на данни от хранилище;
  • поддръжка за вътрешна последователност на данните;
  • способността да се получават и сравняват така наречените срезове с данни (slice and dice);
  • наличие на удобни помощни програми за преглед на данни в хранилището;
  • пълнота и надеждност на съхраняваните данни;
  • поддръжка за качествен процес на попълване на данни.

Често е невъзможно да се изпълнят всички изброени изисквания в рамките на един и същи продукт. Следователно за реализирането на хранилища за данни обикновено се използват няколко продукта, някои от които всъщност са средства за съхранение на данни, други са средства за извличането и прегледа им, трети са средства за попълването им и т.н.

Обърнете внимание, че при проектирането на складове винаги се правят априорни предположения относно естеството на взаимозависимостите на данните, поставени в тях, и ползите от използването на хранилище на данни при вземането на управленски решения до голяма степен зависят от правилността на тези допускания.

Релационни хранилища за данни

За разлика от така наречените онлайн бази данни, които се използват от приложения, които променят данни, релационните хранилища на данни са проектирани по такъв начин, че да постигнат минимално време за изпълнение на заявки за четене (от друга страна, оперативните бази данни най-често минимизират времето за изпълнение за заявки за промяна на данни). Обикновено данните се копират в хранилище от онлайн бази данни според определен график.

Типичната структура на хранилището на данни е значително по-различна от структурата на конвенционалната релационна СУБД. Обикновено тази структура е денормализирана (което подобрява производителността на заявките) и може да позволи излишък на данни. Типична структура на хранилище за данни е показана на фиг. 1. Основните компоненти на тази структура са таблицата на фактите и таблиците с измерения.

Таблица с факти(в примера на фигура 1 се нарича Sales_Fact) е основната таблица на хранилището на данни. По правило тя включва информация за обекти или събития, чиято съвкупност ще бъде допълнително анализирана. Обикновено такава таблица съдържа уникален съставен ключ, който комбинира първичните ключове на таблиците с измерения. Най-често това са цели числа или стойности от типа "дата / час" - в крайна сметка таблицата с факти може да съдържа стотици хиляди или дори милиони записи и съхраняването на повтарящи се текстови описания в нея обикновено е нерентабилно. В допълнение, таблицата с факти съдържа едно или повече цифрови полета, въз основа на които се получават обобщени данни по време на изпълнение на аналитични заявки.

Обърнете внимание, че в таблицата с факти няма информация за това как да групирате записи при изчисляване на обобщени данни. Тази информация се съдържа в таблици с размери.

Таблици с размерисъдържат неизменни или рядко променяни данни. Те имат поне едно описателно поле и обикновено целочислено ключово поле (обикновено сурогатен ключ). Често (но не винаги) таблицата с размери може също да съдържа полета, които сочат към допълнителни атрибути, които са били в оригиналната оперативна база данни, или към атрибути, отговорни за групирането на нейните собствени данни. Всяка таблица с измерения трябва да бъде във връзка "един към много" с таблицата с фактите.

Обърнете внимание, че темпът на растеж на таблиците с размери трябва да бъде незначителен в сравнение с темпа на растеж на таблицата с фактите; например, нов входв таблицата за измерване, характеризираща стоките, се добавя само когато се появи нов, непродаден преди това продукт.

Съвременните инструменти за проектиране на данни, като CA AllFusion Modeling Suite, обикновено включват шаблони за проектиране на хранилища за данни. Трябва да се каже, че понякога се използват специализирани СУБД за създаване на релационни хранилища за данни, съхранението на данни в които е оптимизирано по отношение на скоростта на изпълнение на заявките. Пример за такъв продукт е Sybase Adaptive Server IQ, който реализира нетрадиционен начин за съхранение на данни в таблици. Можете обаче да създадете хранилище в конвенционална релационна СУБД.

OLAP и многомерни хранилища за данни

Многоизмерните хранилища на данни формират основата на OLAP инструментите (On-Line Аналитична обработка), предназначени за комплексен многовариантен анализ на данни. Концепцията за OLAP е описана през 1993 г. от E. F. Codd, авторът на релационния модел на данни, а поддръжката на OLAP в момента е внедрена в много СУБД и инструменти за анализ на данни.

Многомерните хранилища обикновено съдържат агрегирани данни (например суми, средни стойности, преброяване) за различни проби. Най-често такива агрегатни функцииформират многоизмерен набор от данни, наречен куб, чиито оси (наречени измерения) съдържат параметрите и чиито клетки съдържат обобщените данни, които зависят от тях (понякога наричани мерки). По всяка ос данните могат да бъдат организирани в йерархии, които отразяват различни нива на детайлност. По правило обобщените данни се получават чрез изпълнение на поредица от заявки за групиране на данни от типа:

Имайте предвид, че доста често като източник на данни за подобни исканиярелационни хранилища за данни. В този случай таблиците с размери обикновено съдържат изходните данни за генериране на размерите на куба, а таблицата с факти съдържа изходните данни за изчисляване на мерките на куба.

Многомерните хранилища на данни съдържат обобщени данни с различна степен на детайлност, като например продажби по ден, месец, година, продуктова категория и т.н. Целта на съхраняването на обобщени данни е да се намали времето за изпълнение на заявката, тъй като в повечето случаи анализите и прогнозите не са интерес.подробни, а не обобщени данни. Въпреки това, запазването на всички обобщени данни не винаги е оправдано - в края на краищата, когато се добавят нови измерения, количеството данни, което съставлява куба, нараства експоненциално (понякога се говори за "експлозивен растеж" на количеството данни). За решаване на проблема с "експлозивния растеж" се използват различни схеми, които позволяват, когато се изчисляват далеч от всички възможни агрегирани данни, да се постигне приемлива скорост на изпълнение на заявката.

Както изходните, така и обобщените данни могат да се съхраняват в релационни или многоизмерни структури. Следователно в момента има три начина за съхраняване на данни:

  • MOLAP (Multidimensional OLAP) - изходните и обобщените данни се съхраняват в многомерна база данни;
  • ROLAP (Relational OLAP) - изходните данни остават в същата релационна база данни, където са били първоначално разположени, докато агрегираните данни се поставят в служебни таблици, специално създадени за тяхното съхранение в същата база данни;
  • HOLAP (Hybrid OLAP) - изходните данни остават в същата релационна база данни, където са били първоначално разположени, докато агрегираните данни се съхраняват в многоизмерна база данни.

Някои OLAP инструменти поддържат съхранение на данни само в релационни структури, други само в многомерни структури. Въпреки това, повечето съвременни OLAP сървърни инструменти поддържат и трите метода за съхранение на данни. Изборът на метод за съхранение зависи от обема и структурата на изходните данни, изискванията за скоростта на изпълнение на заявката и честотата на актуализиране на OLAP кубовете.

СУБД на водещите производители, пуснати през последните години - IBM, Microsoft, Oracle, съдържат инструменти за създаване на многомерни хранилища за данни (тази традиция започна преди няколко години от Microsoft, която включи OLAP сървър в SQL Server 7.0). Има и отделни продукти за създаване на OLAP хранилища - те се издават от Hyperion, Sybase, Business Objects и някои други.

извличане на данни

Терминът Data Mining (mining на английски означава „копаене“) се отнася до процеса на търсене на корелации, тенденции, връзки и модели между данни с помощта на различни математически и статистически алгоритми: групиране, създаване на подизвадки, регресионен и корелационен анализ. Примери за търсена информация могат да бъдат информация за това кои категории купувачи най-често купуват определен продукт, каква част от купувачите на един конкретен продукт купуват друг конкретен продукт, коя категория клиенти най-често не погасява навреме предоставения заем. Този вид информация обикновено се използва при прогнозиране, стратегическо планиране, анализ на риска и нейната стойност за предприятието е много висока.

Имайте предвид, че традиционната математическа статистика и OLAP инструментите не винаги са подходящи за решаване на такива проблеми. Обикновено статистическите методи и OLAP се използват за тестване на предварително формулирани хипотези, но често именно формулирането на хипотеза се оказва най-трудната задача при извършване на бизнес анализ за последващо вземане на решения, тъй като не всички модели в данните са очевидно на пръв поглед.

Основата на модерното технологии ДанниДобивът се основава на концепцията за модели, които отразяват моделите, присъщи на подизвадките от данни. Търсенето на модели се извършва чрез методи, които не използват никакви първоначални предположения за тези подизвадки. Ако статистическият анализ или приложението OLAP обикновено формулира въпроси като „Какъв е средният брой клиенти на банката, които не са изплатили заема навреме сред неженените мъже на възраст от 40 до 50 години?“, тогава използването на Data Mining, като правило, предполага отговори на въпроси като „Има ли типична категория клиенти, които не изплащат кредити навреме?“. В същото време именно отговорът на втория въпрос често осигурява приемането на успешно бизнес решение.

Важна характеристика на Data Mining е нестандартността и неочевидността на търсените модели. С други думи, инструментите за извличане на данни са различни от инструментите за обработка на статистически данни и OLAP инструментифактът, че вместо да проверяват взаимозависимостите, които потребителите са предполагали предварително, те могат сами да откриват такива взаимозависимости на базата на наличните данни и да изграждат хипотези за същността им. Използването на инструменти за извличане на данни обаче не изключва използването на статистически инструменти и OLAP инструменти, тъй като резултатите от обработката на данни с помощта на последните, като правило, допринасят за по-доброто разбиране на естеството на моделите, които трябва да се търсят. Следователно има инструменти за извличане на данни, които могат да търсят модели, корелации и тенденции както в релационни, така и в многоизмерни хранилища на данни.

Обикновено има пет стандартни типа модели, идентифицирани чрез методите за извличане на данни:

  • асоциация - голяма вероятност за свързване на събития помежду си (например алпийските ски често се купуват със ски обувки);
  • последователност - висока вероятност от верига от събития, свързани във времето (например в рамките на определен период след закупуването на принтер с висока вероятност разходни материалина него);
  • класификация - има знаци, които характеризират групата, към която принадлежи това или онова събитие или обект (обикновено определени правила се формулират въз основа на анализа на вече класифицирани събития);
  • групиране - модел, подобен на класификацията и различен от него по това, че самите групи не са зададени в този случай - те се откриват автоматично по време на обработка на данни;
  • времеви модели - наличието на модели в динамиката на поведението на определени данни (типичен пример са сезонните колебания в търсенето на определени стоки или услуги), използвани за прогнозиране.

Днес има доста голям брой различни методи за извличане на данни, сред които могат да се разграничат следните.

Регресионен, дисперсионен и корелационен анализ- внедрен в повечето съвременни статистически пакети, по-специално в продуктите на SAS Institute, StatSoft и др.

Методи за анализ в конкретна предметна областна базата на емпирични модели. Често се използва, например, в евтини инструменти за финансов анализ.

Алгоритми на невронни мрежи, чиято идея се основава на аналогия с функционирането на нервната тъкан и се състои в това, че първоначалните параметри се разглеждат като сигнали, които се трансформират в съответствие със съществуващите връзки между "невроните" и отговора (резултатът от анализа) е реакцията на цялата мрежа към първоначалните данни. Връзките в този случай се създават с помощта на така нареченото мрежово обучение чрез голяма извадка, съдържаща както оригиналните данни, така и верните отговори.

Метод на най-близкия съсед- избор на близък аналог на изходните данни от вече наличните натрупани данни.

Дървета на решенията- йерархична структура, базирана на набор от въпроси, предполагащи отговора "да" или "не"; въпреки че този метод за обработка на данни не винаги идеално намира съществуващи модели, той доста често се използва в системите за прогнозиране поради яснотата на отговора (фиг. 3).

Алгоритми за ограничено изброяване- изчисляване на честотите на комбинации от прости логически събития в подгрупи от данни.

еволюционно програмиране- търсене и генериране на алгоритъм, който изразява взаимозависимостта на данните, базиран на първоначално зададения алгоритъм, модифициран в процеса на търсене; понякога търсенето на взаимозависимости се извършва сред някои определени типове функции (например полиноми).

Инструментите за извличане на данни традиционно принадлежат към скъпите софтуерни инструменти - цената на някои от тях достига няколко десетки хиляди долара. Следователно доскоро основните потребители на тази технология бяха банки, финансови и застрахователни компании, големи търговски предприятия, а основните задачи, изискващи използването на Data Mining, се считаха за оценка на кредитните и застрахователни рискове и разработването на маркетингови политика, тарифни плановеи други принципи на работа с клиенти. През последните години ситуацията се промени донякъде: сравнително евтини инструменти за извличане на данни от няколко производители (включително Microsoft) се появиха на пазара на софтуер, което направи тази технология достъпна за малки и средни предприятия, които не са мислили за това преди.

Инструменти за визуализация на OLAP данни и резултати от Data Mining

Универсални инструменти за визуализация на OLAP данни се пускат от много компании, като Business Objects, Cognos, Panorama, ProClarity. По правило тези инструменти са предназначени за потребители, които имат известни познания за бази данни и статистически методи за анализ. Обикновено такива инструменти ви позволяват да осъществявате достъп до хранилища на данни и OLAP източници от различни доставчици (например многомерни хранилища, базирани на Oracle, Microsoft и IBM DBMS), да получавате части от многомерни данни и да изграждате диаграми въз основа на тях. Често доставчиците на тези инструменти също предоставят сървъри за междинен софтуер за извършване на анализ на данни и предоставяне на резултати за показване в клиентски приложения, както и инструменти за създаване на решения, базирани на клиентски инструменти и сървъри за междинен софтуер (например библиотеки от класове или ActiveX контроли). Като се има предвид, че ситуацията със стандартите за бизнес интелигентност все още е далеч от идеалната (за разлика от релационните СУБД, за многомерните СУБД няма нито общоприет стандарт за език за заявки, подобен на SQL, нито универсални механизми за достъп до данни, подобни на ODBC или OLEDB), използването такива инструменти могат в една или друга степен да решат проблема със създаването на аналитични приложения в компании, използващи СУБД и OLAP инструменти от няколко различни производители.

Производителите на OLAP инструменти, като Oracle и IBM, често пускат клиентски приложения, предназначени за достъп на потребителите до OLAP хранилища, създадени на базата на техни собствени сървърни инструменти. И така, Oracle Corporation дори има няколко от тези продукти, комбинирани в пакета Oracle Business Intelligence. В допълнение, добавките за електронни таблици за визуализиране на OLAP данни напоследък станаха широко разпространени. Например инструментите за показване на данни на Microsoft SQL Server Analytic Services са достъпни за потребителите Microsoft Excel 2000 и по-нови версии, както и Oracle и Hyperion пускат допълнителни модули за достъп, вградени в същия Excel за достъп до техните собствени OLAP хранилища.

Заслужава да се отбележи разширяването през последните години на гамата от аналитични продукти, фокусирани върху обслужването на определени индустрии (например търговия на дребно или едро, финансови услуги). Те също се произвеждат от компаниите, изброени по-горе, и редица други производители, по-специално доставчици на системи за управление на предприятия и други специфични за индустрията бизнес приложения.

Инструменти за генериране на отчети

Отчетът е документ, чието съдържание се генерира динамично въз основа на информацията, съдържаща се в базата данни. В момента има много инструменти за отчитане на софтуерния пазар: както самостоятелни продукти, така и включени в инструментите за разработка на приложения или СУБД и внедрени като сървърни услуги или клиентски приложения. Като правило, инструментите за отчитане поддържат широк набор от универсални механизми за достъп до данни (ODBC, OLE DB, ADO.NET), често - инструменти за директен достъп до най-популярните СУБД, използващи техните клиентски API, съдържат бизнес графични инструменти, интегрират се с офис приложения, ви позволяват да публикувате отчети в Интернет, включват класове или компоненти, предназначени за създаване на приложения, които реализират (наред с други функции) генериране на отчети.

Безспорният лидер на пазара на инструменти за отчети е Crystal Reports, собственост на Business Objects. Предлага се както отделно, така и като част от продукти на други производители, от инструменти за разработка на приложения до географски информационни системи. Има и сървърна версия на този продукт, предназначена да предоставя отчети на голям брой потребители. В допълнение към Crystal Reports има няколко по-малко популярни продукта от този клас.

Заключение

В този преглед разгледахме основните технологии, които са в основата на съвременните аналитични приложения. Както можете да видите, изборът както на технологии, така и на продукти, които ги прилагат, е доста широк, особено като се има предвид фактът, че такива инструменти са налични в съвременните сървърни СУБД и широк набор от клиентски инструменти за визуализиране на резултатите от анализа и създаване на аналитични отчети. Въпреки това, липсата на общоприети стандарти в областта на бизнес разузнаването до момента създава определени проблеми при създаването на решения, които го използват.

8.3.1. Инструменти за онлайн аналитична обработка (OLAP).

Он-лайн аналитична обработка - средства за оперативна (в реално време) аналитична обработка на информация, насочена към подпомагане на вземането на решения и подпомагане на анализаторите да отговорят на въпроса "Защо обектите, средата и резултатите от тяхното взаимодействие са такива, а не други?". В същото време анализаторът сам формира версии на връзките между набор от информация и ги проверява въз основа на наличните данни в съответните структурирани информационни бази данни.

ERP системите се характеризират с наличието на аналитични компоненти като част от функционални подсистеми. Те осигуряват формирането на аналитична информация в реално време. Тази информация е в основата на повечето управленски решения.

OLAP технологиите използват хиперкубове - специално структурирани данни (иначе наричани OLAP кубове). В структурата на данните на хиперкуба има:

Измерители - количествени показатели (детайли-бази), използвани за формиране на обобщени статистически резултати;

Измерения - описателни категории (детайли-характеристики), в контекста на които се анализират мерките.

Размерът на хиперкуба се определя от броя на измеренията за една мярка. Например хиперкубът SALES съдържа данни:

Измервания: потребители, дати на операции, групи стоки, номенклатура, модификации, опаковки, складове, видове плащане, видове пратки, тарифи, валута, организации, поделения, отговорници, канали за дистрибуция, региони, градове;

Измерва: планирано количество, действително количество, планирана сума, действителна сума, планирани плащания, действителни плащания, планирано салдо, действително салдо, продажна цена, време за изпълнение на поръчката, сума за възстановяване.

Такъв хиперкуб е предназначен за аналитични отчети:

Класификация на потребителите по обем на покупките;

Класификация на продаваните стоки по метода АВС;

Анализ на сроковете за изпълнение на поръчки на различни потребители;

Анализ на обемите на продажбите по периоди, продукти и продуктови групи, региони и потребители, вътрешни подразделения, мениджъри и канали за дистрибуция;

Прогноза за взаимни разчети с потребителите;

Анализ на връщането на стоки от потребители; и т.н.

Аналитичните отчети могат да имат произволна комбинация от измерения и мерки; те се използват за анализ на управленски решения. Аналитичната обработка се извършва с инструментални и езикови средства. Информационната технология "Pivot Tables" е представена в публичната електронна таблица MS Excel, като изходните данни за създаването им са:

Списък (база данни) MS Excel - релационна таблица;

Друга MS Excel PivotTable;

Консолидиран набор от клетки на MS Excel, разположени в една и съща или различни работни книги;

Външна релационна база данни или OLAP куб, източник на данни (файлове във формат .dsn, .ode).

За изграждане на обобщени таблици на базата на външни бази данни се използват ODBC драйвери, както и програмата MS Query. Основната таблица за изходната база данни на MS Excel има следната структура (фиг. 8.3).

Оформлението на обобщената таблица има следната структура на данните (фиг. 8.4): размери - код на отдел, позиция; мерки - трудов стаж, работна заплата и премия. По-долу има обобщена таблица. 8.2, който ви позволява да анализирате връзката между среден трудов стаж и заплата, среден трудов стаж и бонуси, заплата и бонуси.

Таблица 8.2

Пивотна таблица за анализ на връзки

Краят на масата. 8.2

За да продължите анализа с помощта на обобщената таблица, можете:

Добавете нови суми (например средна заплата, среден размер на бонуса и т.н.);

Използвайте филтриране на записи и суми на обобщената таблица (например въз основа на "Пол", който се поставя в оформлението в областта * Страница ");

Изчислете структурни показатели (например разпределението на средствата за заплати и бонусния фонд по отдели - използвайки средствата допълнителна обработкаосеви таблици, дялове на сумата по колони); и т.н.

Пакетът от програми на MS Office ви позволява да публикувате данни от електронни таблици, включително обобщени таблици и диаграми, във формат XTML.

Компонент Microsoft офис Web Components поддържа работа с публикувани данни в средата на Internet Explorer, осигурявайки непрекъснат анализ (промени в структурата на данните на обобщената таблица, изчисляване на нови обобщени суми).

8.3.2. Инструменти за извличане на данни (DM).

DM инструментите включват извличане („изкопаване“, „копаене“) на данни и са насочени към идентифициране на връзки между информацията, съхранявана в цифрови корпоративни бази данни, които анализаторът може да използва за изграждане на модели, които му позволяват да определи количествено степента на влияние на факторите на интерес към него. В допълнение, такива инструменти могат да бъдат полезни за изграждане на хипотези за възможното естество на информационните връзки в бази данни на дигитално предприятие.

Технологията Text Mining (TM) е набор от инструменти, които ви позволяват да анализирате големи набори от информация в търсене на тенденции, модели и връзки, които могат да помогнат при вземането на стратегически решения.

Технологията Image Mining (IM) съдържа инструменти за разпознаване и класифициране на различни визуални изображения, съхранявани в корпоративни бази данни или получени в резултат на онлайн търсене от външни източници на информация.

За решаване на проблемите с обработката и съхраняването на всички данни се използват следните подходи:

1) създаването на няколко системи за архивиране или една разпределена система за работен процес, която ви позволява да запазвате данни, но да имате бавен достъп до съхранената информация по искане на потребителя;

2) изграждане на Интернет системи, които са силно гъвкави, но не са адаптирани за осъществяване на търсене и съхранение на текстови документи;

3) въвеждането на интернет портали, които са добре ориентирани към потребителските заявки, но нямат описателна информация за текстовите данни, заредени в тях.

Системи за обработка текстова информация, без проблемите, изброени по-горе, могат да бъдат разделени на две категории: системи за лингвистичен анализ и системи за анализ на текстови данни.

Основните елементи на технологията Text Mining са:

обобщаване;

Тематично търсене (извличане на характеристики);

Клъстеризиране;

Класификация (класификация);

Отговаряне на заявки (отговаряне на въпроси);

Тематично индексиране;

Търсене по ключови думи(търсене по ключови думи);

Създаване и поддръжка на офтаксономия (oftaxonomies) и тезауруси (thesauri).

Софтуерните продукти, които прилагат технологията Text Mining, включват:

IBM Intelligent Miner for Text - комплект индивидуални комунални услуги, стартирайте от командния ред или скриптове; независими един от друг (основният акцент е върху механизмите за извличане на данни - извличане на информация);

Oracle InterMedia Text - набор, интегриран в СУБД, който ви позволява да работите най-ефективно с потребителски заявки (позволява ви да работите с модерни релационни СУБД в контекста на сложно многоцелево търсене и анализ на текстови данни);

Megaputer Text Analyst е набор от обекти, вградени в програмата COM, предназначени за решаване на проблеми с Text Mining.

8.3.3. Интелигентни информационни технологии

Днес в областта на автоматизацията на управлението анализът на информацията доминира на предварителния етап от подготовката на решения - обработка на първична информация, разлагане на проблемна ситуация, което ви позволява да знаете само фрагменти и подробности за процесите, а не ситуацията като цяло. За да се преодолее този недостатък, е необходимо да се научите как да изграждате бази от знания, като използвате опита на най-добрите специалисти, както и да генерирате липсващите знания.

Използването на информационните технологии в различни сфери на човешката дейност, експоненциалното нарастване на обемите на информация и необходимостта от бърза реакция във всяка ситуация изискват търсене на адекватни начини за решаване на възникващи проблеми. Най-ефективният от тях е начинът за интелектуализация на информационните технологии.

Под интелигентни информационни технологии(ITT) обикновено разбират такива информационни технологии, които предоставят следните характеристики:

Наличието на бази от знания, които отразяват опита на конкретни хора, групи, общества, човечеството като цяло, при решаване на творчески проблеми в определени области на дейност, традиционно считани за прерогатив на човешкия интелект (например такива слабо формализирани задачи като решение правене, дизайн, извличане на смисъл, обяснение, обучение и др.);

Наличието на мисловни модели, базирани на бази от знания: правила и логически заключения, аргументация и разсъждения, разпознаване и класификация на ситуации, обобщение и разбиране и др.;

Способността да се формират доста ясни решения въз основа на размити, нестроги, непълни, недостатъчно определени данни;

Способност да обяснява изводи и решения, т.е. наличието на механизъм за обяснение;

Способността да се учи, преквалифицира и, следователно, да се развива.

Технологиите за неформално търсене на скрити модели в данните и информацията Knowledge Discovery (KD) се основават на най-новите технологииформиране и структуриране на информационни образи на обекти, което е най-близо до принципите на обработка на информация от интелигентни системи.

Информационните технологии за подпомагане на вземането на решения (DS) са обвивки на експерт

системи или специализирани експертни системи, които дават възможност на анализаторите да определят връзки и връзки между информационни структурив базите на структурирана информация на предприятието, както и да прогнозира възможните резултати от вземането на решения.

Тенденции в развитието на ИИТ. Системи за комуникация и комуникации.Глобалните информационни мрежи и IIT могат фундаментално да променят начина, по който мислим за компаниите и самата работа със знания. Присъствието на служители на работното място ще стане почти ненужно. Хората могат да работят от вкъщи и да взаимодействат помежду си, когато е необходимо, чрез мрежи. Известен е например успешният опит за създаване на нова модификация на самолета Boeing 747 от разпределен екип от специалисти, взаимодействащи през Интернет. Местоположението на участниците във всяко развитие ще играе все по-малка роля, но значението на нивото на умения на участниците ще нараства. Друга причина, която обуславя бързото развитие на ИИТ, е свързана с усложняването на комуникационните системи и задачите, решавани на тяхна база. Беше необходимо качествено ново ниво на "интелектуализация" на такива софтуерни продукти като системи за анализ на разнородни и нестроги данни, осигуряване на информационна сигурност, разработване на решения в разпределени системи и др.

образование. Вече днес дистанционно обучениезапочва да играе важна роля в образованието, а въвеждането на ИИТ значително ще индивидуализира този процес в съответствие с потребностите и възможностите на всеки ученик.

живот. Информатизацията на ежедневието вече е започнала, но с развитието на IIT ще се появят принципно нови възможности. Постепенно все повече и повече нови функции ще бъдат прехвърлени към компютъра: контрол върху здравето на потребителя, контрол на домакински уреди като овлажнители, освежители за въздух, нагреватели, йонизатори, музикални центрове, медицински диагностични инструменти и др. С други думи, системите ще станат и диагностици на състоянието на човека и неговия дом. Комфортът ще бъде осигурен информационно пространствов помещения, където информационната среда ще стане част от човешката среда.

Перспективи за развитие на ИИТ. Изглежда, че в момента IIT се приближи до фундаментално нов етап в своето развитие. И така, през последните 10 години възможностите на IIT значително се разшириха поради разработването на нови видове логически модели, появата на нови

vyh теории и идеи. Основните моменти в развитието на IIT са:

Преходът от логическо заключение към модели на аргументация и разсъждение;

Търсене на релевантни знания и генериране на обяснения;

Разбиране и синтез на текстове;

Когнитивна графика, т.е. графично и фигуративно представяне на знания;

Мултиагентни системи;

Интелигентни мрежови модели;

Изчисления, базирани на размита логика, невронни мрежи, генетични алгоритми, вероятностни изчисления (приложени в различни комбинации помежду си и с експертни системи);

Проблемът с метапознанието.

Мултиагентните системи се превърнаха в нова парадигма за създаване на обещаващи IIT. Тук се приема, че агентът е независим интелигентна система, която има своя собствена система за целеполагане и мотивация, собствена област на действие и отговорност. Взаимодействието между агентите се осигурява от система от по-високо ниво - метаинтелигентност. В мултиагентните системи се моделира виртуална общност от интелигентни агенти – обекти, които са автономни, активни, влизат в различни социални отношения – сътрудничество и сътрудничество (приятелство), конкуренция, конкуренция, вражда и др. Социалният аспект на решаването на съвременни проблеми е основната характеристика на концептуалната новост на напредналите интелектуални технологии - виртуални организации, виртуално общество.

(?) Контролни въпроси и задачи

1. Дайте описание на предприятието като обект на информатизация. Кои са основните показатели, характеризиращи развитието на системата за управление на предприятието.

2. Избройте водещите информационни технологии за управление на индустриални предприятия.

3. Назовете основните информационни технологии за организационно и стратегическо развитие на предприятия (корпорации).

4. Какви са основите на стандартите за стратегическо управление, насочени към подобряване на бизнес процесите? Какво е съотношението на информационните технологии BPM и BPI?

5. Дефинирайте философията на тоталното управление на качеството (TQM). Как са свързани фазите на развитие на качеството и информационните технологии?

6. Назовете основните разпоредби на организационното развитие на предприятието, опишете етапите на стратегическото управление. Назовете груповите стратегии.

7. Как се създава бизнес моделът на предприятието? Кои са основните подходи за оценка на ефективността на един бизнес модел.

8. Какво е балансирана карта с резултати? Назовете основните компоненти на SSP. Какви са връзките между групи BSC индикатори?

9. Избройте методологичните основи за създаване на информационни системи. Какво е системен подход?

10. Какво е информационен подход за формиране на информационни системи и технологии?

11. Какво е стратегически подход за формиране на информационни системи и технологии?

12. Какво е съдържанието на обектно-ориентирания подход за описание на поведението на агентите на пазара? Дайте дефиницията на обекта, посочете аналози на агентни системи.

13. Какви са методическите принципи за подобряване на управлението на предприятието, базирано на информационните и комуникационни технологии? Каква е целта на ИКТ?

14. Дайте определения за документ, документооборот, работен процес, система за управление на документи.

15. Как е проектирано оформлението на формуляра на документа? Наименувайте зоните на документа, състава на техните детайли.

16. Назовете основните информационни технологии на системата за управление на документи.

17. Какво е единна документационна система? Какви са общите принципи на обединението?

18. Опишете организационната и административната документация, дайте примери за документи.

19. На какви изисквания трябва да отговаря електронна системауправление на документи?

20. Какво е корпоративна информационна система? Назовете основните контури за управление, състава на функционалните модули.

21. Назовете софтуерните продукти за CIS, които познавате. Дайте им сравнителна характеристика.

SH Литература

1. Верне Дж., Мориарти С. Маркетингови комуникации. Интегриран подход. Санкт Петербург; Харков: Питър, 2001.

2. Брукинг Е. Интелектуален капитал. Ключът към успеха през новото хилядолетие. Санкт Петербург: Питър, 2001.

3. Годин В.В., Корпев И.К. контрол информационни ресурси. М.: ИНФРА-М, 1999.

4. Информационни системии технологиите в икономиката: Учебник. 2-ро изд., доп. и преработен. / М.И. Семенов, И.Т. Трубилин, В.И. Лойко, Т.П. Барановская; Изд. В И. Лойко. М.: Финанси и статистика, 2003.

5. Информационни технологии в бизнеса / Изд. М. Желени. Санкт Петербург: Питър, 2002.

6. Kaplan Robert S., Norton David P. Balanced Scorecard. От стратегия към действие / Пер. от английски. М.: ЗАО "Олимп-Бизнес", 2003 г.

7. Карагодин В.И., Карагодина BJI. Информацията е основата на живота. Дубна: Феникс, 2000.

8. Кармински А.М., Нестеров П.З. Бизнес информатизация. М.: Финанси и статистика, 1997.

9. Лихачева Т.Н. Информационните технологии в услуга на информационното общество // Нови информационни технологии в икономическите системи. М., 1999.

10. Острейковски V.A. Теория на системите. Москва: Висше училище, 1997.

11. Питеркин С.В., Оладов Н.А., Исаев Д.В. Точно навреме за Русия. Практиката на използване на ERP-системи. 2-ро изд. Москва: издателство Alpina, 2003 г.

12. Соколов Д.В. Въведение в теорията на социалната комуникация: учеб. надбавка. Санкт Петербург: Издателство SP6GUP, 1996.

13. Трофимов В.З., Томилов В.З. Информационни и комуникационни технологии в управлението: учеб. надбавка. Санкт Петербург: SPbGUEF, 2002.