پردازش تحلیلی عملیاتی پردازش تحلیلی عملیاتی (On-Line Analytical Processing، OLAP). پردازش تحلیلی اطلاعات متنی ناهمگون فرم ها و روش های پردازش اطلاعات تحلیلی

UDK 621. 37/39. 061.2/4

روشهای پردازش اطلاعات تحلیلی

GVOZDINSKYA.N.، KLIMKO E.G.، SOROKOVOY A.I.

بررسی تحلیلی روشها تحلیل فکریداده ها (همچنین به نام IAD، داده کاوی، کشف دانش در پایگاه های داده) با در نظر گرفتن استفاده از یک روش خاص برای شرایط اوکراین. بررسی روش‌های پردازش تحلیلی اطلاعات در سیستم‌های اطلاعاتی پیچیده از نقطه نظر سرعت استخراج داده‌ها، جمع‌آوری اطلاعات تعمیم‌یافته و افزایش قابلیت اطمینان فرآیند مورد توجه قرار می‌گیرد.

فرآیند داده کاوی مطالعه تحلیلی مقادیر زیادی از اطلاعات به منظور تعیین الگوها و روابط بین متغیرها است که سپس می تواند برای داده های جدید اعمال شود. اطلاعات دریافتی به سطح اطلاعاتی تبدیل می شود که به عنوان دانش مشخص می شود. این فرآیند شامل سه مرحله اصلی است:

تحقیق (الگوهای آشکار)؛

استفاده از الگوهای شناسایی شده برای ساخت مدل؛

تجزیه و تحلیل استثنا برای شناسایی و توضیح انحرافات در الگوهای یافت شده.

یافتن دانش جدید با استفاده از IAD یک جهت جدید و به سرعت در حال توسعه است که از روش های هوش مصنوعی، ریاضیات و آمار استفاده می کند. این فرآیند شامل مراحل زیر است:

تعریف مسئله (بیان مسئله)؛

آماده سازی داده ها؛

جمع آوری داده ها: ارزیابی، ادغام و تمیز کردن، انتخاب و تبدیل آنها.

ساخت مدل: ارزیابی و تفسیر، اعتبار سنجی خارجی.

استفاده از مدل؛

مشاهده مدل

برای ساخت یک مدل و بهبود کیفیت آن، اعتبارسنجی رسمی داده ها از طریق دنباله ای از پرس و جوها یا داده کاوی اولیه کمک می کند. ابزارهای چنین تحلیلی شامل روش های اصلی زیر است: شبکه های عصبی، درخت تصمیم، الگوریتم های ژنتیک و همچنین ترکیب آنها.

شبکه های عصبیمتعلق به کلاس سیستم های تطبیقی غیر خطی هستند، ساختار آنها مشروط به بافت عصبی نورون ها شباهت دارد.

این مجموعه ای از گره های متصل به یکدیگر است که داده های ورودی را دریافت می کنند، آنها را پردازش می کنند و نتیجه ای را در خروجی تولید می کنند. گره های لایه پایین با مقادیر پارامترهای ورودی عرضه می شوند، بر اساس آنها محاسبات لازم برای تصمیم گیری، پیش بینی توسعه وضعیت و غیره انجام می شود.

این مقادیر به عنوان سیگنال هایی در نظر گرفته می شوند که به لایه پوشاننده منتقل می شوند و بسته به مقادیر عددی (وزن) نسبت داده شده به اتصالات بین عصبی افزایش یا کاهش می یابند. در خروجی نورون بالاترین لایه، مقداری تولید می شود که به عنوان پاسخ، واکنش کل شبکه به ورودی در نظر گرفته می شود. مقادیر اولیه. از آنجایی که هر عنصر شبکه عصبی تا حدی از همسایگان خود جدا شده است، چنین الگوریتم‌هایی توانایی موازی کردن محاسبات را دارند. روی انجیر 1 مشروط را نشان می دهد

عکس. 1. شبکه عصبی

اندازه و ساختار شبکه باید با ماهیت پدیده مورد مطالعه مطابقت داشته باشد. شبکه ساخته شده تحت فرآیند به اصطلاح "آموزش" قرار می گیرد. نورون های شبکه داده های ورودی را پردازش می کنند که هم مقادیر پارامترهای ورودی و هم پاسخ های صحیح به آنها مشخص است. یادگیری شامل انتخاب وزن اتصالات بین عصبی است که بیشترین نزدیکی را از پاسخ های شبکه به پاسخ های صحیح شناخته شده ارائه می دهد. پس از آموزش بر روی داده های موجود، شبکه آماده کار است و می توان از آن برای پیش بینی رفتار شی در آینده، بر اساس داده های توسعه آن در گذشته، انجام تجزیه و تحلیل و شناسایی انحرافات و شباهت ها استفاده کرد. پیش‌بینی‌های قابل اعتمادی را می‌توان بدون مشخص کردن نوع وابستگی‌هایی که بر اساس آن مبتنی است، شکل داد.

شبکه های عصبی برای حل مسائل پیش بینی، طبقه بندی یا کنترل استفاده می شوند.

مزیت - شبکه ها می توانند هر تابع پیوسته را تقریب بزنند، نیازی به پیش فرضی در مورد مدل نیست. داده های مورد بررسی ممکن است ناقص یا پر سر و صدا باشند.

نقطه ضعف آن نیاز به تعداد زیادی نمونه آموزشی است. تصمیم نهایی به تنظیمات اولیه شبکه بستگی دارد. داده ها باید به شکل عددی تبدیل شوند. مدل به دست آمده دانش کشف شده (به اصطلاح "جعبه سیاه") را توضیح نمی دهد.

درختان تصمیم از پارتیشن بندی داده ها به گروه ها بر اساس مقادیر متغیرها استفاده می کنند. نتیجه یک ساختار سلسله مراتبی از عبارات «اگر... آنگاه...» است که شبیه یک درخت است. برای طبقه بندی یک شی یا موقعیت، باید به سؤالات گره های این درخت، از ریشه آن، پاسخ دهید. اگر پاسخ مثبت است، به گره سمت راست سطح بعدی بروید، اگر منفی - به گره سمت چپ و غیره بروید. با پایان دادن به پاسخ ها، آنها به یکی از گره های انتهایی می رسند، جایی که

RI، 2000، شماره 4

نشان می دهد که شی مورد نظر باید به کدام کلاس نسبت داده شود.

درختان تصمیم برای حل مشکلات طبقه بندی طراحی شده اند و بنابراین کاربرد بسیار محدودی در امور مالی و تجاری دارند.

مزیت روش ارائه ساده و قابل فهم ویژگی ها برای کاربران است. به عنوان یک متغیر هدف، از ویژگی های اندازه گیری شده و غیر اندازه گیری شده استفاده می شود - این دامنه روش را گسترش می دهد.

نقطه ضعف آن مشکل اهمیت است. داده ها را می توان به بسیاری از موارد خاص تقسیم کرد، یک "بوش" درخت وجود دارد که نمی تواند پاسخ های آماری معتبری بدهد. نتایج مفید فقط در مورد ویژگی های مستقل به دست می آید.

الگوریتم های ژنتیک از فرآیند انتخاب طبیعی در طبیعت تقلید می کنند. برای حل مسئله ای که از نظر معیاری بهینه تر است، همه راه حل ها با مجموعه ای از اعداد یا کمیت های غیر عددی توصیف می شوند. جستجو برای راه حل بهینه شبیه به تکامل جمعیتی از افراد است که با مجموعه کروموزوم های آنها نشان داده می شود. سه مکانیسم وجود دارد که در این تکامل عمل می کنند که در شکل 1 نشان داده شده است. 2.

مکانیسم های زیر را می توان تشخیص داد:

انتخاب قوی ترین مجموعه کروموزوم ها که با بهینه ترین راه حل ها مطابقت دارند.

متقاطع - به دست آوردن افراد جدید با مخلوط کردن مجموعه های کروموزوم از افراد منتخب.

جهش ها تغییرات تصادفی در ژن ها در برخی افراد در یک جمعیت است.

در نتیجه تغییر نسل ها، راه حلی برای مشکل ایجاد می شود که دیگر نمی توان آن را بیشتر بهبود بخشید.

مزیت - این روش برای حل مسائل مختلف ترکیبیات و بهینه سازی راحت است، بیشتر به عنوان ابزاری برای تحقیقات علمی ترجیح داده می شود.

نقطه ضعف آن توانایی فرمول بندی موثر مشکل، تعیین معیار برای انتخاب کروموزوم ها است و روش انتخاب خود اکتشافی است و فقط یک متخصص می تواند آن را انجام دهد. بیان مسئله بر حسب امکان تجزیه و تحلیل اهمیت آماری راه حل به دست آمده با کمک آنها را ممکن نمی سازد.

فناوری‌های رایانه‌ای برای پردازش داده‌های تحلیلی هوشمند، استفاده از روش‌های هوش مصنوعی، آمار، تئوری پایگاه داده را ممکن می‌سازد و امکان ایجاد سیستم‌های هوشمند مدرن را فراهم می‌کند.

در حال حاضر، یک موضوع حاد ایجاد انبارهای اطلاعاتی (انبار داده، انبار داده) وجود دارد - پایگاه های داده بهینه سازمان یافته که سریع ترین و راحت ترین دسترسی را به اطلاعات لازم برای تصمیم گیری فراهم می کند. ذخیره سازی اطلاعات قابل اعتماد را از منابع مختلف در یک دوره زمانی طولانی جمع آوری می کند که بدون تغییر باقی می ماند. داده ها با توجه به مناطقی که توصیف می کند (ویژه دامنه) جمع آوری و ذخیره می شود و نیازهای کل شرکت را برآورده می کند (یکپارچه).

با توجه به دوره نسبتاً کوتاه مدت اکثر شرکت های داخلی، کمبود داده های تجزیه و تحلیل شده، بی ثباتی بنگاه هایی که در معرض تغییر هستند به دلیل تغییرات در چارچوب قانونی، در توسعه یک استراتژی تصمیم گیری موثر با استفاده از سیستم های داده کاوی مشکل وجود دارد. بنابراین الگوریتم های ژنتیک به عنوان قابل قبول ترین روش برای تحقیق داده ها در حوزه مالی و تجاری پیش بینی می شود و برای وظایف طبقه بندی تصاویر و حقایق بهتر است از روش های درخت تصمیم یا شبکه های عصبی استفاده شود.

ادبیات: 1. Shchavelev L.V. داده کاوی. http://www.citforum.ru/seminars/cis99/ sch_04.shtml, 2. Burov K. کشف دانش در انبارهای داده / / سیستم های باز. 1999. شماره 5-6.، http: / /www.osp.ru/os/l999/05-06/14.htm. 3. Kiselev M، Solomatin E. ابزارهای استخراج دانش در تجارت و امور مالی // سیستم های باز. 1997. شماره 4. ص 41-44. 4. Krechetov N، Ivanov P. محصولات داده کاوی // هفته کامپیوتر - مسکو. 1376. شماره 14-15. صص 32-39. 5. Edelstein H. ابزارهای هوشمند برای تجزیه و تحلیل و ارائه داده ها در انبارهای اطلاعات // هفته کامپیوتر - مسکو. 1996. شماره 16. صص 32-35.

دریافت به هیئت تحریریه 22/06/2000

داور: Dr. tech. علوم، پروفسور پوتیاتین V.P.

گوزدینسکی آناتولی نیکولاویچ، دکتری. فن آوری علوم، استاد گروه هوش مصنوعی KhTURE. علایق علمی: ارزیابی اثربخشی سیستم های مدیریت اطلاعات پیچیده. علایق و سرگرمی ها: موسیقی کلاسیک، گردشگری. آدرس: اوکراین، 61166، خارکف، خ. آکادمی لیاپانووا، 7، آپارتمان. 9، تلفن 32-69-08.

کلیمکو النا گنریهیونا، دستیار گروه فناوری های کامپیوتری و سیستم های اطلاعاتی، دانشگاه فنی دولتی پولتاوا به نام یوری کوندراتیوک. دانشجوی کارشناسی ارشد (در حین کار) گروه هوش مصنوعی KhTURE. علایق علمی: تجزیه و تحلیل داده های تحلیلی. علایق و سرگرمی ها: خواندن، بافندگی. آدرس: اوکراین، 36021، پولتاوا، خیابان. الماس، 1-A، آپ. 34، تلفن (053-22) 3-43-12.

سوروکوف الکساندر ایوانوویچ، Ph.D. فن آوری در علوم، دانشیار گروه فناوری های رایانه ای و سیستم های اطلاعاتی، دانشگاه فنی دولتی یوری کوندراتیوک پولتاوا. علایق پژوهشی: KDD (کشف دانش). علایق و سرگرمی ها: سگ. آدرس: اوکراین، 36022، Poltava، per. شکسته، 37A، تلفن (053-2) 18-60-87، ایمیل: [ایمیل محافظت شده]

پردازش تحلیلیاطلاعات مستقیماً یک روش تحلیلی است که در ارتباط با آن الزامات جدی برای سازمان آن مطرح می شود ، یعنی پشتیبانی روش شناختی مناسب ، سطح مشخصی از آموزش تحلیلگران و تهیه آنها با ابزارهای فنی برای انجام تجزیه و تحلیل.
کیفیت و اعتبار تصمیمات مدیریتی اتخاذ شده تا حد زیادی نه تنها با قابلیت اطمینان، کامل بودن، در دسترس بودن، کارایی به دست آوردن اطلاعات، بلکه با اثربخشی روش های مورد استفاده در پردازش آن تعیین می شود. بهبود فناوری پردازش تحلیلی اطلاعات اقتصادی یکی از عناصر کلیدی در بهبود فناوری مدیریت است.
پشتیبانی اطلاعاتی با کیفیت بالا برای فرآیند مدیریت فعالیت های اقتصادی تنها زمانی امکان پذیر است که در عمل از جدیدترین آنها استفاده شود فناوری اطلاعات: منابع مالی علوم کامپیوتر، مخابرات و نرم افزار و سیستم های خودکارمدیریت.
شرایط فعالیت اقتصادی، پیشنهاد حقوق گسترده برای شرکت ها برای تشکیل سیاست های حسابداری، امکان تغییر آن، تغییر اشکال مالکیت. فرآیندهای بازسازی، ادغام شرکت ها و غیره، نیاز به پردازش حجم زیادی از اطلاعات تحلیلی را دیکته می کنند. خود محاسباتی که برای ثبت برخی معاملات مالی و تجاری استفاده می‌شوند نیز پیچیده‌تر شده‌اند. حقوق گسترده شرکت ها برای انتخاب روش های محاسبه استهلاک برای دارایی های ثابت، کار محاسبه مقدار کسر استهلاک را در شرایط پردازش دستی اطلاعات عملاً غیرممکن می کند.
نیازهای روزافزونی برای درجه کارایی، قابلیت اطمینان اطلاعات لازم برای تصمیم گیری های مدیریتی وجود دارد. این سازماندهی تجزیه و تحلیل اقتصادی در یک محیط کامپیوتری بود که باعث شد تا کارایی جمع آوری و ثبت اطلاعات حسابداری به میزان قابل توجهی افزایش یابد، احتمال خطاهای حسابی به میزان قابل توجهی کاهش یابد و در نتیجه شدت کار خدمات تحلیلی کاهش یابد. در شرکت ها
پیچیدگی جریان‌های اطلاعات، ناقص بودن کانال‌های کسب اطلاعات، روش‌ها و تکنیک‌های جمع‌آوری، ذخیره و پردازش اطلاعات اغلب منجر به تأخیر قابل توجه آن و در نتیجه از دست دادن کیفیت آن می‌شود. مبنای دریافت به موقع اطلاعات اطلاعات ادغام مجموعه و پردازش آن است که تعامل فعالیت های اقتصادی و تجزیه و تحلیل اقتصادی را تضمین می کند و منجر به ادغام تدریجی اتوماسیون محاسبات می شود. سیستم اطلاعاتشرکت ها
یک سیستم خودکار برای جمع‌آوری، پردازش و ذخیره‌سازی، که شبکه گسترده‌ای از دستگاه‌های ضبط، خطوط ارتباطی و رایانه‌ها است، زمان بین ظهور اطلاعات و استفاده از آن در کارهای تحلیلی را کاهش می‌دهد. ابزارهای فنی، ارتباط به موقع اطلاعات در مورد فرآیندهای در حال وقوع در شرکت را به مدیران و سایر کارکنان مدیریت ارائه می دهد. استفاده از فناوری نوین اطلاعات امکان جستجوی سریع و محاسبات پر زحمت و همچنین نمایش نتایج را به شکل قابل قبولی فراهم می کند.
جایگاه پیشرو در رویه های تبدیل اطلاعات اقتصادی توسط سیستم سازی و پردازش آن اشغال شده است. هنگام استفاده از فناوری رایانه، پردازش اطلاعات به بخشی ارگانیک از یک فرآیند واحد فناوری اطلاعات تبدیل شده است. کامپیوترهای مدرننه تنها ارتباطات این فرآیند را با دیگران تغییر داد و امکان وحدت تکنولوژیکی را ایجاد کرد فرآیندهای اطلاعاتی، بلکه بر محتوای مفهوم «پردازش داده» نیز تأثیر گذاشت. اگر در مورد انجام دستی یا مکانیزه کار تحلیلی، پردازش عمدتاً به عنوان عملیات حسابی درک می شد، امروزه از پیچیده ترین عملیات منطقی و آماری برای پردازش استفاده می شود.
بیشتر اطلاعات اقتصادی به‌دست‌آمده در نتیجه پردازش برای مدیران، متخصصان، مدیران در بازه زمانی مشخصی که توسط برنامه تقویم برای جمع‌آوری و پردازش داده‌ها ارائه شده است ارسال می‌شود. در شکل گیری اطلاعات اقتصادی تنظیم شده، زمان آماده سازی آن به ویژه دشوار نیست، زیرا آنها معمولاً با شرایط تولید تعیین می شوند. مشکل طراحی جمع آوری و پردازش اطلاعات غیرقانونی برای تصمیم گیری مدیریتی در مقاطع زمانی دلخواه است. برای به دست آوردن چنین اطلاعاتی، سیستم باید داده هایی را تولید کند که نتایج کار، پیشرفت برنامه ها، پویایی توسعه اقتصادی و اجتماعی را با یک دوره مشخص مشخص می کند.
چنین سیستمی نیاز به رویکرد متفاوتی برای طراحی فرآیند فن آوری جمع آوری و پردازش داده ها دارد که حالت های مختلفی از به دست آوردن اطلاعات را فراهم می کند. امیدوار کننده ترین حالت تعاملی است که تعامل مستقیم بین کاربران و رایانه ها را فراهم می کند. برای اتخاذ تصمیمات مدیریت عملیاتی، مدیران بر اساس رویه‌های گفتگوی خاص، اطلاعات لازم را انتخاب می‌کنند که منعکس‌کننده در دسترس بودن و استفاده از منابع مادی، نیروی کار و مالی، روند تولید و سایر فرآیندهای تجاری باشد.
اطلاعات به شکل پردازش شده، به هم پیوسته و هماهنگ به بخش ها و خدمات مدیریت اقتصادی که مسئول تجزیه و تحلیل فعالیت های اقتصادی و تصمیم گیری هستند، منتقل می شود. برای مدیریت اقتصاد، آنها به اطلاعات ویژه ای با ماهیت پیش بینی نیاز دارند که نه تنها امکان اصلاح وضعیت شرکت، بلکه همچنین تجزیه و تحلیل روند توسعه یک فرآیند، پدیده خاص و تصمیم گیری بهینه و به موقع را بر اساس آن فراهم می کند. این نوع مدیریت نه تنها شامل داده‌های شی مدیریت شده و محیط آن می‌شود، بلکه اطلاعات تحلیل شده مناسب برای پیش‌بینی را نیز در بر می‌گیرد. اطلاعات مربوط به رفتار گذشته سیستم و محیط آن برای توسعه تصمیمات مدیریت بر اساس یک تصمیم پیش‌بینی‌شده با استفاده از ابزارهای مدل‌سازی اقتصادی استفاده می‌شود. ، سیستم های نرم افزاری خبره و پیش بینی کننده.

گالینا آکیمووا، ماتوی پاشکین

فناوری پردازش اطلاعات از منابع مختلف، از جمله رسانه های اینترنتی، ورودی خودکار (از جمله تجزیه و تحلیل متن موضوعی، پردازش، ذخیره سازی و بازیابی) و دریافت خلاصه های آماری و خلاصه ها را فراهم می کند.

تا به امروز، روش اصلی پردازش تحلیلی آرایه های داده متنی، جستجوی اسناد با کلمات کلیدی است. هوش این عملیات با رتبه بندی خودکار اسناد یافت شده با استفاده از مقدار کافی افزایش می یابد روش های سادهتعیین اهمیت آنها، با در نظر گرفتن ریخت شناسی زبان و (بسیار کمتر) لغت نامه های معنایی.

با این حال، برای حل مشکلات تحلیلی مدرن، به ویژه با توجه به حجم عظیم اطلاعات منبع (در درجه اول از اینترنت)، این به وضوح کافی نیست. Newsblaster دانشگاه کلمبیا نمونه ای از آنچه مشتریان امروز به آن نیاز دارند است. در ابتدا برای آسان کردن یافتن اطلاعات در وب در نظر گرفته شده بود، اما در واقع می تواند هر خبر مهمی را از اینترنت استخراج کند. این سامانه با جستجو در سایت های خبری، اطلاعات یافت شده را بر اساس موضوع مرتب می کند، میزان تشابه متون را مشخص می کند و خبر را در قالب تفسیر پنج جمله ای تشکیل می دهد. تقریباً 88٪ از کسانی که از این راه حل استفاده کرده اند اذعان می کنند که کار با این برنامه بسیار راحت تر از "گشت و گذار" در وب سایت های مختلف در جستجوی اخبار است.

لازم به ذکر است که مشکل کار با حجم عظیمی از اطلاعات دو جنبه دارد: یکی جمع آوری خودکار اطلاعات (که در واقع سیستم و آنالوگ های فوق بر روی آن متمرکز شده است) و دیگری خودکار بودن. تجزیه و تحلیل اطلاعات دریافت شده در مورد این موضوع، بر اساس متن سند تجزیه و تحلیل انجام شده است.

به عقیده A. Kharlamov، رویکردهای موجود در تحلیل متن را می توان به دو دسته تقسیم کرد. کلاس اول شامل الگوریتم های سریعی است که به زبان و حوزه موضوعی وابسته نیستند و از روش های آماری استفاده می کنند. طبقه دوم توسط بسیار پیچیده، دادن تشکیل شده است نتیجه خوب، اما رویکردهای نسبتاً آهسته، زبان و حوزه خاص و عمدتاً مبتنی بر روش های زبانی است.

شکی نیست که موثرترین رویکرد، رویکردی خواهد بود که سرعت و استقلال زبان الگوریتم های درجه یک را با هم ترکیب کند. کیفیت بالاپردازش دوم

از سیستم های موجود، از دیدگاه نویسندگان، جالب ترین سیستم TERMIN-5 است که از روش واژگانی-آماری دسته بندی متون استفاده می کند. مزیت روش واژگانی-آماری جهانی بودن بالای آن است، زیرا معنای عنوان در آن تنها با مجموعه ای از متون آموزشی تعیین می شود. این سیستم به شما امکان می دهد فرآیند روبری را کاملاً خودکار کنید و مطابق با نمونه آموزشی متون و ایجاد یک قانون تعیین کننده برای تخصیص یک سند به یک روبریک خاص ، روبریکاتور را تنظیم کنید. تمرکز آن بر اساس جریان های پیام متنی رسانه ای واقعی است.

به طور کلی، بخش سیستم های تحلیلی متمرکز بر تجزیه و تحلیل ریاضی و آماری شاخص های مختلف کمی و کیفی برای مدت طولانی در بازار نرم افزار در حال توسعه بوده است. با این حال، قبل از راه حل کاملوظایف تجزیه و تحلیل حجم عظیم اطلاعات متنیموجود در نشریات چاپی، فیدهای خبری آژانس های اطلاعاتی، در سایت های موضوعی در اینترنت، هنوز بسیار دور است.

ساخت سیستم های طبقه بندی خودکار

برای حل مشکل تجزیه و تحلیل اطلاعات متنی و توزیع خودکار متعاقب آن در موضوعات مورد نیاز، ابتدا لازم است یک روبریکاتور تشکیل دهید، به عنوان مثال، فهرستی از موضوعات یا سرفصل هایی را تنظیم کنید که دقیق ترین محدوده دانش را مشخص می کند. مطالعه. شرط لازم برای تجزیه و تحلیل متن، پشتیبانی از کار با سرفصل های خطی و سلسله مراتبی با تعداد نامحدودی از سطوح تودرتو است. در زیر نمونه ای از روبریکاتور خطی مورد استفاده در وب سایت Lenta.ru آورده شده است:

علاوه بر این، از آنجایی که جهت‌های تحقیق می‌تواند تغییر کند، مایلیم بتوانیم آرایه یکسانی از اطلاعات ورودی را در موضوعات مختلف که توسط روبریکاتورهای مختلف مشخص شده است طبقه‌بندی کنیم.

در سیستم‌های پردازش اطلاعات متنی موجود، دو رویکرد اساسی رایج است: بر اساس فهرستی از کلمات کلیدی یا بر اساس فهرستی از اصطلاحات (عبارات یا عبارات اسمی) که به یک روش به یک روبریک اختصاص داده شده‌اند. علاوه بر این، کار مقدماتی بر روی همبستگی کلمات کلیدی و اصطلاحات هر روبریک اغلب توسط کارشناسان به صورت دستی انجام می شود.

در این مقاله، ما روشی را در نظر خواهیم گرفت که توسعه سیستم TERMIN-5 است و به شما امکان می دهد به طور خودکار لیستی از اصطلاحات را ایجاد کنید که تعلق اطلاعات متنی به یک روبریک خاص را مشخص می کند. این رویکرد را می توان گامی به سوی تحلیل خودکار معنایی متن نامید. ساخت فهرستی از اصطلاحات مشخصه بر اساس تجزیه و تحلیل صرفی و نحوی متن با برجسته کردن اسامی غیر پیش پا افتاده و نام های خاص احاطه شده با تعاریف با در نظر گرفتن فراوانی کلمات در زبان انجام می شود.

ساخت نمونه آموزشی

فناوری یادگیری روبریکاتور مبتنی بر ساخت یک نمونه آموزشی است - لیستی از فایل ها یا اسنادی که با سرفصل های این روبریکاتور مطابقت دارند. اگر از متون کوتاه آموزنده با حداکثر بار معنایی استفاده کنید، آموزش روبریکاتور مؤثرتر است. هنگام کار با چندین روبریکاتور، هر یک از آنها باید مجموعه آموزشی خود را داشته باشند.

دقت ساخت یک نمونه آموزشی را فقط در مرحله تحلیل موضوعی اطلاعات متنی می توان تعیین کرد، یعنی در هنگام وارد کردن آن به پایگاه داده. بنابراین، ساخت یک نمونه آموزشی یک فرآیند تکراری است: بسته به کیفیت تعریف موضوع در تجزیه و تحلیل متن، نمونه آموزشی قابل اصلاح است.

آموزش روبریکاتور

فرآیند یادگیری یک روبریک شامل ساخت مجموعه خاصی از اصطلاحات است که تعلق هر یک از روبریک های آن را مشخص می کند. فهرست اصطلاحات تعریف کننده بر اساس تجزیه و تحلیل متن اسنادی که نمونه آموزشی را تشکیل می دهند، برای هر روبریک به طور جداگانه تشکیل می شود. به هر عبارت انتخاب شده وزن خاصی اختصاص داده می شود که اهمیت آن را در متن مشخص می کند. تجزیه و تحلیل بعدی نتایج به شما امکان می دهد لیست را اصلاح کنید، اهمیت تلاقی مفاهیم و اصطلاحات را کاهش دهید و اغلب آنها را حذف کنید.

سلسله مراتب روبریک ها، همراه با عباراتی که برای هر روبریک مهم هستند، یعنی روبریکاتور آموزش دیده، Autorubricator نامیده می شود. با توجه به ابزارهای اضافی که به متخصص اجازه می دهد تا عملیات اضافه کردن یا حذف یک اصطلاح را انجام دهد و وزن آن را تغییر دهد، می توان به طور کاملاً انعطاف پذیر بر نتایج کار بر روی شکل گیری شرایط تعریف کننده روبریک نویسنده تأثیر گذاشت. نتایج یادگیری تصحیح شده در پایگاه داده خود از اصطلاحات (عبارات اسمی) که مشخصه هر روبریک است، ذخیره می شود، که سپس برای تعیین خودکار موضوع اطلاعات دریافتی استفاده می شود.

با استفاده از روبریکاتور

پس از ساخت روبریکاتور، می توان از آن برای تجزیه و تحلیل ورودی استفاده کرد اسناد متنی. برای انجام این کار، متن سند در هنگام ساخت روبریکاتور تحت پردازشی مشابه متون نمونه آموزشی قرار می گیرد. در نتیجه تجزیه و تحلیل صرفی و نحوی خودکار متن، مجموعه ای از اصطلاحات مشخصه (گروه ها و عبارات اسمی) با در نظر گرفتن فراوانی به دست می آید. این مجموعه اصطلاحات به پارامتر ورودی روبریکاتور تبدیل می شود تا آن را با مجموعه های مربوط به هر یک از روبریک ها مطابقت دهد. در نتیجه، تخمین‌هایی از ارتباط متن داده‌شده با هر یک از عنوان‌ها دریافت می‌کنیم. پس پردازشگر می تواند تخمین های غیرقابل اعتماد (ضعیف) را قطع کند و/یا برآوردهای قابل اعتماد (بالا) را مطابق با آستانه های اطمینان از پیش تعیین شده استخراج کند.

فرآیندی که در بالا توضیح داده شد تشخیص خودکارتعلق اطلاعات دریافتی به یک یا آن روبریک، Autorubrication نامیده می شود.

پیش پردازش اطلاعات

به عنوان منابع اصلی اطلاعات، پیشنهاد می شود رسانه های اینترنتی، فیدهای خبری، اسناد الکترونیکی, نسخه های چاپی. پردازش داده های دریافتی بر اساس اصل حداکثر اتوماسیون ممکن است. این هم برای تجزیه متن یک سند و هم برای ردیابی ورود اسناد جدید و ورود بعدی آنها به مخزن اطلاعات اعمال می شود.

تجزیه و تحلیل خودکار متن و تعیین موضوع اطلاعات دریافتی، صرف نظر از فرمت ارائه آن، پیشنهاد می شود بلافاصله قبل از وارد کردن آن به مخزن انجام شود، اما پس از آن پیش فرآوریاطلاعات اولیه.

یک عنصر کاربردی ضروری سیستم های پردازش اطلاعات باید بررسی آن برای تکرار باشد. این امر به ویژه در مورد رسانه های اینترنتی صادق است، جایی که اغلب یک بازنشر کامل از اطلاعات، گاهی بدون اشاره به منبع آن وجود دارد. شرایطی که هنگام چاپ مجدد، فقط عنوان مقاله و تاریخ انتشار در سایت تغییر می کند، کمتر نادر نیست. بنابراین، پیشنهاد می شود برای تکرارپذیری هر دو جزء ضروری و متن سند ورودی بررسی شود.

رسانه اینترنتیپردازش اخبار منتشر شده در اینترنت نه تنها شامل تشریح ساختار سایت و سازماندهی فرآیند دانلود اخبار از آن، بلکه در رعایت قوانین تعیین شده در محل کار کاربر است که نشان دهنده زمان بندی و تعداد دفعات مشاهده سایت است. ، ترکیب جزئیات همراه خبر، موضوعات حسابداری تعریف شده در سایت و ...

فیدهای خبریویژگی ساختار خوراک خبری وجود اسناد زیاد در یک خبر است فایل متنی. به طور معمول، قالب ارائه اسناد خوراک خبری در سازمانی که آن را تهیه کرده است تعیین می شود که نشان دهنده تنوع آنها است. پردازش فیدهای خبری شامل ردیابی خودکار ورودی های جدید ذخیره شده در هارد دیسک، در تعیین و تجزیه قالب فید خبری، و برجسته کردن اسناد جداگانه ای است که آن را تشکیل می دهند.

اسناد الکترونیکی و کاغذی.فن آوری کار با اسناد کاغذی معمولاً با انتقال آنها شروع می شود فرم الکترونیکی، یعنی از عملیات اسکن.

پردازش تحلیلی

گزینه های مختلف برای خودکارسازی مجموعه اطلاعات ناهمگن و گروه بندی آن به اجزای موضوعی تنها اولین قدم در هنگام کار با جریان های اطلاعاتی است که از منابع مختلف می آیند. مرحله بعدی باید تجزیه و تحلیل اطلاعات باشد که اغلب شامل جمع آوری گزارش های آماری (احتمالاً با عناصر پیش بینی) و ساخت خلاصه هایی است که امکان گروه بندی و انتشار داده ها را در مورد یک موضوع انتخابی فراهم می کند.

گزارش های آماریگزارش های تحلیلی بر اساس پردازش آماری اطلاعات وارد شده نه تنها به ارزیابی سریع کیفیت داده های موجود کمک می کند، بلکه اغلب پیش بینی هایی را برای آینده انجام می دهد. چنین گزارش‌هایی می‌توانند هم با استفاده از بسته‌های آماری استاندارد (به ویژه برای پیش‌بینی) و هم در نتیجه صادرات داده‌ها به مایکروسافت اکسل ساخته شوند.

هضم های ساختمانیهنگام تشکیل خلاصه (گزارش خلاصه)، لازم است آنچه را که در آن به عنوان کاملترین ارائه اطلاعات در مورد آن مورد نیاز است، در نظر بگیرید. سوال پرسیده شد(یعنی ارائه متن کامل سند)، و ارائه تنها به صورت کوتاه، زمانی که یک چکیده یا چکیده به عنوان اطلاعات متنی انتخاب می شود.

سامانه اطلاعاتی - تحلیلی "آستارتا"

در زیر عملیات روش های پردازش اطلاعات را که در بالا توضیح داده شده است در نمونه سیستم اطلاعاتی-تحلیلی Astarta (توسعه دهنده - Cognitive Technologies، http://www.cognitive.ru) در نظر خواهیم گرفت. این راه حل نرم افزاری مبتنی بر فناوری فرات است و برای جمع آوری، پردازش و تجزیه و تحلیل اطلاعات بدون ساختار دریافتی از اینترنت، مواد چاپی، رسانه ها و سایر منابع طراحی شده است. دارای معماری سرویس گیرنده-سرور با قابلیت انتشار اسناد عمومی و فرمت های فید خبری بر روی سرور. این سیستم سه نوع شغل مختلف و بر این اساس سه نوع کاربر را ارائه می دهد: مدیر، کارشناس و کاربر.

مدیریت

علاوه بر عملکردهای استاندارد مدیریت حقوق دسترسی به سیستم و انجام تعمیر و نگهداری معمول، مدیر آستاارتا مسئول انتشار جزئیات سیستم، فرمت های رایج برای فیدهای خبری و روبریکاتورها در سرور است. هنگام ایجاد و تنظیم لیست کاربران سیستم و همچنین تنظیم حقوق آنها برای کار با اجزای آن، می توانید ساختار شرکت، طبقه بندی مشاغل و همچنین پیوندهایی را که برای تعامل بین آنها معمول است در نظر بگیرید. بخش ها همه این اجزا توسط مدیر از رابط سیستم تشکیل و تنظیم می شوند (شکل 1).

برنج. 1. پنجره مدیر سیستم.

می توانید حقوق دسترسی را هم به هر کاربر سیستم به طور جداگانه و هم به گروهی از کاربران اختصاص دهید. در حالت دوم، حقوق این گروه به طور خودکار برای همه کاربران گروه تنظیم می شود. اگر کاربر به چند گروه تعلق داشته باشد، حقوق وی مطابق با حقوقی که در هر گروه دارد گسترش می یابد.

مدیر یک کاربر اختصاصی سیستم است که نباید حق انجام وظایف کاربر را داشته باشد.

کار با روبریکاتور

تشکیل روبریکاتور یکی از مهمترین مراحل در آماده سازی سیستم برای کار است، زیرا موضوعی را تعیین می کند که اطلاعات دریافتی بر اساس آن مرتب می شود. این سیستم از کار با روبریکاتور سلسله مراتبی با عمق نامحدود پشتیبانی می کند. روبراتور را می توان مستقیماً از رابط سیستم ایجاد کرد یا از قبل به صورت دلخواه آماده کرد ویرایشگر متنو وارد سیستم کنید. هنگام تهیه متن روبریکاتور، مجاز است از جداکننده های دلخواه سطوح سلسله مراتبی استفاده شود.

یا کارشناس سیستم یا متخصصی که وظایف خود را انجام می دهد، مسئول انتخاب نمونه آموزشی است. نمونه آموزشی می‌تواند شامل مجموعه‌ای از فایل‌های تقسیم‌بندی شده به دسته‌ها و اسنادی باشد که قبلاً وارد آستاارتا شده‌اند. در عین حال، می توانید سطح ارزیابی مربوط به تعلق به این روبریک را که هنگام وارد کردن سند به سیستم تنظیم شده است، انتخاب کنید. امکان مشارکت اسناد سیستم در تشکیل یک نمونه آموزشی به ویژه هنگام ساخت یک نمونه پالایش راحت است.

کیفیت اتوروبریکاتور ساخته شده سیستم توسط نتایج تعیین خودکار موضوع اطلاعات دریافتی تعیین می شود. روبری خودکار اسناد در مرحله ورود اطلاعات به پایگاه داده انجام می شود. به اسناد یک امتیاز مرتبط اختصاص داده می شود که مشخص کننده تعلق به یک یا چند روبریک (یا چند روبریک) است. اسنادی که موضوع آنها مشخص نشده است متعلق به آخرین عنوان روبریکاتور (مثلاً "متفرقه") است. در صورتی که کیفیت تعریف موضوع رضایت بخش نباشد، باید با مشخص کردن ترکیب نمونه آموزشی مجدداً آموزش داده شود و همان مجموعه اسناد باید مجدداً دسته بندی شود (شکل 2).

برنج. 2. فرآیند ساخت روبریکاتور.

نتیجه برنامه آموزشی (مجموعه ای از اصطلاحات مشخصه) برای مشاهده و ویرایش در دسترس است. به متخصص این فرصت داده می شود که وزن یک عبارت خاص را اصلاح کند، یک عبارت جدید اضافه کند یا یک عبارت غیر ضروری را حذف کند.

روبریکاتور آماده و آموزش دیده در سرور سیستم منتشر می شود یا بلافاصله برای کار بیشتر در دسترس قرار می گیرد (در صورت استفاده از نسخه محلی سیستم).

شغل کاربر

کار کاربر سیستم با تعیین فهرست منابع اطلاعاتی، تنظیم زمانبندی برای برنامه ای که رسانه های اینترنتی را پردازش می کند، و مشخص کردن فهرست دایرکتوری هایی که فیدهای خبری دریافتی در آنها جمع می شود، آغاز می شود. علاوه بر این، شما باید یک روبریکاتور انتخاب کنید. این سیستم اجازه کار با چندین روبریکاتور را می دهد، به عنوان مثال، هر سندی را می توان تحت چندین rubricator دسته بندی کرد، با این حال، تنها یک روبریکاتور باید در هر زمان معین فعلی باشد.

به طور پیش فرض، سیستم به گونه ای تنظیم شده است که یک سند به طور همزمان تحت چندین عنوان دسته بندی می شود. با این حال، این امکان وجود دارد - و این در هنگام جمع آوری گزارش های آماری راحت است - طبقه بندی خودکار را بر اساس سند متعلق به تنها یک روبریک تنظیم کنید.

ورودی اسناد

سیستم ورودی از مشاهده خودکار صفحات خبری سایت های از پیش تعیین شده در فرکانس مشخص و مطابق با زمان بندی پشتیبانی می کند. استفاده از یک سیستم زمان بندی به شما امکان می دهد کار وارد کردن اخبار را توزیع کنید، مثلاً آن را به وقت شب یا ناهار ارجاع دهید.

پردازش مقدماتی یک صفحه اینترنتی خبری شامل انتخاب آیتم‌های خبری جداگانه از بلوک خبری و تجزیه ساختار هر خبر، یعنی انتخاب یک قطعه متن و فهرستی از جزئیات همراه آن است. اخبار تهیه شده به این ترتیب به سیستم ورودی منتقل می شود و طی آن بررسی تکراری بودن اطلاعات انجام می شود و سپس متن به صورت خودکار روبریک می شود. اسناد مکرر وارد سیستم نمی شوند. تمام اطلاعات مربوط به کار با رسانه های اینترنتی در یک پروتکل خاص منعکس می شود.

هنگام پردازش فیدهای خبری فرمت های مختلفابتدا فرمت این نوار مشخص می شود. توجه داشته باشید که یک جریان می تواند حاوی فیدهای خبری با فرمت های مختلف باشد. سپس اخبار جداگانه ای از خوراک خبری انتخاب شده و به سیستم ورودی منتقل می شود. فیدهای خبری، قالبی که سیستم نمی تواند به طور خودکار تعیین کند، در مکانی از پیش تعیین شده جمع آوری می شوند. در آینده، می توانید به صورت دستی فرمتی را که باید در آن وارد شوند، مشخص کنید. علاوه بر این، امکان ورود به «آستارتا» اسناد به اصطلاح بدون قالب یعنی اسنادی که فرمت آنها در سامانه ذکر نشده است نیز وجود دارد. نشان دادن این که جریان اسناد غیررسمی اکنون وارد خواهد شد به صورت دستی انجام می شود.

برای پردازش اسناد کاغذی در سیستم، می توان یک برنامه اسکن را راه اندازی کرد و در رابط آن مکان تصاویر گرافیکی دریافتی اسناد را مشخص کرد. ورود بعدی چنین اسنادی به سیستم به صورت دستی و با استفاده از آن انجام می شود فرصت اضافیتشخیص متن سند "در حال پرواز" (کشیدن و شناسایی) هنگام پر کردن جزئیات سند. نمایه سازی خودکار تمام متن یک سند گرافیکی نیز با تشخیص "کور" کل تصویر گرافیکی و انتقال متن شناسایی شده به ماژول نمایه سازی متن کامل امکان پذیر است.

جستجوی سند

منشعب سیستم جستجوبسته نرم افزاری "آستارتا" (شکل 3) برای جمع آوری پرس و جوهای پیچیده، پشتیبانی از سازماندهی جستجوی متن کامل، متنی و ویژگی برای اسناد، هم در ذخیره سازی داده های محلی و هم در سرور، فراهم می کند. هنگام سازماندهی جستجو، از روش های تجزیه و تحلیل مورفولوژیکی استفاده می شود که امکان یافتن در متن سند نه تنها کلمه (یا عبارت) دقیق، بلکه تمام اشکال کلمه آن را فراهم می کند. جستجو با در نظر گرفتن مورفولوژی می تواند هم در متن سند و هم در جزئیات آن انجام شود.

برنج. 3. تشکیل یک درخواست برای جستجوی اسناد.

رابط سیستم به شما امکان می دهد با استفاده از عملیات منطقی AND, OR, NOT پرس و جوهایی را ایجاد کنید و بدین ترتیب شرایط دقیق تری را برای بازیابی اطلاعات نشان می دهد. همچنین تعدادی ابزار و عملکرد وجود دارد که کار ایجاد درخواست برای جستجوی اسناد را ساده می کند:

وجود فرهنگ لغت با جزئیات سیستم (انتخاب مقدار مورد نیاز را ساده می کند).
توانایی تعیین تاریخ به زبان "طبیعی" (به عنوان مثال، انتخاب تاریخ "مارس 2003" معادل تعیین فاصله از 1.03.03 تا 31.03.03 است).
ایجاد یک پرس و جو بر اساس نتایج جستجو؛
ذخیره سازی پرس و جوهای از پیش تعریف شده

تشکیل هضم ها

تشکیل گزارش های خلاصه (خلاصه) گروه بندی شده توسط برش های اطلاعاتی مختلف، بخشی جدایی ناپذیر است عملکردسیستم ها (شکل 4). برای تحقق این امکان، سیستم Astarta دارای مولفه ای است که به شما امکان می دهد الگوهای مختلفی برای ارائه اطلاعات در گزارش ها ایجاد کنید که در آن سبک ها و ساختار همه اجزای گزارش مشخص شده و روش مرتب سازی اسناد مشخص شده است. تنظیمات موجود به شما امکان می دهد خلاصه ای را فقط بر روی حاشیه نویسی اسناد جمع آوری کنید یا خلاصه متن کامل ایجاد کنید. با حجم زیاد اطلاعات می توانید یک سند چند جلدی یا برعکس فقط فهرست مطالب برای آن ایجاد کنید.

برنج. 4. تشکیل گزارش خلاصه (دایجست).

به طور پیش فرض، سند نهایی در ایجاد می شود فرمت مایکروسافتبا این حال، Word، می توانید در مرحله پر کردن الگو، قالب دیگری برای ارائه داده انتخاب کنید.

ساخت خلاصه های آماری

وظیفه اصلی تحلیل آماری تعیین روند توسعه مسئله مورد مطالعه است. گویاترین روش‌های ارائه نتایج، یک سری زمانی است که توسعه کمیت مورد مطالعه را در طول زمان نشان می‌دهد، و یک نمودار که نسبت کمیت مورد مطالعه را نسبت به سایر کمیت‌ها نشان می‌دهد. اگر حل مسائل پیش‌بینی نیاز به استفاده از بسته‌های آماری مختلف با استفاده از الگوریتم‌های خاص داشته باشد (به عنوان مثال الگوریتم خودرگرسیون و میانگین متحرک انتگرال ARISS - ARIMA)، می‌توان تخمین کیفی را بر اساس سری‌های زمانی ساخته‌شده به دست آورد. بسته استاندارد اکسل

هر دو روش ساخت خلاصه های آماری مختلف در سامانه «آستارتا» پیاده سازی می شود: با استفاده از قابلیت های بسته Statistica 5.5 یا بسته استاندارد Excel. هنگام صادرات به اکسل از رابط سیستم، می توانید نوع ارائه اطلاعات را مشخص کنید: نمودار، نمودار دایره ای یا جدول. نمونه ای از سری زمانی ساخته شده با استفاده از بسته اکسل برای روبریکاتور سایت Lenta.ru در شکل نشان داده شده است. 5.

نتیجه

اطلاعات و خدمات تحلیلی شرکت ها در کار خود باید با منابع اطلاعاتی متنوعی سروکار داشته باشند. اینها نشریات کاغذی، روزنامه های الکترونیکی، سایر منابع اینترنتی، پست الکترونیک، انتقال جریان های خبری از طریق کانال های IP و ftp و غیره. استفاده از فناوری پردازش و تجزیه و تحلیل اطلاعات از منابع متنوع شرح داده شده در مقاله، با گروه بندی خودکار بر اساس ویژگی های موضوعی، احتمال از دست دادن اطلاعات لازم را به حداقل می رساند. فیلتر کردن خودکار جریان ها به شما امکان می دهد به سرعت یک تصویر اطلاعات یکپارچه را به دست آورید و برای مطالعه دقیق اطلاعات ورودی می توان از یک موتور جستجوی قدرتمند با ساخت پرس و جوهای پیچیده استفاده کرد.

تجربه پیاده‌سازی یک سیستم تحلیلی اطلاعاتی در سازمان‌های مختلف به لطف ابزار جهانی توسعه‌یافته برای بارگذاری خودکار جریان‌های متنی بزرگ و ناهمگن، کارایی و سهولت سازگاری سیستم با شرایط محلی را نشان داده است.

تجزیه کننده فرمت جهانی این امکان را فراهم می کند که به طور کامل ورودی جریان اطلاعات الکترونیکی از منابع ناهمگن را با اطلاعاتی که به یک نمایش داخلی واحد آورده شده است، خودکار کند، و همچنین کار معمول وارد کردن داده های متن نامنظم (به عنوان مثال، وارد کردن متون از رسانه های کاغذی) را به حداقل برساند. هنگام تشخیص مقالات از رسانه چاپی، یادداشت برداری و در آینده تشخیص خودکار اطلاعات صوتی فعلی و غیره). سیستم داخلی ردیابی خودکار انتشار اخبار "تازه" در سایت های اطلاعاتی در اینترنت امکان خودکارسازی این بخش از فعالیت اطلاعات و خدمات تحلیلی شرکت ها را فراهم می کند.

یک شرایط مهم انعطاف پذیری فناوری پیشنهادی طبقه بندی خودکار (فیلتر موضوعی) است. ایجاد لیست سرفصل ها و آموزش سیستم می تواند توسط یک متخصص - متخصص در خدمات اطلاعاتی و تحلیلی یک شرکت خاص - برای نیازهای اطلاعات تخصصی و خدمات تحلیلی انجام شود. دامنه ارزیابی های قابل اعتماد مربوط به اسناد با سرفصل های داده شده نیز باید به عنوان ابزاری برای تجزیه و تحلیل یا خودآموزی سیستم بر روی داده های تازه در دسترس متخصص باشد.

بلوک تحلیلی برای خودکارسازی فرآیند تهیه گزارش ها و خلاصه ها عمل می کند و همچنین به تحلیلگر اجازه می دهد تا بازتاب را در عموم ردیابی و پیش بینی کند. فضای اطلاعاتی(رسانه، اینترنت،...) روندهای مختلف در توسعه یک حوزه موضوعی خاص.

کارایی سیستم‌های اطلاعاتی-تحلیلی این کلاس را می‌توان از طریق توسعه و اجرای روش‌های هوش مصنوعی که در تحلیل متن اعمال می‌شود، به‌ویژه روش‌های تحلیل معنایی خودکار متون، یعنی درک، بهبود بخشید.

4. طبقه بندی محصولات OLAP.

5. اصول عملکرد مشتریان OLAP.

7. حوزه های کاربرد فن آوری های OLAP.

8. نمونه ای از استفاده از فناوری های OLAP برای تحلیل در زمینه فروش.

1. جایگاه OLAP در ساختار اطلاعاتی شرکت.

اصطلاح "OLAP" به طور جدایی ناپذیر با اصطلاح "انبار داده" (Data Warehouse) پیوند خورده است.

داده‌های ذخیره‌سازی از سیستم‌های عملیاتی (سیستم‌های OLTP) می‌آیند که برای خودکارسازی فرآیندهای تجاری طراحی شده‌اند. علاوه بر این، ذخیره سازی را می توان دوباره پر کرد منابع خارجیمانند گزارش های آماری.

وظیفه مخزن ارائه "مواد خام" برای تجزیه و تحلیل در یک مکان و در یک ساختار ساده و قابل درک است.

دلیل دیگری وجود دارد که ظاهر یک ذخیره سازی جداگانه را توجیه می کند - پرس و جوهای تحلیلی پیچیده برای اطلاعات عملیاتی کار فعلی شرکت را کند می کند ، جداول را برای مدت طولانی مسدود می کند و منابع سرور را تصرف می کند.

در زیر ذخیره سازی می توان درک کرد که لزوماً یک انباشت غول پیکر از داده ها نیست - نکته اصلی این است که برای تجزیه و تحلیل راحت باشد.

تمرکز و ساختار مناسب با تمام نیازهای یک تحلیلگر فاصله دارد. از این گذشته ، او هنوز به ابزاری برای مشاهده ، تجسم اطلاعات نیاز دارد. گزارش های سنتی، حتی بر اساس یک مخزن واحد ساخته شده اند، فاقد یک چیز هستند - انعطاف پذیری. آنها را نمی توان "پیچان"، "بسط" یا "جمع کرد" تا نمای مورد نظر از داده ها را بدست آورد. ای کاش او چنین ابزاری داشت که به او اجازه می داد داده ها را به سادگی و به راحتی بسط و جمع کند! OLAP یکی از این ابزارهاست.

اگرچه OLAP یک ویژگی ضروری یک انبار داده نیست، اما به طور فزاینده ای برای تجزیه و تحلیل اطلاعات انباشته شده در این انبار داده استفاده می شود.

محل OLAP ساختار اطلاعاتشرکت ها (شکل 1).

تصویر 1. محلOLAP در ساختار اطلاعاتی شرکت

داده‌های عملیاتی از منابع مختلف جمع‌آوری می‌شوند، پاکسازی می‌شوند، یکپارچه می‌شوند و در یک فروشگاه رابطه‌ای قرار می‌گیرند. در عین حال، آنها در حال حاضر برای تجزیه و تحلیل با استفاده از ابزارهای گزارش دهی مختلف در دسترس هستند. سپس داده ها (به طور کامل یا جزئی) برای تجزیه و تحلیل OLAP آماده می شوند. آنها را می توان در یک پایگاه داده ویژه OLAP بارگذاری کرد یا در یک فروشگاه رابطه ای رها کرد. مهمترین عنصر آن فراداده است، یعنی اطلاعاتی در مورد ساختار، قرارگیری و تبدیل داده ها. با تشکر از آنها، تعامل موثر اجزای مختلف ذخیره سازی تضمین می شود.

به طور خلاصه، ما می توانیم OLAP را به عنوان مجموعه ای از ابزارها برای تجزیه و تحلیل چند بعدی داده های انباشته شده در یک انبار تعریف کنیم.

2. پردازش داده های تحلیلی عملیاتی.

مفهوم OLAP بر اساس اصل نمایش داده های چند بعدی است. در سال 1993، E. F. Codd ابتدا به کاستی های مدل رابطه ای اشاره کرد و به عدم امکان "ترکیب، مشاهده و تجزیه و تحلیل داده ها از نظر چندبعدی، یعنی به قابل درک ترین روش برای تحلیلگران شرکتی" اشاره کرد و کلیات را تعریف کرد. الزامات برای سیستم های OLAPکه کارایی DBMS رابطه ای را گسترش می دهد و یکی از ویژگی های آن تحلیل چند بعدی است.

به گفته کاد، یک دیدگاه مفهومی چند بعدی از داده ها یک دیدگاه چندگانه است که از چندین بعد مستقل تشکیل شده است که در امتداد آن مجموعه های خاصی از داده ها قابل تجزیه و تحلیل هستند.

تحلیل همزمان در ابعاد چندگانه به عنوان تحلیل چند متغیره تعریف می شود. هر بعد شامل جهت‌های تلفیق داده‌ها است که شامل یک سری سطوح متوالی تعمیم است که در آن هر سطح بالاتر با درجه بیشتری از تجمیع داده‌ها برای بعد مربوطه مطابقت دارد.

بنابراین، بعد پیمانکار را می توان با جهت ادغام، متشکل از سطوح تعمیم "شرکت - بخش - بخش - کارمند" تعیین کرد. بعد زمان حتی می تواند شامل دو جهت تثبیت شود - "سال - ربع - ماه - روز" و "هفته - روز"، زیرا شمارش زمان بر اساس ماه و هفته سازگار نیست. در این حالت، انتخاب دلخواه سطح جزئیات اطلاعاتی مورد نظر برای هر یک از اندازه گیری ها امکان پذیر می شود.

عملیات فرود (حفاری پایین) مربوط به حرکت از سطوح بالاتر تحکیم به سطوح پایین تر است. برعکس، عملیات بلند کردن (غلت کردن) به معنای حرکت از سطوح پایین تر به سطوح بالاتر است (شکل 2).

شکل 2.ابعاد و جهت ادغام داده ها

3. الزامات برای ابزار پردازش تحلیلی عملیاتی.

رویکرد چند بعدی تقریباً به طور همزمان و به موازات رویکرد رابطه ای پدید آمد. با این حال، فقط از اواسط دهه نود، یا بهتر است بگوییم از
1993، علاقه به MDBMSشروع به عمومی شدن کرد در این سال بود که مقاله خط مشی جدیدی از یکی از بنیانگذاران رویکرد رابطه ای ظاهر شد E. Codda، که در آن 12 الزام اساسی برای ابزار اجرا تدوین کرد OLAP(میز 1).

میز 1.

	نمایش داده های چند بعدی	ابزارها باید از دید چند بعدی داده ها در سطح مفهومی پشتیبانی کنند.
	شفافیت	کاربر نیازی ندارد بداند از چه ابزار خاصی برای ذخیره و پردازش داده ها استفاده می شود، داده ها چگونه سازماندهی شده اند و از کجا می آیند.
	دسترسی	خود ابزارها باید بهترین منبع داده را انتخاب کرده و با آن ارتباط برقرار کنند تا به یک درخواست داده شده پاسخ دهند. ابزارها باید نمایش خودکار خود را ارائه دهند نمودار منطقیبه منابع داده ناهمگن مختلف
	عملکرد ثابت	عملکرد باید عملا مستقل از تعداد ابعاد در پرس و جو باشد.
	پشتیبانی از معماری مشتری-سرور	ابزارها باید در معماری مشتری-سرور کار کنند.
	برابری در همه ابعاد	هیچ یک از ابعاد نباید پایه باشد، همه آنها باید برابر (متقارن) باشند.
	مدیریت دینامیک ماتریس های پراکنده	مقادیر تهی باید به کارآمدترین روش ذخیره و مدیریت شوند.
	پشتیبانی از حالت چند کاربره کار با داده	ابزارها باید به بیش از یک کاربر اجازه کار بدهند.
	پشتیبانی از عملیات مبتنی بر اندازه گیری های مختلف	تمام عملیات چند بعدی (مثلاً تجمع) باید به طور یکنواخت و پیوسته برای هر تعداد از ابعاد اعمال شود.
	سهولت دستکاری داده ها	ابزارها باید راحت ترین، طبیعی ترین و راحت ترین رابط کاربری را داشته باشند.
	ابزارهای پیشرفته ارائه داده ها	صندوق ها باید حمایت کنند راه های مختلفتجسم (بازنمایی) داده ها.
	تعداد نامحدود ابعاد و سطوح تجمیع داده ها	نباید محدودیتی در تعداد ابعاد پشتیبانی شده وجود داشته باشد.

قوانینی برای ارزیابی محصولات نرم افزاری کلاس OLAP

مجموعه ای از این الزامات که به عنوان تعریف واقعی OLAP عمل می کند باید به عنوان توصیه در نظر گرفته شود و محصولات منفرد باید بر اساس درجه تقریب به انطباق کامل ایده آل با همه الزامات مورد قضاوت قرار گیرند.

بعداً، تعریف Codd به‌اصطلاح آزمون FASMI تغییر داده شد و نیاز داشت که یک برنامه کاربردی OLAP توانایی تجزیه و تحلیل سریع اطلاعات چند بعدی مشترک را ارائه دهد.

یادآوری 12 قانون کاد برای اکثر مردم بسیار سنگین است. معلوم شد که می توان تعریف OLAP را تنها با پنج خلاصه کرد کلید واژه ها: تجزیه و تحلیل سریع اطلاعات چند بعدی مشترک - یا به طور خلاصه - FASMI (ترجمه شده از انگلیسی:اف ast آ تجزیه و تحلیل اس به اشتراک گذاشته شده است م فوق بعدی من اطلاعات).

این تعریف برای اولین بار در اوایل سال 1995 تدوین شد و از آن زمان به تجدید نظر نیازی نداشت.

سریع ( سریع) - به این معنی است که سیستم باید اکثر پاسخ ها را در عرض تقریباً پنج ثانیه به کاربران ارائه دهد. در عین حال، ساده ترین درخواست ها در عرض یک ثانیه و تعداد بسیار کمی - بیش از 20 ثانیه پردازش می شوند. تحقیقات نشان داده است که کاربران نهایی در صورت عدم دریافت نتایج پس از 30 ثانیه، فرآیندی را با شکست مواجه می‌کنند.

در نگاه اول، ممکن است تعجب برانگیز به نظر برسد که هنگام دریافت گزارش در یک دقیقه، که چندی پیش روزها طول می کشید، کاربر به سرعت در حین انتظار خسته می شود و پروژه نسبت به پاسخ فوری بسیار کمتر موفق است. حتی به قیمت تجزیه و تحلیل کمتر.

آنالیز (تحلیل)به این معنی که سیستم می تواند هر گونه تحلیل منطقی و آماری خاص را انجام دهد این نرم افزار، و حفظ آن را به شکلی که در دسترس کاربر نهایی باشد تضمین می کند.

اینکه این تجزیه و تحلیل در ابزارهای خود فروشنده انجام شود یا در یک محصول نرم افزاری خارجی مرتبط مانند صفحه گسترده، چندان مهم نیست، بلکه صرفاً این است که تمام عملکردهای تجزیه و تحلیل مورد نیاز باید به روشی بصری برای کاربران نهایی ارائه شود. ابزارهای تجزیه و تحلیل می‌توانند شامل رویه‌های خاصی مانند تجزیه و تحلیل سری‌های زمانی، تخصیص هزینه، انتقال ارز، جستجوی هدف، تغییر ساختارهای چند بعدی، مدل‌سازی غیر رویه‌ای، تشخیص استثنا، استخراج داده‌ها و سایر عملیات‌های خاص برنامه باشند. بسته به جهت گیری هدف، چنین قابلیت هایی در بین محصولات بسیار متفاوت است.

به اشتراک گذاشته شده (به اشتراک گذاشته شده) به این معنی است که سیستم تمام الزامات حفاظت از محرمانگی (شاید تا سطح سلول) را اعمال می کند و اگر دسترسی چندگانه به نوشتن مورد نیاز باشد، قفل اصلاح را در سطح مناسب اعمال می کند. همه برنامه ها نیازی به نوشتن اطلاعات ندارند. با این حال، تعداد چنین برنامه هایی در حال افزایش است و سیستم باید بتواند تغییرات متعدد را به موقع و ایمن انجام دهد.

چند بعدی - این یک نیاز کلیدی است. اگر بخواهیم OLAP را در یک کلمه تعریف کنیم، آن را انتخاب می کنیم. این سیستم باید یک نمایش مفهومی چند بعدی از داده ها، از جمله پشتیبانی کامل از سلسله مراتب و سلسله مراتب های متعدد را ارائه دهد، زیرا این قطعا منطقی ترین راه برای تجزیه و تحلیل کسب و کار و سازمان ها است. حداقل تعداد ابعادی وجود ندارد که باید پردازش شوند زیرا به کاربرد نیز بستگی دارد و اکثر محصولات OLAP ابعاد کافی برای بازارهای مورد نظر خود دارند.

اطلاعات -همه اطلاعات لازم باید در جایی که نیاز است به دست آید. با این حال، خیلی به برنامه بستگی دارد. قدرت محصولات مختلف بر حسب میزان ورودی آنها اندازه گیری می شود، نه اینکه چند گیگابایت می توانند ذخیره کنند. قدرت محصولات بسیار متفاوت است - بزرگترین محصولات OLAP می توانند حداقل هزار برابر بیشتر از کوچکترین داده ها را مدیریت کنند. فاکتورهای زیادی در این زمینه وجود دارد که از جمله می توان به تکرار داده ها، رم مورد نیاز، استفاده از فضای دیسک، عملکرد، یکپارچگی با فروشگاه های اطلاعات و غیره اشاره کرد.

آزمون FASMI یک تعریف معقول و قابل درک از اهدافی است که OLAP بر آن متمرکز است.

4. طبقه بندیOLAP- محصولات

بنابراین، جوهر OLAP در این واقعیت نهفته است که اطلاعات اولیه برای تجزیه و تحلیل در قالب یک مکعب چند بعدی ارائه می شود و می توان آن را به صورت دلخواه دستکاری کرد و بخش های اطلاعات - گزارش های لازم را به دست آورد. در عین حال، کاربر نهایی مکعب را به عنوان یک جدول پویا چند بعدی می بیند که به طور خودکار داده ها (واقعیت ها) را در بخش های مختلف (ابعاد) خلاصه می کند و به شما امکان می دهد محاسبات و فرم گزارش را به صورت تعاملی مدیریت کنید. این عملیات انجام می شود OLAP ماشین (یا ماشینمحاسبات OLAP).

تا به امروز محصولات زیادی در دنیا تولید شده اند که پیاده سازی می کنند OLAP -فن آوری. برای سهولت در پیمایش در میان آنها، از طبقه بندی استفاده کنید OLAP محصولات: از طریق ذخیره داده ها برای تجزیه و تحلیل و بر اساس مکان OLAP -ماشین ها. بیایید نگاهی دقیق تر به هر دسته بیندازیم.محصولات OLAP

طبقه بندی بر اساس روش ذخیره سازی داده ها

مکعب های چند بعدی بر اساس منبع و داده های کل ساخته می شوند. هم داده های منبع و هم داده های کل برای مکعب ها را می توان در پایگاه های داده رابطه ای و چند بعدی ذخیره کرد. بنابراین، در حال حاضر سه راه برای ذخیره داده ها وجود دارد: MOLAP (OLAP چند بعدی)، ROLAP (OLAP رابطه‌ای) و HOLAP (OLAP ترکیبی) ). به ترتیب، OLAP -محصولات با توجه به روش ذخیره سازی داده ها به سه دسته مشابه تقسیم می شوند:

1. در مورد MOLAP ، داده های منبع و جمع در یک پایگاه داده چند بعدی یا در یک مکعب محلی چند بعدی ذخیره می شوند.

2. در ROLAP -محصولات، داده های منبع در پایگاه داده های رابطه ای یا در جداول محلی مسطح در سرور فایل ذخیره می شوند. داده های انبوه را می توان در جداول سرویس در همان پایگاه داده قرار داد. تبدیل داده ها از یک پایگاه داده رابطه ای به مکعب های چند بعدی در صورت درخواست انجام می شودابزارهای OLAP

3. در صورت استفاده HOLAP معماری، داده های منبع در پایگاه داده رابطه ای باقی می مانند، در حالی که تجمیع ها در پایگاه داده چند بعدی قرار می گیرند. ساختمان OLAP مکعب در صورت درخواست انجام می شود OLAP ابزارهای مبتنی بر داده های رابطه ای و چند بعدی.

طبقه بندی مکان OLAP-ماشین ها.

بر این اساس OLAP -محصولات به دو دسته تقسیم می شوندسرورهای OLAP و مشتریان OLAP:

· در سرور OLAP -محاسبه و ذخیره سازی داده های کل توسط یک فرآیند جداگانه - سرور انجام می شود. برنامه سرویس گیرنده فقط نتایج پرس و جوها را در برابر مکعب های چند بعدی که در سرور ذخیره می شوند دریافت می کند. مقداری OLAP -سرورها از ذخیره سازی داده ها فقط در پایگاه داده های رابطه ای پشتیبانی می کنند، برخی از آنها فقط در پایگاه های چند بعدی. بسیاری از مدرن OLAP -سرورها از هر سه روش ذخیره داده پشتیبانی می کنند:MOLAP، ROLAP و HOLAP.

MOLAP.

MOLAP است پردازش تحلیلی چند بعدی،یعنی OLAP چند بعدی.این بدان معنی است که سرور از یک پایگاه داده چند بعدی (MBD) برای ذخیره داده ها استفاده می کند. معنای استفاده از MDB واضح است. این می‌تواند داده‌هایی را که ماهیت چند بعدی دارند، به طور کارآمد ذخیره کند و وسیله‌ای برای سرویس‌دهی سریع درخواست‌های پایگاه‌داده فراهم کند. داده ها از منبع داده به پایگاه داده چند بعدی منتقل می شوند و سپس پایگاه داده تجمیع می شود. پیش محاسبه چیزی است که پرس و جوهای OLAP را سرعت می بخشد زیرا داده های خلاصه قبلاً محاسبه شده اند. زمان پرس و جو صرفاً تابعی از زمان مورد نیاز برای دسترسی به یک قطعه خاص از داده و انجام یک محاسبه است. این روش از این مفهوم پشتیبانی می کند که کار یک بار انجام می شود و نتایج دوباره و دوباره مورد استفاده قرار می گیرند. پایگاه داده های چند بعدی یک فناوری نسبتا جدید هستند. استفاده از MDB همان اشکالات بسیاری از فناوری های جدید را دارد. یعنی، آنها به اندازه پایگاه های داده رابطه ای (RDB) پایدار نیستند و به همان میزان بهینه سازی نشده اند. یکی دیگر از نقاط ضعف MDB ناتوانی در استفاده از اکثر پایگاه های داده چند بعدی در فرآیند تجمیع داده ها است، بنابراین زمان بر است. اطلاعات جدیدبرای تجزیه و تحلیل در دسترس قرار گرفت.

ROLAP.

ROLAP است پردازش تحلیلی روی خط رابطه ای،یعنی OLAP رابطه ای.اصطلاح ROLAP به این معنی است که سرور OLAP بر اساس یک پایگاه داده رابطه ای است. داده های منبع در یک پایگاه داده رابطه ای، معمولاً در یک طرحواره ستاره ای یا طرح دانه های برف، وارد می شوند تا به کاهش زمان بازیابی کمک کنند. سرور یک مدل داده چند بعدی را با استفاده از پرس و جوهای SQL بهینه ارائه می دهد.

دلایل مختلفی برای انتخاب یک پایگاه داده رابطه ای به جای پایگاه داده چند بعدی وجود دارد. RDB یک فناوری جاافتاده با فرصت های زیادی برای بهینه سازی است. استفاده در دنیای واقعی منجر به یک محصول بالغ تر شد. علاوه بر این، RDB ها از حجم بیشتری از داده ها نسبت به MDB ها پشتیبانی می کنند. آنها فقط برای چنین حجم هایی طراحی شده اند. استدلال اصلی در برابر RDB ها پیچیدگی پرس و جوهای مورد نیاز برای بازیابی اطلاعات از یک پایگاه داده بزرگ با با استفاده از SQL. یک برنامه نویس بی تجربه SQL می تواند به راحتی با تلاش برای انجام کاری، منابع ارزشمند سیستم را تحت فشار قرار دهد. درخواست مشابه، که اجرای آن در MDB بسیار ساده تر است.

داده های انباشته/پیش انباشته شده.

اجرای سریع پرس و جو برای OLAP ضروری است. این یکی از اصول اساسی OLAP است - توانایی دستکاری داده ها به طور مستقیم نیاز به بازیابی سریع اطلاعات دارد. به طور کلی، هر چه محاسبات بیشتری برای به دست آوردن یک اطلاعات انجام شود، سرعت پاسخ دهی کمتر می شود. بنابراین، به منظور صرفه جویی در زمان اجرای کوئری کوچک، بخش هایی از اطلاعات که معمولاً اغلب به آنها دسترسی پیدا می کنند، اما در همان زمان نیاز به محاسبه دارند، از پیش جمع می شوند. یعنی شمارش می شوند و سپس به عنوان داده های جدید در پایگاه داده ذخیره می شوند. نمونه ای از نوع داده هایی که می توان از قبل محاسبه کرد، داده های خلاصه، مانند ارقام فروش ماهانه، فصلی یا سالانه است که داده های واقعی وارد شده برای آنها ارقام روزانه است.

فروشندگان مختلف روش های متفاوتی برای انتخاب پارامترها دارند که نیاز به پیش تجمیع و تعدادی مقادیر از پیش محاسبه شده دارند. رویکرد تجمیع هم بر پایگاه داده و هم بر زمان اجرای کوئری ها تأثیر می گذارد. اگر مقادیر بیشتری محاسبه شود، احتمال اینکه کاربر مقدار محاسبه شده قبلی را درخواست کند، افزایش می‌یابد و در نتیجه زمان پاسخگویی کاهش می‌یابد، زیرا نیازی نیست که مقدار اولیه برای محاسبه درخواست شود. با این حال، اگر همه مقادیر ممکن را محاسبه کنیم، اینطور نیست بهترین راه حل- در این صورت حجم پایگاه داده به میزان قابل توجهی افزایش می یابد که آن را غیرقابل مدیریت می کند و زمان تجمیع بیش از حد طولانی می شود. علاوه بر این، هنگامی که مقادیر عددی به پایگاه داده اضافه می شوند یا در صورت تغییر آنها، این اطلاعات باید در مقادیر از پیش محاسبه شده که به داده های جدید بستگی دارد منعکس شود. بنابراین، به روز رسانی پایگاه داده نیز می تواند مدت زیادی طول بکشد تعداد زیادیمقادیر از پیش محاسبه شده از آنجایی که پایگاه داده معمولاً در حین تجمیع به صورت آفلاین کار می کند، مطلوب است که زمان تجمیع خیلی طولانی نباشد.

OLAP کلاینت به طور متفاوتی پیکربندی شده است. ساخت مکعب چند بعدی و OLAP -محاسبات در حافظه کامپیوتر مشتری انجام می شود.OLAP -مشتریان نیز به دو دسته تقسیم می شوند ROLAP و MOLAP.و برخی ممکن است از هر دو گزینه دسترسی به داده پشتیبانی کنند.

هر یک از این رویکردها مزایا و معایب خود را دارند. برخلاف تصور رایج در مورد مزایای ابزارهای سرور نسبت به ابزارهای مشتری، در تعدادی از موارد استفاده از OLAP - استفاده از مشتری برای کاربران می تواند کارآمدتر و سودآورتر باشدسرورهای OLAP

توسعه برنامه های تحلیلی با استفاده از ابزارهای OLAP مشتری یک فرآیند سریع است و نیازی به آموزش خاصی از مجری ندارد. کاربری که پیاده سازی فیزیکی پایگاه داده را می داند می تواند به تنهایی یک برنامه تحلیلی را بدون دخالت متخصص فناوری اطلاعات توسعه دهد.

هنگام استفاده از یک سرور OLAP، باید 2 سیستم مختلف را یاد بگیرید، گاهی اوقات از فروشندگان مختلف، برای ایجاد مکعب در سرور، و توسعه یک برنامه مشتری.

مشتری OLAP یک رابط بصری واحد برای توصیف مکعب ها و سفارشی کردن رابط های کاربری برای آنها فراهم می کند.

بنابراین، در چه مواردی استفاده از کلاینت OLAP برای کاربران می تواند کارآمدتر و سودمندتر از استفاده از سرور OLAP باشد؟

· امکان سنجی اقتصادی کاربرد OLAP - سرور زمانی اتفاق می افتد که حجم داده ها بسیار زیاد و غیر قابل تحمل باشد OLAP -مشتری، در غیر این صورت استفاده از دومی توجیه بیشتری دارد. در این مورد OLAP -مشتری ویژگی های عملکرد بالا و هزینه کم را ترکیب می کند.

· رایانه های شخصی تحلیلگر قدرتمند استدلال دیگری هستند که به نفع آن هستند OLAP -مشتریان هنگامی که اعمال می شود OLAP -سرور از این ظرفیت ها استفاده نمی شود.

سایر مزایای مشتریان OLAP عبارتند از:

· هزینه های اجرا و نگهداری OLAP -مشتری به طور قابل توجهی کمتر از هزینه استسرور OLAP.

· استفاده كردن OLAP -کلاینت با ماشین داخلی انتقال داده از طریق شبکه یک بار انجام می شود. درحین انجام OLAP - عملیات جریان های داده جدید تولید نمی شود.

5. اصول عملیاتی OLAP-مشتریان

فرآیند ایجاد یک برنامه OLAP با استفاده از ابزار مشتری را در نظر بگیرید (شکل 1).

تصویر 1.با استفاده از ابزار ROLAP Client Tool یک برنامه OLAP ایجاد کنید

اصل عملکرد مشتریان ROLAP یک توصیف اولیه از لایه معنایی است که در پشت آن ساختار فیزیکی داده های منبع پنهان است. در این مورد، منابع داده می تواند: جداول محلی، RDBMS باشد. لیست منابع داده پشتیبانی شده توسط محصول نرم افزاری خاص تعیین می شود. پس از آن، کاربر می تواند به طور مستقل اشیایی را که از نظر منطقه موضوعی درک می کند دستکاری کند تا مکعب ها و رابط های تحلیلی ایجاد کند.

اصل عملکرد مشتری سرور OLAP متفاوت است. در سرور OLAP، هنگام ایجاد مکعب، کاربر توضیحات فیزیکی پایگاه داده را دستکاری می کند. این باعث ایجاد توضیحات سفارشی در خود مکعب می شود. کلاینت سرور OLAP فقط برای مکعب پیکربندی شده است.

هنگام ایجاد یک لایه معنایی، منابع داده - جداول فروش و معامله - با عباراتی قابل درک برای کاربر نهایی توصیف می شوند و به "محصولات" و "معاملات" تبدیل می شوند. فیلد "ID" از جدول "محصولات" به "کد" و "نام" - به "محصول" و غیره تغییر نام داده می شود.

سپس یک شیء تجاری فروش ایجاد می شود. یک شی تجاری یک میز صاف است که بر اساس آن یک مکعب چند بعدی تشکیل می شود. هنگام ایجاد یک شیء تجاری، جداول "محصولات" و "تعاملات" با فیلد "کد" محصول ترکیب می شوند.از آنجایی که نیازی به نمایش تمام فیلدهای جداول در گزارش نخواهد بود، شی کسب و کار فقط از فیلدهای "Item"، "Date" و "Amount" استفاده می کند.

در مثال ما، بر اساس شی تجاری "فروش"، گزارشی در مورد فروش کالاها بر اساس ماه ایجاد شد.

هنگام کار با یک گزارش تعاملی، کاربر می تواند شرایط فیلتر و گروه بندی را با همان حرکات ساده ماوس تنظیم کند. در این مرحله، مشتری ROLAP به داده های موجود در حافظه پنهان دسترسی پیدا می کند. مشتری سرور OLAP یک پرس و جو جدید برای پایگاه داده چند بعدی ایجاد می کند. به عنوان مثال با اعمال فیلتر محصول در گزارش فروش می توانید گزارشی از فروش محصولات مورد علاقه ما دریافت کنید.

تمام تنظیمات یک برنامه OLAP را می توان در یک مخزن متادیتا اختصاصی، در یک برنامه کاربردی یا در یک مخزن سیستم پایگاه داده چند بعدی ذخیره کرد.پیاده سازی بستگی به محصول نرم افزاری خاص دارد.

هر چیزی که در این برنامه ها گنجانده شده است یک نمای استاندارد از رابط، توابع و ساختار از پیش تعریف شده و رفع سریعبرای موقعیت های کم و بیش استاندارد. به عنوان مثال، بسته های مالی محبوب هستند. برنامه های مالی از پیش ساخته شده به متخصصان این امکان را می دهد که از ابزارهای مالی آشنا بدون نیاز به طراحی ساختار پایگاه داده یا فرم ها و گزارش های رایج استفاده کنند.

اینترنت است فرم جدیدمشتری. علاوه بر این، دارای مهر فناوری های جدید است. بسیاری از راه حل های اینترنتیبه طور قابل توجهی در قابلیت های آنها به طور کلی و در کیفیت راه حل OLAP به طور خاص متفاوت است. تولید گزارش های OLAP از طریق اینترنت مزایای زیادی دارد. مهمتر از همه، نیازی به تخصص ندارد نرم افزاربرای دسترسی به اطلاعات این باعث صرفه جویی زیادی در زمان و هزینه شرکت می شود.

6. انتخاب معماری برنامه OLAP.

هنگام پیاده سازی یک سیستم اطلاعاتی-تحلیلی، مهم است که در انتخاب معماری یک برنامه OLAP اشتباه نکنید. ترجمه تحت اللفظی عبارت On-Line Analytical Process - «پردازش تحلیلی آنلاین» - اغلب به معنای واقعی کلمه به این معنا تلقی می شود که داده های وارد شده به سیستم به سرعت تجزیه و تحلیل می شوند. این یک تصور اشتباه است - کارایی تجزیه و تحلیل به هیچ وجه با آن مرتبط نیست به موقعبه روز رسانی داده ها در سیستم این مشخصه به زمان پاسخگویی سیستم OLAP به درخواست های کاربر اشاره دارد. در عین حال، داده های تجزیه و تحلیل شده اغلب یک عکس فوری از اطلاعات "برای دیروز" هستند، اگر برای مثال، داده های موجود در انبارها یک بار در روز به روز شوند.

در این زمینه، ترجمه OLAP به عنوان "پردازش تحلیلی تعاملی" دقیق تر است. این توانایی تجزیه و تحلیل داده ها در حالت تعاملی است که سیستم های OLAP را از سیستم های تهیه گزارش های تنظیم شده متمایز می کند.

یکی دیگر از ویژگی های پردازش تعاملی در فرمول بندی موسس OLAP، E. Codd، توانایی "ترکیب، مشاهده و تجزیه و تحلیل داده ها در ابعاد چندگانه، یعنی به قابل درک ترین روش برای تحلیلگران شرکتی" است. برای خود کاد، اصطلاح OLAP بیانگر روشی بسیار خاص برای ارائه داده ها در سطح مفهومی است - چند بعدی. در سطح فیزیکی، داده ها را می توان در پایگاه های داده رابطه ای ذخیره کرد، اما در واقع، ابزارهای OLAP تمایل دارند با پایگاه های داده چند بعدی که در آن داده ها به شکل یک ابر مکعب سازماندهی شده اند، کار کنند (شکل 1).

تصویر 1. OLAP- مکعب (هیپر مکعب، متاکوب)

در همان زمان، ارتباط این داده ها با لحظه ای که هایپر مکعب با داده های جدید پر می شود، تعیین می شود.

بدیهی است که زمان تشکیل یک پایگاه داده چند بعدی به میزان قابل توجهی به میزان داده های بارگذاری شده در آن بستگی دارد، بنابراین منطقی است که این مقدار را محدود کنیم. اما چگونه نمی توان امکانات تحلیل را محدود کرد و کاربر را از دسترسی به تمام اطلاعات مورد علاقه محروم کرد؟ دو مسیر جایگزین وجود دارد: تجزیه و تحلیل سپس پرس و جو («ابتدا تجزیه و تحلیل - سپس اطلاعات اضافی درخواست کنید») و پرس و جو سپس تجزیه و تحلیل («ابتدا داده ها را جستجو کنید - سپس تجزیه و تحلیل کنید»).

پیروان مسیر اول بارگذاری اطلاعات عمومی را در یک پایگاه داده چند بعدی، به عنوان مثال، نتایج ماهانه، فصلی، سالانه برای بخش ها پیشنهاد می کنند. و اگر نیاز به اصلاح داده ها باشد، از کاربر خواسته می شود تا گزارشی را در یک پایگاه داده رابطه ای حاوی انتخاب مورد نیاز تولید کند، به عنوان مثال، بر اساس روز برای یک بخش معین یا بر اساس ماه ها و کارمندان یک بخش انتخاب شده.

طرفداران راه دوم، برعکس، پیشنهاد می کنند که کاربر، اول از همه، در مورد داده هایی که قرار است تجزیه و تحلیل کند تصمیم بگیرد و آن را در یک میکرو مکعب بارگذاری کند - یک پایگاه داده چند بعدی کوچک. هر دو رویکرد در سطح مفهومی متفاوت هستند و مزایا و معایب خود را دارند.

از مزایای رویکرد دوم می توان به "تازه بودن" اطلاعاتی اشاره کرد که کاربر در قالب یک گزارش چند بعدی - "میکرو مکعب" دریافت می کند. ریزمکعب بر اساس اطلاعاتی که فقط از پایگاه داده رابطه ای واقعی درخواست شده است، تشکیل می شود. کار با یک میکرو مکعب در حالت تعاملی انجام می شود - به دست آوردن برش هایی از اطلاعات و جزئیات آن در چارچوب یک میکرو مکعب فوراً انجام می شود. نکته مثبت دیگر این است که طراحی ساختار و پر کردن ریزمکعب توسط کاربر "در حال پرواز" و بدون مشارکت مدیر پایگاه داده انجام می شود. با این حال، این رویکرد نیز از کاستی های جدی رنج می برد. کاربر تصویر بزرگ را نمی بیند و باید از قبل در مورد جهت تحقیق خود تصمیم بگیرد. در غیر این صورت، میکرو مکعب درخواستی ممکن است خیلی کوچک باشد و تمام داده های مورد علاقه را در خود نداشته باشد و کاربر باید یک میکرو مکعب جدید، سپس یک میکرو مکعب جدید، سپس دیگری و دیگری درخواست کند. سپس رویکرد تحلیل Query ابزار BusinessObjects همان شرکت را پیاده سازی می کند و ابزارپلت فرم شرکت Contourاینترسافتآزمایشگاه.

با رویکرد Analyze then query، مقدار داده‌های بارگذاری شده در یک پایگاه داده چند بعدی می‌تواند بسیار زیاد باشد، پر کردن باید طبق قوانین انجام شود و زمان زیادی را می‌برد. با این حال، زمانی که کاربر تقریباً به تمام داده های لازم در هر ترکیبی دسترسی داشته باشد، همه این کاستی ها بعداً جبران می شود. ارجاع به داده های اصلی در پایگاه داده رابطه ای تنها به عنوان آخرین راه حل انجام می شود، زمانی که اطلاعات دقیق مورد نیاز است، به عنوان مثال، در یک فاکتور خاص.

عملکرد یک پایگاه داده چند بعدی عملاً تحت تأثیر تعداد کاربرانی که به آن دسترسی دارند، نمی باشد. آن‌ها فقط داده‌های موجود در آنجا را می‌خوانند، بر خلاف رویکرد Query then analysis، که در آن تعداد ریزمکعب‌ها در حالت محدود می‌تواند به همان میزان تعداد کاربران رشد کند.

با این رویکرد، بار روی خدمات فناوری اطلاعات افزایش می‌یابد که علاوه بر رابطه‌ای، مجبور به ارائه پایگاه‌های اطلاعاتی چند بعدی نیز می‌شوند.این خدمات هستند که مسئول به موقع هستند به روز رسانی خودکارداده ها در پایگاه داده های چند بعدی

برجسته‌ترین نمایندگان رویکرد «تجزیه و تحلیل سپس پرس و جو» ابزارهای PowerPlay و Impromptu Cognos هستند.

انتخاب هر دو رویکرد و ابزاری که آن را اجرا می کند در درجه اول به هدف دنبال شده بستگی دارد: شما همیشه باید بین صرفه جویی در بودجه و بهبود کیفیت خدمات کاربر نهایی تعادل برقرار کنید. در عین حال باید در نظر داشت که در برنامه راهبردی ایجاد سیستم های اطلاعاتی و تحلیلی هدف دستیابی به مزیت رقابتی و عدم اجتناب از هزینه اتوماسیون را دنبال می کند. به عنوان مثال، یک سیستم اطلاعاتی و تحلیلی شرکتی می تواند اطلاعات لازم، به موقع و قابل اعتماد را در مورد یک شرکت ارائه دهد که انتشار آن برای سرمایه گذاران بالقوه، شفافیت و قابل پیش بینی بودن این شرکت را تضمین می کند که به ناچار شرط جذابیت سرمایه گذاری آن خواهد بود.

7. حوزه های کاربرد فن آوری های OLAP.

OLAP در هر جایی که وظیفه تجزیه و تحلیل داده های چند عاملی وجود داشته باشد قابل اجرا است. به طور کلی، اگر جدولی با داده‌ها دارید که حداقل یک ستون توصیفی (بعد) و یک ستون با اعداد (اندازه‌ها یا واقعیت‌ها) دارد، ابزار OLAP معمولاً ابزار مؤثری برای تجزیه و تحلیل و تولید گزارش‌ها خواهد بود.

برخی از زمینه‌های کاربرد فناوری‌های OLAP را که از زندگی واقعی گرفته شده‌اند، در نظر بگیرید.

1. فروش.

بر اساس تجزیه و تحلیل ساختار فروش، موارد لازم برای تصمیم گیری مدیریتی حل می شود: تغییر دامنه کالا، قیمت، بسته شدن و افتتاح فروشگاه ها، شعب، فسخ و امضای قرارداد با نمایندگی ها، انجام یا خاتمه کمپین های تبلیغاتی و غیره.

2. خرید.

وظیفه برعکس تحلیل فروش است. بسیاری از شرکت ها قطعات و مواد را از تامین کنندگان خریداری می کنند. بازرگانان کالاها را برای فروش مجدد خریداری می کنند. در تحلیل تدارکات، از برنامه ریزی، وظایف محتمل زیادی وجود دارد پولبر اساس تجربیات گذشته، کنترل بر مدیرانانتخاب تامین کنندگان

3. قیمت ها.

تجزیه و تحلیل خریدها با تجزیه و تحلیل قیمت های بازار ادغام می شود. هدف از این تجزیه و تحلیل، بهینه سازی هزینه ها، انتخاب سودمندترین پیشنهادات است.

4. بازاریابی.

منظور از تحلیل بازاریابی، تنها حوزه تحلیل خریداران یا مشتریان-مصرف کنندگان خدمات است. وظیفه این تحلیل، موقعیت‌یابی صحیح محصول، شناسایی گروه‌های مشتری برای تبلیغات هدفمند و بهینه‌سازی مجموعه است. وظیفه OLAP در این مورد این است که به کاربر ابزاری بدهد تا به سرعت و با سرعت فکر به سؤالاتی که به طور شهودی در جریان تجزیه و تحلیل داده ها به وجود می آیند، پاسخ دهد.

5. انبار.

تجزیه و تحلیل ساختار موجودی انبار در انبار بر اساس انواع کالا، انبارها، تجزیه و تحلیل عمر مفید کالا، تجزیه و تحلیل حمل و نقل توسط گیرندگان و بسیاری از انواع دیگر تجزیه و تحلیل مهم برای شرکت در صورتی امکان پذیر است که سازمان حسابداری انبار داشته باشد.

6. جریان نقدی.

این یک حوزه کامل از تجزیه و تحلیل است که مکاتب و روش های زیادی دارد. فناوری OLAP می تواند به عنوان ابزاری برای پیاده سازی یا بهبود این تکنیک ها عمل کند، اما جایگزینی برای آنها نیست. جریان های نقدی وجوه غیر نقدی و نقدی در چارچوب عملیات تجاری، طرف مقابل، ارز و زمان به منظور بهینه سازی جریان ها، اطمینان از نقدینگی و غیره تحلیل می شود. ترکیب اندازه گیری ها به شدت به ویژگی های کسب و کار، صنعت، روش شناسی بستگی دارد.

7. بودجه.

یکی از پربارترین زمینه های کاربرد فناوری OLAP. هیچکدوم بیهوده سیستم مدرنبودجه بندی بدون وجود یک جعبه ابزار OLAP برای تجزیه و تحلیل بودجه در ترکیب آن کامل در نظر گرفته نمی شود. اکثر گزارش های بودجه به راحتی بر اساس سیستم های OLAP ساخته می شوند. در عین حال، گزارش ها به طیف بسیار گسترده ای از سوالات پاسخ می دهند: تجزیه و تحلیل ساختار هزینه ها و درآمد، مقایسه هزینه ها برای اقلام خاص در بخش های مختلف، تجزیه و تحلیل پویایی و روند هزینه ها برای اقلام خاص، تجزیه و تحلیل هزینه و سود. .

8. حساب های حسابداری.

ترازنامه کلاسیک متشکل از یک شماره حساب و حاوی مانده های ورودی، گردش مالی و مانده های خروجی را می توان به طور کامل در یک سیستم OLAP تجزیه و تحلیل کرد. علاوه بر این، سیستم OLAP می تواند به طور خودکار و بسیار سریع ترازهای تلفیقی یک سازمان چندشاخه، مانده های ماهانه، فصلی و سالانه، مانده های جمع شده بر اساس سلسله مراتب حساب، مانده های تحلیلی را بر اساس ویژگی های تحلیلی محاسبه کند.

9. گزارشگری مالی.

یک سیستم گزارش‌دهی که از نظر فناوری ساخته شده است چیزی نیست جز مجموعه‌ای از شاخص‌های نام‌گذاری شده با مقادیر تاریخ که باید در بخش‌های مختلف گروه‌بندی و خلاصه شود تا گزارش‌های خاص به دست آید. در این حالت، نمایش و چاپ گزارش ها به آسانی و ارزان ترین حالت در سیستم های OLAP پیاده سازی می شود. در هر صورت، سیستم گزارش دهی داخلی شرکت چندان محافظه کارانه نیست و می توان به منظور صرفه جویی در هزینه ها، ساختار آن را تغییر داد. کارهای مهندسیدر ایجاد گزارش و به دست آوردن امکان تحلیل عملیاتی چند متغیره.

10. ترافیک سایت.

فایل لاگ سرور اینترنت ماهیت چند بعدی دارد و بنابراین برای تجزیه و تحلیل OLAP مناسب است. حقایق عبارتند از: تعداد بازدیدها، تعداد بازدیدها، زمان صرف شده در صفحه و سایر اطلاعات موجود در لاگ.

11. حجم تولید.

این نمونه دیگری از تجزیه و تحلیل آماری است. بنابراین، می توان حجم سیب زمینی رشد کرده، فولاد ذوب شده، کالاهای تولیدی را تجزیه و تحلیل کرد.

12. مصرف مواد مصرفی.

کارخانه ای متشکل از ده ها کارگاه را تصور کنید که خنک کننده ها، مایعات شستشو، روغن ها، پارچه های پارچه ای، کاغذ سنباده - صدها مورد از مواد مصرفی را مصرف می کنند. برنامه ریزی دقیق و بهینه سازی هزینه نیاز به تجزیه و تحلیل کامل از مصرف واقعی مواد مصرفی دارد.

13. استفاده از محل.

نوع دیگری از تجزیه و تحلیل آماری. مثال ها: تجزیه و تحلیل حجم کار کلاس های درس، ساختمان ها و اماکن اجاره ای، استفاده از اتاق های کنفرانس و غیره.

14. گردش کارکنان در شرکت.

تجزیه و تحلیل گردش کارکنان در شرکت در زمینه شاخه ها، بخش ها، حرفه ها، سطح تحصیلات، جنسیت، سن، زمان.

15. حمل و نقل مسافر.

تجزیه و تحلیل تعداد بلیت های فروخته شده و مبالغ بر اساس فصل، مقصد، انواع واگن ها (کلاس ها)، انواع قطار (هواپیما).

این لیست به حوزه های کاربردی محدود نمی شود. OLAP - فن آوری ها به عنوان مثال، فناوری را در نظر بگیرید OLAP - تجزیه و تحلیل فروش

8. مثال استفاده OLAP -فناوری برای تجزیه و تحلیل در زمینه فروش.

طراحی نمایش داده های چند بعدی برای OLAP -تحلیل با تشکیل نقشه اندازه گیری آغاز می شود. به عنوان مثال، هنگام تجزیه و تحلیل فروش، ممکن است شناسایی بخش‌های بازار منفرد (مشتریان در حال توسعه، پایدار، بزرگ و کوچک، احتمال مشتریان جدید و غیره) و ارزیابی حجم فروش بر اساس محصولات، مناطق، مشتریان، بخش‌های بازار، توزیع مفید باشد. کانال ها و اندازه های سفارش این جهت ها شبکه مختصات نمایش چند بعدی فروش - ساختار ابعاد آن را تشکیل می دهند.

از آنجایی که فعالیت هر شرکت در زمان پیش می رود، اولین سوالی که در تحلیل مطرح می شود، پویایی توسعه کسب و کار است. سازماندهی صحیح محور زمانی پاسخی کیفی به این سوال خواهد داد. معمولاً محور زمان به سال، ربع و ماه تقسیم می شود. شاید حتی بیشتر به هفته ها و روزها تقسیم شود. ساختار بعد زمانی با در نظر گرفتن فراوانی دریافت داده ها شکل می گیرد. همچنین می توان با فراوانی درخواست اطلاعات تعیین کرد.

بعد "گروه کالا" طراحی شده است تا ساختار محصولات فروخته شده را تا حد امکان منعکس کند. در عین حال، حفظ تعادل خاصی برای جلوگیری از جزئیات بیش از حد (تعداد گروه ها باید قابل مشاهده باشد) و از طرف دیگر، از دست ندادن بخش قابل توجهی از بازار مهم است.

بعد "مشتریان" ساختار فروش را بر اساس منطقه جغرافیایی منعکس می کند. هر بعد می تواند سلسله مراتب خاص خود را داشته باشد، به عنوان مثال، در این بعد می تواند یک ساختار باشد: کشورها - مناطق - شهرها - مشتریان.

برای تجزیه و تحلیل عملکرد بخش ها، باید بعد خود را ایجاد کنید. به عنوان مثال، دو سطح از سلسله مراتب را می توان متمایز کرد: بخش ها و بخش های موجود در آنها، که باید در بعد "زیر بخش ها" منعکس شوند.

در واقع، ابعاد "زمان"، "محصولات"، "مشتریان" به طور کامل فضای حوزه موضوع را مشخص می کند.

علاوه بر این، تقسیم این فضا به مناطق مشروط، با در نظر گرفتن ویژگی های محاسبه شده، به عنوان مثال، محدوده حجم تراکنش از نظر ارزش، مفید است. سپس کل تجارت را می توان به تعدادی محدوده هزینه تقسیم کرد که در آن انجام می شود. در این مثال می توانید خود را به شاخص های زیر محدود کنید: میزان فروش کالا، تعداد کالاهای فروخته شده، میزان درآمد، تعداد معاملات، تعداد مشتریان، حجم خرید از تولیدکنندگان.

OLAP - مکعب برای تجزیه و تحلیل مانند (شکل 2) خواهد بود:

شکل 2.OLAP- یک مکعب برای تجزیه و تحلیل حجم فروش

دقیقاً چنین آرایه سه بعدی از نظر OLAP است که مکعب نامیده می شود. در واقع، از دیدگاه ریاضیات دقیق، چنین آرایه ای همیشه یک مکعب نخواهد بود: برای یک مکعب واقعی، تعداد عناصر در همه ابعاد باید یکسان باشد، در حالی که مکعب های OLAP چنین محدودیتی ندارند. یک مکعب OLAP اصلاً لازم نیست سه بعدی باشد. بسته به مشکلی که حل می شود، می تواند دو بعدی و چند بعدی باشد. محصولات جدی OLAP برای حدود 20 بعد طراحی شده اند.برنامه های دسکتاپ ساده تر حدود 6 بعد را پشتیبانی می کنند.

همه عناصر مکعب نباید پر شوند: اگر اطلاعاتی در مورد فروش محصول 2 به مشتری 3 در سه ماهه سوم وجود نداشته باشد، مقدار در سلول مربوطه به سادگی تعیین نمی شود.

با این حال، خود مکعب برای تجزیه و تحلیل مناسب نیست. اگر هنوز امکان نمایش یا ترسیم کافی یک مکعب سه بعدی وجود دارد، از شش یا نوزده بعدیاوضاع خیلی بدتر است بنابراین، جداول دو بعدی معمولی قبل از استفاده از یک مکعب چند بعدی استخراج می شود. این عملیات «برش» مکعب نامیده می شود. تحلیلگر، همانطور که بود، ابعاد مکعب را با توجه به علائم مورد علاقه خود می گیرد و "برش" می دهد. به این ترتیب، تحلیلگر یک برش دو بعدی از مکعب (گزارش) را دریافت کرده و با آن کار می کند. ساختار گزارش در شکل 3 نشان داده شده است.

شکل 3ساختار گزارش تحلیلی

بیایید مکعب OLAP خود را برش دهیم و یک گزارش فروش برای سه ماهه سوم دریافت کنیم، به این شکل خواهد بود (شکل 4).

شکل 4گزارش فروش سه ماهه سوم

می توانید مکعب را در امتداد محور دیگر برش دهید و گزارشی از فروش گروه محصول 2 در طول سال دریافت کنید (شکل 5).

شکل 5گزارش فصلی فروش محصول 2

به طور مشابه، می توانید رابطه با مشتری را تجزیه و تحلیل کنید. برش مکعب با توجه به برچسب مشتریان(شکل 6)

شکل 6گزارش عرضه کالا به مشتری 4

شما می توانید گزارش را به تفصیل ماهانه توضیح دهید یا در مورد عرضه کالا به شعبه خاصی از مشتری صحبت کنید.

پس از بررسی کامل بودن و قابلیت اطمینان اطلاعات، پردازش تحلیلی آن انجام می شود. این شامل تعریف سیستمی از شاخص ها است که مطالعه آن برای دستیابی به اهداف تجزیه و تحلیل ضروری است. این شاخص ها یا قبلاً در اطلاعات انتخاب شده موجود هستند یا در فرآیند پردازش تحلیلی آن محاسبه می شوند.

منظور از سیستم شاخص ها، مجموعه منظمی از آنهاست که در آن هر شاخص یک ویژگی کمی و کیفی از جنبه خاصی از فعالیت یک واحد اقتصادی می دهد، با سایر شاخص ها در ارتباط است، اما آنها را تکرار نمی کند و دارای ویژگی ها است. تقلیل پذیری و تقسیم پذیری

تعداد شاخص‌ها در فرآیند پردازش تحلیلی اطلاعات بسته به برنامه تحلیل، عمق مطالعه نتایج فعالیت‌ها و عوامل مؤثر بر آن‌ها می‌تواند تقریباً نامحدود از طریق تمایز یا ادغام آنها افزایش یابد.

از آنجایی که فعالیت واحدهای اقتصادی، تقسیمات ساختاری آنها و همچنین انجمن های مختلف آنها به طور کلی کاملاً پایدار است، سیستم شاخص هایی که با آن تجزیه و تحلیل می شود از ثبات خاصی برخوردار است، اما به تدریج با ظهور وظایف جدید با شاخص های جدید غنی می شود. وضعیت عمومی اقتصادی، شرایط خارجی و داخلی فعالیت واحدهای اقتصادی.

یک پیش نیاز ضروری برای توسعه یک سیستم شاخص های تحلیلی و کاربرد صحیح آن، گروه بندی این شاخص ها بر اساس معیارهای مختلف است (شکل 4.1 را ببینید).

تقسیم بندی شاخص ها به مطلقو نسبت فامیلیبرای تعیین دامنه و پیچیدگی پردازش تحلیلی اطلاعات ضروری است.

اطلاعات جمع آوری شده از منابع مختلف عمدتاً شامل شاخص های مطلق است که حجم فعالیت واحد اقتصادی مورد تجزیه و تحلیل را مشخص می کند (به عنوان مثال، حجم فروش کالا، میزان هزینه های تولید کالا یا خدمات، حجم عمده فروشی یا خرده فروشی. تجارت، مقدار پیش پرداخت

برنج. 4.1. طبقه بندی شاخص های تحلیلی بر اساس مختلف

ویژگی های گروه بندی

سرمایه، مقدار سود یا زیان، تعداد کارکنان، ارزش دارایی های ثابت، اندازه موجودی ها).

شاخص های نسبی که برای ارزیابی عملکرد سازمان مورد تجزیه و تحلیل به عنوان یک کل یا بخش های ساختاری داخلی آن از اهمیت بالایی برخوردار هستند، قبلاً توسط عملیات ریاضی مختلف در فرآیند پردازش تحلیلی اطلاعات محاسبه می شوند. چنین پردازش تحلیلی ممکن است تا حدی توسط مقررات مربوطه به عنوان وظایف بخش حسابداری و سایر بخش های ساختاری داخلی یک واحد اقتصادی (به عنوان مثال، تعیین بهای تمام شده محصولات جداگانه، سطح سود نسبت به سرمایه، محاسبه) پیش بینی شود. استانداردهای اقتصادی به عنوان بخشی از گزارش بانک های تجاری).

محاسبه شاخص‌های نسبی قابلیت مقایسه داده‌ها را برای دوره‌های زمانی مختلف افزایش می‌دهد، زیرا همه شاخص‌های مطلقی که برای این منظور در فرمول‌های ریاضی استفاده می‌شوند، با ارزی محاسبه می‌شوند که قدرت خرید یکسانی دارد، یعنی. تاثیر تورم از بین می رود. علاوه بر این، تمام شاخص های مطلق مربوط به یک دوره معین تحت تأثیر همان وضعیت داخلی و خارجی شکل می گیرند. به همین دلیل است که در تحلیل، مقایسه‌های دینامیکی و مکانی عمدتاً با استفاده از شاخص‌های نسبی و نه مطلق انجام می‌شود.

برای افزایش قابلیت مقایسه داده ها، در صورت امکان از آنها استفاده می شود. طبیعیو با کمک ضرایب خاص تعیین شده، به اصطلاح به ضرایب طبیعی تبدیل می شود مشروط طبیعیمتر برای همین منظور، در برخی موارد اولویت داده می شود کار یدیو هزینه عنصرمتر، که در صورت لزوم، امکان حذف تأثیر بر شاخص های مطلق تغییرات بهای تمام شده کالا و در شاخص های نسبی حاصل از این مقدار، تفاوت در بهای تمام شده کالا ناشی از نوسانات نسبت بهای تمام شده انتقالی را فراهم می کند. دارایی های ثابت، دستمزد نیروی کار و سود در قیمت محصولات. باید در نظر داشت که حتی هنگام استفاده از ارز خارجی سخت برای اندازه‌گیری بهای تمام شده شاخص‌های مطلق، تأثیر تغییرات ساختاری بر ارزیابی حجم فعالیت یک واحد اقتصادی و ویژگی‌های کیفی آن حذف نمی‌شود. لذا در ادامه ارائه، مسائل و استفاده از انواع کنتورهای طبیعی، مشروط طبیعی، کارگری و غیر تمام هزینه برای دستیابی به برخی اهداف تحلیل مورد توجه ویژه قرار خواهد گرفت.

گروه بندی شاخص های تحلیلی به کمیو کیفیتبه تقسیم آنها به مطلق و نسبی بسیار نزدیک است، اما کاملاً با آن منطبق نیست. به عنوان مثال، مقدار کل سود یک شاخص کمی است، اما از نظر محتوای اقتصادی آن به ویژگی های کیفی فعالیت های شی اشاره دارد، زیرا این واقعیت است که سود، و نه زیان، حتی بدون کسب سود نسبی. شاخص ها در حال حاضر نتیجه مثبت فعالیت به نظر می رسد.

نقش بسیار مهمی در تجزیه و تحلیل اقتصادی با تقسیم شاخص ها بر اساس تعمیم دادنو خصوصی.

شاخص های خلاصه سازی شاخص هایی در نظر گرفته می شوند که به کمک آنها آورده شده است ویژگی های خلاصهوضعیت واحد اقتصادی مورد تجزیه و تحلیل، میزان استفاده از منابع در اختیار و کارایی مدیریت که در دستیابی به اهداف دنبال شده بیان می شود. اهداف اولیه ممکن است به دست آوردن سود بالاتر در مقایسه با نرخ ریفاینانس یا با سایرین باشد راه های جایگزیناستفاده از سرمایه در دسترس موضوع؛ دستیابی به کیفیت بالاتر کالاها و خدمات نسبت به رقبا در همان سطح یا پایین تر از هزینه های تولید و گردش آنها. تسخیر بر این اساس بازارهای جدید و افزایش قیمت شرکت. شاخص‌های تعمیم‌دهنده همچنین شامل شاخص‌هایی هستند که عموماً سمت یا جهت خاصی از شرکت یا بخش‌های ساختاری فردی آن، اندازه منابع مورد استفاده و گردش مالی آنها را مشخص می‌کنند. هر شاخص تعمیم دهنده را می توان به تعدادی شاخص خاص که نقش فرعی در رابطه با آن ایفا می کنند، تجزیه کرد. این شاخص‌های خصوصی به شناسایی و اندازه‌گیری تأثیر عوامل داخلی و خارجی فردی کمک می‌کنند که اندازه و پویایی شاخص تعمیم‌دهنده را تعیین می‌کنند. با کمک شاخص های خصوصی، تبعیت اهداف محلی واحدها و فعالیت های یک واحد اقتصادی به اهداف کلی عملکرد آن محقق می شود. هدف کلی عملکرد یک واحد اقتصادی بدون ابهام نیست، به معنای دستیابی همزمان و به هم پیوسته تعدادی از اهداف است و بنابراین میزان دستیابی به آن نه توسط یک، بلکه توسط یک سیستم کلی از شاخص های تعمیم دهنده و خاص منعکس می شود. .

برای مدیریت فعالیت‌های یک واحد اقتصادی به‌عنوان یک کل، حوزه‌های فردی آن و اقدامات هر مجری، ابتدا مدلی از این فعالیت ایجاد می‌شود. توسط سیستمی از شاخص‌های تعمیم‌دهنده و خاص ثابت شده در طرح کسب‌وکار توصیف می‌شود که سطح و اتصال آن باید دستیابی به نتایج عملکرد برنامه‌ریزی‌شده را تضمین کند.

سیستم شاخص های برنامه ریزی شده، به عنوان یک قاعده، فقیرتر از سیستم شاخص های حسابداری است، زیرا حسابداری تأثیر نه تنها عواملی را که می توان از قبل پیش بینی کرد، بلکه همچنین بسیاری از عوامل غیر قابل پیش بینی - عینی و ذهنی، به عنوان مثال، بلایای طبیعی را منعکس می کند. ، عدم صداقت مجریان، کلاهبرداری و سرقت. در نتیجه، حسابداری منعکس کننده تأثیر بر شاخص های تعمیم و خاص کل تنوع واقعیت است.

سیستم شاخص های تحلیلی حتی گسترده تر از برنامه و حسابداری است، زیرا باید بازتابی از نتایج مدیریت و ارزیابی سطح اثربخشی آن در تمام زمینه های برنامه ریزی شده و اهداف متعدد و نه تنها به طور کلی برای نسبتاً ارائه دهد. سیستم اقتصادی مستقل در حال مطالعه (تشکیلات، بانک تجاری) و همچنین برای بخش های بزرگ و کوچک آن. شناسایی نقش واحدهای فردی در نتایج نهاییفعالیت ها و تأثیر عوامل مختلف بر توسعه اقتصادی. بنابراین، سیستم شاخص های تحلیلی شامل شاخص های تعمیم دهنده (نتایج) متمایز شده بر اساس حوزه های فعالیت و شاخص های خصوصی (عاملی) است.

شاخص‌های خاصی که از تجزیه یک شاخص تعمیم‌دهنده تشکیل می‌شوند یا در یک شاخص تعمیم‌دهنده تجمیع می‌شوند، در تجزیه و تحلیل فعالیت اقتصادی شاخص‌های عاملی نیز نامیده می‌شوند، زیرا استفاده از آنها امکان آشکارسازی و اندازه‌گیری تأثیر برخی عوامل اقتصادی بر شاخص‌های تعمیم‌دهنده را ممکن می‌سازد. همانطور که می دانید، تغییرات در وضعیت جسم مورد تجزیه و تحلیل تحت تأثیر عوامل اقتصادی و اجتماعی رخ می دهد. معمولاً اصطلاح "علت" به گروهی از عوامل اطلاق می شود که تأثیر آنها را می توان مستقیماً از داده های حسابداری و گزارشگری تعیین کرد. با تجزیه بیشتر گروه به اجزای آن، شاخص‌های عامل جزئی به‌دست‌آمده نیز در صورتی که ارتباط آن‌ها با شاخص تحلیل‌شده کاربردی باشد، علت نامیده می‌شوند و با انجام عملیات ریاضی مختلف بر روی شاخص‌های گزارش‌دهنده قابل محاسبه هستند.

در مواردی که تأثیر بر شاخص تحلیل شده سایر افراد مرتبط با آن در یک همبستگی شناسایی و اندازه گیری می شود و قدرت تأثیر آنها با استفاده از روش های آماری و ریاضی اندازه گیری می شود، شاخص های خاصی که برای جزئیات تجزیه و تحلیل به دست می آیند معمولاً دیگر علت نامیده نمی شوند. ، اما عوامل

بنابراین، تمایز بین اصطلاح «علت» و «عامل» بسیار مشروط است. عمدتاً بر اساس احتمالات اندازه گیری مستقیم یا غیرمستقیم تأثیر آنها با در نظر گرفتن ماهیت ارتباط با شاخص تعمیم یافته تحلیل شده است.

به عنوان مثال، انحراف از برنامه برای حجم تولید ممکن است به دلیل اختلاف بین برنامه تعداد و ترکیب پرسنل و در عین حال، میانگین تولید هر کارگر برای دوره مورد تجزیه و تحلیل باشد. مقادیر گروه های مجموع عوامل فوق و انحرافات آنها از برنامه به طور مستقیم در گزارش منعکس می شود و در تجزیه و تحلیل نامیده می شود. دلایل انحرافات. با این حال، هر یک از این دلایل را می توان بیشتر به عنوان تابعی از بسیاری از متغیرها در نظر گرفت. بنابراین، تغییر در تعداد کارکنان بر اساس دسته‌های پرسنل به تفصیل بیان می‌شود، خروجی هر کارمند به عنوان حاصلضرب تولید به ازای هر کارگر و سهم کارگران از تعداد کل کارکنان ارائه می‌شود. این شاخص‌های تحلیلی را می‌توان با استفاده مستقیم از داده‌های گزارشی محاسبه کرد و به همین دلیل به آنها دلایل متمایزتر تغییر در شاخص خلاصه نیز می‌گویند.

اجازه دهید فرض کنیم که تجزیه و تحلیل بیشتر عمیق تر شود تا تأثیر آن بر تغییر در شاخص تعمیم یابد - حجم تولید عواملی که به نوبه خود بر تحقق برنامه تولید به ازای هر کارگر تأثیر می گذارد. با این شاخص نمی توان به طور مستقیم ایجاد کرد. به عنوان مثال، وظیفه تعیین تأثیر بر میانگین سطح خروجی سطح سازمانی و فنی تولید (درجه مکانیزاسیون و اتوماسیون اصلی) است. فرآیندهای تکنولوژیکیو کار کمکی، معرفی روش های سازماندهی علمی کار، همکاری خارجی و غیره) و عوامل شخصی (تحصیلات عمومی و ویژه، تجربه کاری، جنسیت، سن).

با توجه به داده های تعمیم یافته حسابداری و حسابداری آماری، اندازه گیری تأثیر عوامل ذکر شده بر تولید و از طریق آن بر حجم تولید یا نرخ رشد آن غیرممکن است. بدین منظور داده های اولیه حسابداری و اسنادی با روش های خاص اقتصادی و ریاضی (عمدتاً همبستگی) جمع آوری و پردازش می شوند. خدمات فنی، بخش های پرسنل، کار و دستمزد، و همچنین اطلاعات اضافی اضافی حسابداری (بررسی پرسشنامه، عکس ها و عکس های خود از روز کاری، صورتجلسات جلسات تولید و غیره) جمع آوری شده است. با چنین جزئیات بیشتر علل، ویژگی های آنها قبلاً عوامل نامیده می شود.

اندازه گیری تأثیر عوامل فردی بر پویایی توسعه اقتصادی، نتایج اجرای برنامه و کارایی مدیریت به تثبیت اهمیت نسبی آنها در کار شرکت، تمرکز بر عوامل اصلی و تعیین کننده و افزایش اثر بخشی تجزیه و تحلیل در شناسایی ذخایر

یکپارچگی سیستم شاخص ها و روش محاسبه آنها باید برای شرکت هایی با همان مشخصات تضمین شود. تلاش برای اعمال همان شاخص های تخمین زده شده در واحدهای اقتصادی بخش های مختلف اقتصاد ملی محقق نشد، زیرا هویت شاخص های مورد استفاده مورد نیاز نیست، بلکه مطابقت آنها با رویکرد اساسی برای ارزیابی نتایج به دست آمده توسط تحلیل شده است. نهاد از منظر اهداف فعالیت خود، معیارهای محلی و جهانی برای دستیابی به آنها.

شرکت همیشه نمی تواند به تمام اهداف خود دست یابد و تمام وظایف محول شده را حل کند. همچنین در کنار اجرای طرح برای برخی از شاخص ها می توان نتیجه منفی برای برخی دیگر به دست آورد. در این راستا، هنگام تعیین رتبه یک واحد اقتصادی، تقسیمات ساختاری آن، توصیه می شود یک شاخص انتگرال مشروط محاسبه شود، که سطح آن منعکس کننده میزان تحقق اهداف برنامه ریزی شده برای هر یک از شاخص ها و نسبی آنها باشد. ارزش.

شاخص انتگرال، که بر اساس تعدادی دیگر از نظر محتوای اقتصادی و هدف عملی آنها بسیار متفاوت است، به دست آمده است، نتایج خاص کار موضوع مورد تجزیه و تحلیل و میزان دستیابی به اهداف متعدد تعیین شده برای او را مشخص نمی کند. از این شاخص می توان برای تعیین رتبه استفاده کرد. در همه موارد دیگر، استفاده از آن با ماهیت چند منظوره عملکرد واحدهای اقتصادی مطابقت ندارد.

برای ارزیابی اجرای طرح و به‌علاوه سطح بازده اقتصادی، باید تمام شاخص‌های موجود در سیستم را در نظر گرفت، زیرا اجرای بیش از حد برنامه برای یکی از آنها، پیوند اقتصادی تحلیل‌شده را از بین نمی‌برد. تعهد به اطمینان از دستیابی به سطح برنامه ریزی شده برای سایر شاخص ها. بهبود برنامه ریزی شده بالاتر در یکی از شاخص ها معمولاً آسیب ناشی از تاخیر در شاخص دیگر را جبران نمی کند، که نشان دهنده عدم انجام، شاید حتی مهمتر از وظایف محول شده به این واحد اقتصادی است. به عنوان مثال، بیش از حد قابل توجهی از سطح برنامه ریزی شده تولید کالاها (کارها، خدمات) نیاز به اطمینان از سطح معینی از هزینه در هر واحد خروجی را رد نمی کند. اجرای بیش از حد طرح از نظر حجم تولید و سود نمی تواند عدم تحقق طرح راه اندازی تاسیسات تصفیه و سایر اقدامات حفاظت از محیط زیست را جبران کند.

قابل قبول ترین راه برای ساخت یک شاخص انتگرال، حل مسئله ریاضی محاسبه فواصل بین نقاطی است که مقادیر همان شاخص ها را در واحدهای اقتصادی مقایسه شده و در بهترین شرکت مشروط برای همه این شاخص ها مشخص می کند. استاندارد توسعه نامیده می شود و به این ترتیب شاخص «سطح توسعه» هر یک از آنها تعیین می شود. مزیت آن نسبت به سایر روش های محاسبه شاخص انتگرال، عینی بودن برآوردها است، زیرا بر اساس محاسبات ریاضی است.

راه های دیگر تجمیع شاخص ها به اندازه کافی عینی نیستند. به عنوان مثال، هنگام محاسبه یک شاخص انتگرال، اهمیت یک یا آن شاخص در سیستم کلی آنها نیز می تواند با استفاده از یک امتیاز تعیین شود. بنابراین اگر به دلیل کمیاب بودن فلزات کمیاب مورد استفاده، مقرون به صرفه ترین استفاده از آنها اهمیت ویژه ای داشته باشد، بالاترین امتیاز به شاخص کاهش شدت ماده تولید برای این فلزات تعلق می گیرد. اگر قبل از هر چیز لازم است از گسترش بیشتر مجموعه اطمینان حاصل شود، سپس با اختصاص نمره بالاتر به این شاخص، در وهله اول در تعدادی از شاخص های ارزیابی مطرح می شود. بنابراین، علیرغم اینکه ارزیابی کارایی تولید در بخش‌های تک‌تک اقتصاد ملی و بنگاه‌های آن‌ها بر اساس سیستم شاخص‌های یکسانی است، می‌توان به هر یک از آن‌ها حتی در یک صنعت یا بنگاه در دوره‌های مختلف، امتیاز متفاوتی نسبت داد. زمان. امتیازدهی هر شاخص باید نشان دهنده اهمیت آن در دستیابی به اهداف عملکرد واحدهای اقتصادی مورد تجزیه و تحلیل باشد. در عین حال، مانند هر ارزیابی ذهنی، این نکات را می توان خودسرانه تنظیم کرد.

برای دوره تحت پوشش، شاخص هایی وجود دارد که وضعیت واحد اقتصادی مورد تجزیه و تحلیل و نتایج فعالیت های آن یا اقدامات کارکنان آن در یک منطقه خاص را با تعداد معینی مشخص می کند. که در ایستا، یا برای دوره تحلیل شده، یعنی. که در پویایی شناسی. به عنوان مثال، ترازنامه وضعیت مالی، توزیع دارایی، منابع تشکیل آن در تاریخ تدوین را منعکس می کند و صورت جریان وجوه نقد موجودی، دریافت ها و واگذاری آنها را پوشش می دهد، یعنی. پویایی آنها برای کل دوره مورد تجزیه و تحلیل.

در رابطه با فعالیت واحد اقتصادی مورد تجزیه و تحلیل و امکان تأثیرگذاری بر نتایج آن، شاخص‌های منعکس کننده مستقل عینیدلایل و ذهنیبسته به آن

در فرآیند تجزیه و تحلیل، از بین بردن تأثیر عوامل یک نظم عینی، که نمی توان آن را به نتایج مفید یا برعکس، به کاستی های فعالیت خود واحد اقتصادی نسبت داد، بسیار مهم است.

همراه با انتخاب یک سیستم از شاخص ها برای تجزیه و تحلیل با توجه به برنامه برنامه ریزی شده پراهمیتدارای تعمیم اطلاعات در جداول و شکل های تحلیلی است. جداول تحلیلی برای مقایسه داده های پردازش تحلیلی بر اساس دوره های زمانی و تعیین پویایی شاخص های مورد مطالعه، مقایسه مقادیر به دست آمده یا پیش بینی شده آنها با داده های پایه که می تواند شاخص های متناظر طرح قبلی و پیش بینی شده باشد، استفاده می شود. پیش بینی دوره های آتی، هنجارهای اجباری، شاخص های سایر واحدهای اقتصادی، میانگین برای صنعت یا هر مورد دیگری که توسط تحلیلگر بر اساس هدف مطالعه انتخاب شده است.

برای چنین مقایسه‌هایی معمولاً از ردیف‌های افقی جدول تحلیلی استفاده می‌شود که در آنها نام داده‌های مقایسه شده و مقادیر مطلق و نسبی آنها درج می‌شود. چنین مقایسه‌هایی در ردیف‌های جدول، تحلیل افقی نامیده می‌شود.

با توجه به ستون‌های جدول تحلیلی، شاخص‌های تعمیم‌دهنده با اجزای خود - شاخص‌های خاص - مقایسه می‌شوند تا شناسایی شوند. ارزش نسبیاین شاخص های خصوصی در شکل گیری شاخص های تعمیم دهنده، به ویژه ساختار شاخص های تعمیم دهنده تعیین می شود. این روش انعکاس اطلاعات پردازش شده تحلیلی را تحلیل عمودی یا ساختاری می نامند.

جدول تحلیلی دارای بخش های متنی (چپ) و عددی (راست) است. برای پردازش کامپیوتری اطلاعات، قسمت متن جدول را می توان با استفاده از حروف الفبا یا عددی رمزگذاری کرد. اعداد در ستون های جدول در خطوط جداگانه ای که از آنها عبور می کنند قرار می گیرند.

سمت چپ جدول که نام سطرهای آن در آن قرار می گیرد، «موضوع» و سمت راست، متشکل از ستون هایی که بالای آن نام آنها نیز مشخص شده است، «مقدم» نامیده می شود.

تعمیم اطلاعات جمع آوری شدهدر جداول تحلیلی به هم پیوسته، تکمیلی یا تفصیلی یکدیگر امکان تحلیل به اصطلاح بدون متن را فراهم می کنند. اطلاعات پردازش شده با دقت تحلیلی که در جداول قرار داده شده است، نتیجه گیری های لازم و توسعه تصمیمات مدیریت صحیح را ممکن می سازد. در این موارد نیازی به ارائه نتایج تحلیل در قالب متن نیست و یا همان متن فوق العاده فشرده ارائه می شود.

تهیه مجموعه ای از جداول تحلیلی که با عینیت و کامل بودن تمام مسائل برنامه تحلیل و نتایج آن را منعکس کند، مستلزم حرفه ای بودن بالا از سوی توسعه دهندگان چیدمان این جداول و دستورالعمل های تکمیل آنها است.

بنابراین در عمل از روش‌های استاندارد برای این منظور استفاده می‌شود و تنها تغییراتی در جداول توصیه‌شده در آن‌ها ایجاد می‌شود که ناشی از ویژگی‌های فردی واحد اقتصادی مورد تجزیه و تحلیل یا وضعیتی است که بر روی آن ایجاد شده است.

با استفاده از جداول تحلیلی و به خصوص ایجاد تغییرات در آنها، رعایت قوانین کلی برای طراحی آنها ضروری است:

1) بالای جدول باید نام و شماره سریال آن قرار داده شود.

2) اگر در تمام سطرها و ستون های جدول از واحدهای اندازه گیری یکسان استفاده می شود، در پرانتزهای زیر نام جدول در گوشه سمت راست لازم است که تعیین استاندارد واحد اندازه گیری، به عنوان مثال (هزار) قرار گیرد. روبل) یا ($). اگر واحدهای اندازه گیری متفاوتی در ردیف های جدول استفاده شود، نام آنها در سرصفحه های ردیف قرار می گیرد که با کاما پس از نام آن جدا می شوند. اگر واحدهای اندازه گیری متفاوتی در ستون ها استفاده می شود، باید در عناوین ستون ها نیز مشخص شوند.

3) ستون های جدول به ترتیب شماره گذاری می شوند و از اول شروع می شوند که در آن شماره خطوط نشان داده شده است. در مواردی که شاخص‌های ستون‌های مختلف بر اساس مقادیر نشان‌داده‌شده در ستون‌های قبلی محاسبه می‌شوند، علاوه بر نام و شماره سریال این ستون، باید الگوریتم محاسبه‌ای نیز ارائه شود که تعداد ستون‌های حاوی داده های اولیه، و همچنین اقدامات ریاضی که باید با آنها برای به دست آوردن مقادیر نشان داده شده در این ستون انجام شود، به عنوان مثال: [(ستون 4 - ستون 3) ∙ 100: 3]؛

4) عناوین در «مقدم» در مواردی که ستون‌های آن محتوای مشترک ندارند یا پیچیده هستند - وقتی محتوای مشترک چندین ستون در هر یک از آنها به تفصیل آمده باشد. سپس عنوان در قالب چندین ردیف نشان داده می شود، به عنوان مثال:

برای افزایش دید مواد تجزیه و تحلیل، اغلب از آن استفاده می شود روش های گرافیکی. برای مثال جداولی که دینامیک اندیکاتورها را ثبت می کنند با ارقامی همراه هستند که در آنها این دینامیک به صورت منحنی یا میله ای ارائه شده است. ساختار شاخص های تعمیم دهنده در ستون های جداول تحلیلی به صورت نمودار دایره ای نشان داده شده است. از اشکال دیگر نمودارها نیز استفاده می شود.