Skip to content

Instantly share code, notes, and snippets.

Created September 27, 2017 00:05
Show Gist options
  • Save anonymous/4f195b0423be8892902a1059d86ad91a to your computer and use it in GitHub Desktop.
Save anonymous/4f195b0423be8892902a1059d86ad91a to your computer and use it in GitHub Desktop.
Таблицы измерений содержат

Таблицы измерений содержат



Ссылка на файл: >>>>>> http://file-portal.ru/Таблицы измерений содержат/


Лекции - Корпоративные информационные системы - файл 8 OLAP и хранилища данных.doc
Таблицы фактов и измерений в хранилищах данных
Метод многомерного моделирования
























Таблица фактов является основной таблицей хранилища данных. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться. Обычно говорят о четырех наиболее часто встречающихся типах фактов. Они основаны на отдельных событиях типичными примерами которых являются телефонный звонок или снятие денег со счета с помощью банкомата ;. Основаны на состоянии объекта например, банковского счета в определенные моменты времени, например на конец дня, или месяца. Типичными примерами таких фактов являются объем продаж за день или дневная выручка;. Основаны на том или ином документе например, счете за товар или услуги и содержат подробную информацию об элементах этого документа например, количестве, цене, проценте скидки ;. Представляют возникновение события без подробностей о нем например, просто факт продажи или факт отсутствия таковой без иных подробностей. Для примера рассмотрим факты, связанные с элементами документа в данном случае счета, выставленного за товар. Таблица фактов, как правило, содержит уникальный составной ключ, объединяющий первичные ключи таблиц измерений. При этом как ключевые, так и некоторые неключевые поля должны соответствовать будущим измерениям OLAP-куба. Помимо этого таблица фактов содержит одно или несколько числовых полей, на основании которых в дальнейшем будут получены агрегатные данные. Пример таблицы фактов, которая может быть построена на основе базы данных Northwind, приведен на рис. В данном примере измерениям будущего куба соответствуют первые шесть полей, а агрегатным данным — последние четыре. Отметим, что для многомерного анализа пригодны таблицы фактов, содержащие как можно более подробные данные то есть соответствующие членам нижних уровней иерархии соответствующих измерений. В данном случае предпочтительнее взять за основу факты продажи товаров отдельным заказчикам, а не суммы продаж для разных стран — последние все равно будут вычислены OLAP-средством. Исключение можно сделать, пожалуй, только для клиентских OLAP-средств о них мы поговорим чуть позже , поскольку в силу ряда ограничений они не могут манипулировать большими объемами данных. Отметим, что в таблице фактов нет никаких сведений о том, как группировать записи при вычислении агрегатных данных. Например, в ней есть идентификаторы продуктов или клиентов, но отсутствует информация о том, к какой категории относится данный продукт или в каком городе находится данный клиент. Эти сведения, в дальнейшем используемые для построения иерархий в измерениях куба, содержатся в таблицах измерений. Таблицы измерений содержат неизменяемые либо редко изменяемые данные. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле обычно с именем члена измерения и, как правило, целочисленное ключевое поле обычно это суррогатный ключ для однозначной идентификации члена измерения. Отметим, что скорость роста таблиц измерений должна быть незначительной по сравнению со скоростью роста таблицы фактов; например, добавление новой записи в таблицу измерений, характеризующую товары, производится только при появлении нового товара, не продававшегося ранее. Пример таблицы измерений приведен на рис. Одно измерение куба может содержаться как в одной таблице в том числе и при наличии нескольких уровней иерархии , так и в нескольких связанных таблицах, соответствующих различным уровням иерархии в измерении. Пример такой схемы приведен на рис. Однако не все хранилища данных проектируются по двум приведенным выше схемам. В этом случае соответствующая таблица измерений просто отсутствует. В случае несбалансированной иерархии например, такой, которая может быть основана на таблице Employees базы данных Northwind, имеющей поле Employee ID, которое одновременно является и первичным, и внешним ключом и отражает подчиненность одних сотрудников другим см. В этом случае обычно в таблице измерений присутствует связь, аналогичная соответствующей связи в оперативной базе данных. Еще один пример отступления от правил — наличие нескольких разных иерархий для одного и того же измерения. Типичные примеры таких иерархий — иерархии для календарного и финансового года при условии, что финансовый год начинается не с 1 января , или с различными способами группировки членов измерения например, группировать товары можно по категориям, а можно и по компаниям-поставщикам. В этом случае таблица измерений содержит поля для всех возможных иерархий с одними и теми же членами нижнего уровня, но с разными членами верхних уровней пример такой таблицы приведен на рис. Как мы уже отмечали выше, таблица измерений может содержать поля, не имеющие отношения к иерархиям и представляющие собой просто дополнительные атрибуты членов измерений member properties. Иногда такие атрибуты могут быть использованы при анализе данных. Следует сказать, что для создания реляционных хранилищ данных нередко применяются специализированные СУБД, хранение данных в которых оптимизировано с точки зрения скорости выполнения запросов. Примером такого продукта является Sybase Adaptive Server IQ, реализующий нетрадиционный способ хранения данных в таблицах не по строкам, а по столбцам. Однако создавать хранилища можно и в обычных реляционных СУБД. Многомерный анализ данных может быть произведен с помощью различных средств, которые условно можно разделить на клиентские и серверные OLAP-средства. Клиентские OLAP-средства представляют собой приложения, осуществляющие вычисление агрегатных данных сумм, средних величин, максимальных или минимальных значений и их отображение, при этом сами агрегатные данные содержатся в кэше внутри адресного пространства такого OLAP-средства. Если исходные данные содержатся в настольной СУБД, вычисление агрегатных данных производится самим OLAP-средством. Если же источник исходных данных — серверная СУБД, многие из клиентских OLAP-средств посылают на сервер SQL-запросы, содержащие оператор GROUP BY, и в результате получают агрегатные данные, вычисленные на сервере. Как правило, OLAP-функциональность реализована в средствах статистической обработки данных из продуктов этого класса на российском рынке широко распространены продукты компаний Stat Soft и SPSS и в некоторых электронных таблицах. В частности, неплохими средствами многомерного анализа обладает Microsoft Excel С помощью этого продукта можно создать и сохранить в виде файла небольшой локальный многомерный OLAP-куб и отобразить его двух- или трехмерные сечения. Помимо этого многие компании предлагают элементы управления ActiveX и другие библиотеки, реализующие подобную функциональность. Отметим, что клиентские OLAP-средства применяются, как правило, при малом числе измерений обычно рекомендуется не более шести и небольшом разнообразии значений этих параметров, — ведь полученные агрегатные данные должны умещаться в адресном пространстве подобного средства, а их количество растет экспоненциально при увеличении числа измерений. Поэтому даже самые примитивные клиентские OLAP-средства, как правило, позволяют произвести предварительный подсчет объема требуемой оперативной памяти для создания в ней многомерного куба. Многие но не все! Отметим, что нередко такая возможность используется для отчуждения агрегатных данных с целью передачи их другим организациям или для публикации. Типичным примером таких отчуждаемых агрегатных данных является статистика заболеваемости в разных регионах и в различных возрастных группах, которая является открытой информацией, публикуемой министерствами здравоохранения различных стран и Всемирной организацией здравоохранения. При этом собственно исходные данные, представляющие собой сведения о конкретных случаях заболеваний, являются конфиденциальными данными медицинских учреждений, которые ни в коем случае не должны попадать в руки страховых компаний и тем более становиться достоянием гласности. Идея сохранения кэша с агрегатными данными в файле получила свое дальнейшее развитие в серверных OLAP-средствах, в которых сохранение и изменение агрегатных данных, а также поддержка содержащего их хранилища осуществляются отдельным приложением или процессом, называемым OLAP-сервером. Клиентские приложения могут запрашивать подобное многомерное хранилище и в ответ получать те или иные данные. Некоторые клиентские приложения могут также создавать такие хранилища или обновлять их в соответствии с изменившимися исходными данными. Преимущества применения серверных OLAP-средств по сравнению с клиентскими OLAP-средствами сходны с преимуществами применения серверных СУБД по сравнению с настольными: Отметим, что средства анализа и обработки данных масштаба предприятия, как правило, базируются именно на серверных OLAP-средствах, например, таких как Oracle Express Server, Microsoft SQL Server Analysis Services, Hyperion Essbase, продуктах компаний Crystal Decisions, Business Objects, Cognos, SAS Institute. Поскольку все ведущие производители серверных СУБД производят либо лицензировали у других компаний те или иные серверные OLAP-средства, выбор их достаточно широк и почти во всех случаях можно приобрести OLAP-сервер того же производителя, что и у самого сервера баз данных. Отметим, что многие клиентские OLAP-средства в частности, Microsoft Excel , Seagate Analysis и др. Помимо этого имеется немало продуктов, представляющих собой клиентские приложения к OLAP-средствам различных производителей. Главная Опубликовать работу О сайте. Сохрани ссылку на реферат в одной из сетей: Таблица фактов Таблица фактов является основной таблицей хранилища данных. Типичными примерами таких фактов являются объем продаж за день или дневная выручка; факты, связанные с элементами документа Line-item facts. Основаны на том или ином документе например, счете за товар или услуги и содержат подробную информацию об элементах этого документа например, количестве, цене, проценте скидки ; факты, связанные с событиями или состоянием объекта Event or state facts. Пример таблицы фактов В данном примере измерениям будущего куба соответствуют первые шесть полей, а агрегатным данным — последние четыре. Таблицы измерений Таблицы измерений содержат неизменяемые либо редко изменяемые данные. Пример таблицы измерений Одно измерение куба может содержаться как в одной таблице в том числе и при наличии нескольких уровней иерархии , так и в нескольких связанных таблицах, соответствующих различным уровням иерархии в измерении. OLAP на клиенте и на сервере Многомерный анализ данных может быть произведен с помощью различных средств, которые условно можно разделить на клиентские и серверные OLAP-средства.


Схема метро полежаевская
Новости чугуева сегодня последние свежие
Как установить java приложение на телефон
Таблица фактов
Правила санитарной безопасности 414
Может ли аллергия проявиться через месяц
Найти российскую карту
Таблицы измерений
Турция суперлига до 21 года таблица
Приказ министерства здравоохранения 186
Типичная структура хранилищ данных
Чип тюнинг ховера своими руками
68 элемент таблицы
Как делать бумажных журавликов поэтапно
Таблицы фактов и измерений в хранилищах данных
Фен витек 1337 эл схема
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment