Хранилище Данных

Все лекции по предмету

0


Подпишитесь на бесплатную рассылку видео-курсов:

Текст лекции

Однако за последние годы ситуация существенно изменилась. И это непосредственно связано с тем, что практически в любой организации сложилась хорошо всем знакомая парадоксальная ситуация: информация вроде бы, где-то и есть, её даже слишком много, но она неструктурированна, несогласованна, разрознена, не всегда достоверна, её практически невозможно найти и получить. Необходимо сделать небольшое терминологическое (или, если хотите, историческое) отступление. Сегодня используются два основных варианта перевода термина «Data Warehouse»: Хранилище Данных и Информационное Хранилище. Однако второй вариант перевода, возможно более точно отражая смысл концепции, не совсем корректен. Дело в том, что термин Warehouse используется в информационных технологиях достаточно давно. Ещё в 80-х годах фирмой IBM была предложена концепция «Information Warehouse». И более корректно, оставить термин «Информационное Хранилище» за самостоятельной концепцией развиваемой фирмой IBM. Каждый из этих терминов несёт самостоятельную смысловую нагрузку, и фирма IBM говорит о том, что «Information Warehouse» – это «Data Warehouse Plus». Сегодня, СОД реализованные на самой различной основе, исправно работают и при этом исправно порождают и пополняют многочисленные многотомные электронные архивы. Основное назначение таких систем - оперативная обработка и они не могут себе позволить роскошь хранить данные более чем за несколько месяцев. После того как данные устаревают, они выгружаются и вычищаются из операционной БД. А поскольку, обычно в любой организации функционирует несколько различных несвязанных или слабо связанных СОД, выгруженные из них данные, как правило, имеют различную структуру, формат, стандарты представления дат и денежных величин. Для обозначения одних и тех же объектов, используются различные кодировки. Как правило, в них, в явном виде отсутствуют реквизиты, идентифицирующие временной срез, которому они соответствуют и источники их получения. В результате, огромные архивные массивы, накопленные за годы эксплуатации СОД и содержащие самую разнообразную жизненно важную для организации информацию, остаются невостребованными. Без предварительной доработки и согласования, архивные данные бесполезны и не могут быть непосредственно использованы в задачах анализа. Но данные, порожденные в результате функционирования корпоративных СОД - это только часть информации необходимой для принятия корректного бизнес решения. Организация живет и функционирует в реальном мире. Включение в аналитическую систему данных из различных электронных статистических сборников (как общедоступных, так и коммерческих), прогнозов развития регионов и областей экономики, законодательной базы, позволяет по новому взглянуть на многие закономерности, выявленные в процессе анализа внутренних данных. И как показывает практика, любое решение принятое исключительно на основе внутренних данных, скорее всего, окажутся не вполне корректными. Стремление объединить в одной архитектуре СППР возможности OLTP-систем и систем анализа, требования к которым во многом противоречивы, привело к появлению концепции хранилищ данных (ХД).


Нужно высшее
образование?

Учись дистанционно!

Попробуй бесплатно уже сейчас!

Просто заполни форму и получи доступ к нашей платформе:




Получить доступ бесплатно

Ваши данные под надежной защитой и не передаются 3-м лицам


Предыдущие понятия

КОНЦЕПЦИЯ ХРАНИЛИЩА ДАННЫХ
КОНЦЕПЦИЯ ХРАНИЛИЩА ДАННЫХ
00:00:59
Организация хранилища данных
Организация хранилища данных
00:00:29