Распределенные базы данных.

Подпишитесь на бесплатную рассылку видео-курсов:

Ответ студента Светлана из группы ГМУб-34-13

В начале 80 годов Крис Дейт вывел теорию распределённых баз данных. При рассмотрении распределённых баз данных необходимо провести ясные различие между системами распределённых баз данных и системами распределённой обработки данных. В системе распределённых баз данных, они распределены между несколькими возможно территориально удалёнными ЭВМ. Возможности для управления этими разделёнными частями. По иному построены системы распределённой обработки данных, которые имеют распределённые между связанными ЭВМ вычислительные мощности и программное обеспечение, но централизованную базу данных. Распределённая БД состоит из нескольких, возможно пересекающихся, дублирующих друг друга частей хранимых в различных ЭВМ вычислительной сети. Работа с такой БД осуществляется с помощью систем управления распределённой базы данных. Информация о местоположении каждой из частей распределённой базы данных и другая служебная информация хранится в глобальном словаре данных, который может хранится на одном из узлов сети, а может быть и распределённым. Для обеспечения корректного доступа к распределенной БД применяются протокол двухфазной фиксации транзакций, суть этого метода состоит в двухэтапной синхронизации выполняемых изменений на всех задействованных узлах сети. На 1 этапе в узлах сети производятся изменения, пока обратимые, после чего посылаются уведомления компоненту системы, который управляет обработкой распределённых транзакций. На 2 этапе после получения сообщений о правильности выполнения операции. Управляющий компонент выдаёт всем узлам сети команду фиксации изменений. Транзакция считается завершенной, а её результат не обратим. В распределённых базах данных поддерживаются две основные идеи: 1. Много пользователей, территориально распределённых одновременно, могут работать с одной общей базой данных. Логически и физически распределённые данные составляют единое взаимно согласованное целое, общую базу данных. Поэтому основной целью системы распределённых баз данных является обеспечение управляемого доступа и независимого обращения к данным. Управляемый доступ - степень безопасности необходимая для защиты данных от неавторизованного доступа и независимость обращения. Получать доступ к данных через различные иногда значительно удалённые вычислительные средства. Принципы создания и функционирования распределения баз данных. 1. Прозрачность расположения данных для пользователя. (т.е. распределённая база данных должна представляется пользователю точно так же как и не распределённая. 2 Изолированность пользователей друг от друга. 3. Синхронизация и согласованность. Из основных принципов вытекает ряд дополнительных принципов: локальная автономия, отсутствие центральной установки, независимость от местоположения, непрерывность функционирования, независимость от фрагментации данных (как от горизонтальной, так и от вертикальной), независимость от реплицирования (дублирования данных), распределённая обработка запросов, распределённое управление транзакциями, независимость аппаратуры, независимость от типа операционной системы, независимость от СУБД - интероперабельность. Достоинства распределённой базы данных: 1. Пользователи всех узлов получают информацию с учётом всех последних изменений. 2. Экономное использование внешней памяти компьютера, что позволяет организовывать базу данных больших объёмов. Недостатки: жёсткие требования к производительности и надёжности каналов сети, а так же большие затраты коммуникационных и вычислительных ресурсов из-за их связывания на всё время выполнения транзакций, на всё время выполнения транзакций.

Ответ студента Денис из группы Эб-44-14/3

История создания компьютерных информационных систем насчитывает несколько десятилетий. За это время были созданы системы по автоматизации деятельности банков, статистических бюро, промышленных предприятий, контор, агентств по бронированию и продаже билетов и т.д. Однако бурная деятельность по созданию новых систем автоматизации не только не утихает, но и переживает в последнее время заметное оживление. Эта ситуация связана с все возрастающим значением систем обработки информации для выживания компаний в условиях высокой конкуренции, уменьшением удельной стоимости таких систем, с развитием технологий обработки и хранения информации, а также качественным изменением ситуации с развитием технологий передачи данных, в частности Internet. Первые ИС создавались для больших ЭВМ и имели унитарную структуру, т.е. представляли собой по сути одну программу, включающую в себя все функции по хранению данных, их обработке и представлению, а также по контролю доступа к данным со стороны пользователей системы. Такая организация ИС имеет ряд достоинств. Это, в частности, централизованное хранение и обработка информации, простота администрирования системы, а также очень эффективное использование вычислительных ресурсов - для выполнения важных задач может быть выделена вся мощь вычислительной системы.

Ответ студента Людмила из группы Пб-45-13/3

Распределенные базы данных невозможно рассматривать вне контекста более общей и более значимой темы распределенных информационных систем. Процессы децентрализации и информационной интеграции, происходящие во всем мире, неизбежно должны рано или поздно затронуть нашу страну. Россия, в силу своего географического положения и размеров "обречена" на преимущественное использование распределенных систем. На мой взгляд, это направление может успешно развиваться лишь при выполнении двух главных условий - адекватном развитии глобальной сетевой инфраструктуры и применении реальных технологий создания распределенных информационных систем. Под распределенной (Distributed DataBase - DDB) обычно подразумевают базу данных, включающую фрагменты из нескольких баз данных, которые располагаются на различных узлах сети компьютеров, и, возможно управляются различными СУБД. Распределенная база данных выглядит с точки зрения пользователей и прикладных программ как обычная локальная база данных. В этом смысле слово "распределенная" отражает способ организации базы данных, но не внешнюю ее характеристику. ("распределенность" базы данных невидима извне). 1.1. Определение Дэйта. Лучшее, на мой взгляд, определение распределенных баз данных (DDB) предложил Дэйт (C.J. Date) . Он установил 12 свойств или качеств идеальной DDB: Локальная автономия (local autonomy) Независимость узлов (no reliance on central site) Непрерывные операции (continuous operation) Прозрачность расположения (location independence) Прозрачная фрагментация (fragmentation independence) Прозрачное тиражирование (replication independence) Обработка распределенных запросов (distributed query processing) Обработка распределенных транзакций (distributed transaction processing) Независимость от оборудования (hardware independence) Независимость от операционных систем (operationg system independence) Прозрачность сети (network independence) Независимость от баз данных (database independence) Локальная автономия Это качество означает, что управление данными на каждом из узлов распределенной системы выполняется локально. База данных, расположенная на одном из узлов, является неотъемлемым компонентом распределенной системы. Будучи фрагментом общего пространства данных, она, в то же время функционирует как полноценная локальная база данных; управление ею выполняется локально и независимо от других узлов системы. Независимость от центрального узла В идеальной системе все узлы равноправны и независимы, а расположенные на них базы являются равноправными поставщиками данных в общее пространство данных. База данных на каждом из узлов самодостаточна - она включает полный собственный словарь данных и полностью защищена от несанкционированного доступа. Непрерывные операции Это качество можно трактовать как возможность непрерывного доступа к данным (известное "24 часа в сутки, семь дней в неделю") в рамках DDB вне зависимости от их расположения и вне зависимости от операций, выполняемых на локальных узлах. Это качество можно выразить лозунгом "данные доступны всегда, а операции над ними выполняются непрерывно". Прозрачность расположения Это свойство означает полную прозрачность расположения данных. Пользователь, обращающийся к DDB, ничего не должен знать о реальном, физическом размещении данных в узлах информационной системы. Все операции над данными выполняются без учета их местонахождения. Транспортировка запросов к базам данных осуществляется встроенными системными средствами. Прозрачная фрагментация Это свойство трактуется как возможность распределенного (то есть на различных узлах) размещения данных, логически представляющих собой единое целое. Существует фрагментация двух типов: горизонтальная и вертикальная. Первая означает хранение строк одной таблицы на различных узлах (фактически, хранение строк одной логической таблицы в нескольких идентичных физических таблицах на различных узлах). Вторая означает распределение столбцов логической таблицы по нескольким узлам. Рассмотрим пример, иллюстрирующий оба типа фрагментации. Имеется таблица employee (emp_id, emp_name, phone), определенная в базе данных на узле в Фениксе. Имеется точно такая же таблица, определенная в базе данных на узле в Денвере. Обе таблицы хранят информацию о сотрудниках компании. Кроме того, в базе данных на узле в Далласе определена таблица emp_salary (emp_id, salary). Тогда запрос "получить информацию о сотрудниках компании" может быть сформулирован так: SELECT * FROM employee@phoenix, employee@denver ORDER BY emp_id В то же время запрос "получить информацию о заработной плате сотрудников компании" будет выглядеть следующим образом: SELECT employee.emp_id, emp_name, salary FROM employee@denver, employee@phoenix, emp_salary@dallas ORDER BY emp_id Прозрачность тиражирования Тиражирование данных - это асинхронный (в общем случае) процесс переноса изменений объектов исходной базы данных в базы, расположенные на других узлах распределенной системы. В данном контексте прозрачность тиражирования означает возможность переноса изменений между базами данных средствами, невидимыми пользователю распределенной системы. Данное свойство означает, что тиражирование возможно и достигается внутрисистемными средствами. Обработка распределенных запросов Это свойство DDB трактуется как возможность выполнения операций выборки над распределенной базой данных, сформулированных в рамках обычного запроса на языке SQL. То есть операцию выборки из DDB можно сформулировать с помощью тех же языковых средств, что и операцию над локальной базой данных. Например, SELECT customer.name, customer.address, order.number, order.date FROM customer@london, order@paris WHERE customer.cust_number = order.cust_number Обработка распределенных транзакций Это качество DDB можно трактовать как возможность выполнения операций обновления распределенной базы данных (INSERT, UPDATE, DELETE), не разрушающее целостность и согласованность данных. Эта цель достигается применением двухфазового или двухфазного протокола фиксации транзакций (two-phase commit protocol), ставшего фактическим стандартом обработки распределенных транзакций. Его применение гарантирует согласованное изменение данных на нескольких узлах в рамках распределенной (или, как ее еще называют, глобальной) транзакции. Независимость от оборудования Это свойство означает, что в качестве узлов распределенной системы могут выступать компьютеры любых моделей и производителей - от мэйнфреймов до "персоналок". Независимость от операционных систем Это качество вытекает из предыдущего и означает многообразие операционных систем, управляющих узлами распределенной системы. Прозрачность сети Доступ к любым базам данных может осуществляться по сети. Спектр поддерживаемых конкретной СУБД сетевых протоколов не должен быть ограничением системы с распределенными базами данных. Данное качество формулируется максимально широко - в распределенной системе возможны любые сетевые протоколы. Независимость от баз данных Это качество означает, что в распределенной системе могут мирно сосуществовать СУБД различных производителей, и возможны операции поиска и обновления в базах данных различных моделей и форматов. Исходя из определения Дэйта, можно рассматривать DDB как слабосвязанную сетевую структуру, узлы которой представляют собой локальные базы данных. Локальные базы данных автономны, независимы и самоопределены; доступ к ним обеспечиваются СУБД, в общем случае от различных поставщиков. Связи между узлами - это потоки тиражируемых данных. Топология DDB варьируется в широком диапазоне - возможны варианты иерархии, структур типа "звезда" и т.д. В целом топология DDB определяется географией информационной системы и направленностью потоков тиражирования данных. Посмотрим, во что выливается некоторые наиболее важные свойства DDB, если рассматривать их практически.

Нужно высшее
образование?

Учись дистанционно!

Попробуй бесплатно уже сейчас!

Просто заполни форму и получи доступ к нашей платформе:

Получить доступ бесплатно

Ваши данные под надежной защитой и не передаются 3-м лицам