Среда
СУБД состоит из следующих программных
компонентов:
1. Процессор
запросов.
Основной компонент СУБД, который
преобразует запросы в последовательность
низкоуровневых инструкций для контроллера
базы данных.
2. Контроллер
базы данных.
Этот компонент взаимодействует с
пользовательскими прикладными программами
и запросами. Для выполнения поступившего
запроса контроллер базы данных вызывает
контроллер файлов.
3. Контроллер
файлов.
Этот компонент предназначен для хранения
файлов и отвечает за распределение
дискового пространства. Он создает и
поддерживает список структур и индексы,
определенные во внутренней схеме СУБД.
4.
Процессор
языка DML.
Этот программный компонент преобразует
операторы DML,
вставленные в прикладные программы.
Для генераций соответствующего кода
препроцессор DML
взаимодействует с процессором запросов.
5. Компилятор
языка DDL.
Компилятор языка DDL
преобразует DDL-команды
в набор таблиц, содержащих «данные о
данных». Эти таблицы сохраняются в
системном каталоге, а управляющая
информация сохраняется в заголовках
файлов с данными.
6. Контроллер
словаря.
Контроллер словаря управляет доступом
к системному каталогу и работает с ним.
Системный каталог доступен большинству
компонентов СУБД.
Основные
компоненты среды СУБД представлены на
рис.1.1.
Рис.1.1.
Основные компоненты СУБД
1.4. Архитектура среды базы данных
Главная
особенность систем с базами данных
заключается в том, чтобы предложить
пользователям систем абстрактное
представление о данных,
скрыв особенности хранения и управления
ими. Поскольку база данных является
общим ресурсом информационной системы,
то каждому пользователю может потребоваться
свое, отличное от других представление
о данных, хранимых в системе. Для
удовлетворения этих потребностей
комитет стандартов ANSI/ SPARC признал
необходимость использования системы
трехуровневого подхода при описании
элементов данных. Трехуровневая
архитектура
состоит из: внешнего, концептуального
и внутреннего уровней абстракций.
Трехуровневая архитектура ANSI/SPARC
представлена на рис.1.2.
Основная
задача этой системы –
отделение пользовательского представления
базы данных от ее физической реализации.
Рис.1.2.
Архитектура ANSI/SPARC
Внутренний
уровень
–
это
уровень, наиболее близкий к физическому
хранению, т.е. связанный со способами
хранения информации на физических
устройствах.
Внутреннее
представление состоит из многих
экземпляров каждого типа внутренней
записи (терминология ANSI/SPARC).
Внутреннее представление не рассматривает
физические области устройства хранения,
такие, как цилиндры, дорожки и т.д. Оно
предполагает, что адресное пространство
имеет линейную структуру и оно бесконечно.
Внутреннее представление описывается
с помощью внутренней схемы. Внутренняя
схема пишется с использованием внутреннего
языка определения данных. Она определяет
способы представления хранимых полей
и записей; физическую последовательность
хранимых записей; существующие индексы
и т.д.
Внешний
уровень
наиболее близок к пользователю, точнее,
это индивидуальный уровень пользователя.
Пользователем может быть прикладной
программист, конечный пользователь или
администратор БД.
У
каждого пользователя есть свой язык
общения. Как правило, такие языки общения
включают в себя подъязыки данных.
Существующий
язык SQL
практически поддерживается всеми
системами БД. Его используют как
самостоятельный язык запросов и как
встроенный в другие языки программирования.
В
соответствии с терминологией ANSI/SPARC
, представление отдельного пользователя
называется внешним представлением.
Внешнее
представление
–
это содержимое БД, каким видит его
пользователь (т.е. для этого пользователя
внешнее представление и его БД). Например,
пользователь из отдела кадров может
рассматривать БД как набор записей с
информацией об отделах плюс набор
записей с информацией о служащих и
ничего не знать о записях с информацией
о деталях и поставщиках, с которыми
работает пользователь в отделе
обеспечения.
В
общем, внешнее представление состоит
из множества экземпляров каждого типа
внешней записи, которые, в свою очередь,
не обязательно должны совпадать с
хранимыми записями. В распоряжении
пользователя имеется язык определения
данных и язык обработки данных (составные
части любого подъязыка данных).
Операция
выборки данных с их использованием
будет осуществлять выборку из экземпляров
внешних, а не хранимых записей.
Концептуальное
представление
–
это представление данных такими, какие
«они есть на самом деле», а не такими,
какими их вынужден видеть пользователь
в рамках определенного языка или
используемого аппарата обеспечения.
Концептуальное
представление –
это представление всего содержимого
базы данных.
Оно
определяется с помощью концептуальной
схемы. Концептуальная схема использует
концептуальный
язык определения данных.
Определения концептуального языка
должны относиться только к содержанию
информации. В него нельзя включать
любое рассмотрение структуры хранения,
методы доступа, последовательности
хранимых записей, способов индексирования,
хеш-адресации и т.д.
Концептуальную
схему, как правило, определяет администратор
данных. Она определяет объекты, в которых
заинтересовано предприятие, а также
информацию, которую необходимо записывать
в этих объектах.
Соседние файлы в папке bd
- #
- #
- #
- #
Система управления базами данных — программное обеспечение, с помощью которого пользователи могут определять, создавать и поддерживать базу данных, а также осуществлять к ней контролируемый доступ.
Альтернативное определение:
Система управления базами данных — специализированная программа (чаще комплекс программ), предназначенная для организации и ведения базы данных.
Основные программные компоненты среды СУБД
Аппаратное обеспечение
В зависимости от требований поставленной задачи, конкретной СУБД и ОС аппаратные средства могут варьироваться от одного ПК или мейнфрейма до сети многих компьютеров. СУБД требует определенной минимальной конфигурации аппаратных средств, но для приемлемой производительности системы этого может не хватить.
Программное обеспечение
Включает в себя ПО:
- самой СУБД
- прикладных программ
- ОС
- сетевое
Приложения в основном создаются на языках 3-го (C, Fortran, Pascal и т.д.) и 4-го уровней (SQL и т.д.), операторы которых внедряются в программы на языках 3-го уровня. Языки 4-го уровня могут увеличить производительность системы и удобство для обслуживания программ. СУБД состоит из нескольких программных компонентов (модулей), выполняющих специфические операции. ОС предоставляет базовые службы, а СУБД представляет собой надстройку над ними.
Основные программные компоненты среды СУБД :
- процессор запросов: преобразует запросы в последовательность низкоуровневых инструкций для контроллера базы данных.
- контроллер базы данных: взаимодействует с запущенными пользователями прикладными программами и запросами (принимает запросы; проверяет внешние и концептуальные схемы для определения концептуальных записей, удовлетворяющих требованиям запроса; затем вызывает контроллер файлов для выполнения поступившего запроса).
- контроллер файлов: манипулирует предназначенными для хранения данных файлами и отвечает за распределение доступного дискового пространства; создает и поддерживает список структур и индексов, определенных во внутренней схеме (в случае использования хешированных файлов, вызывает функцию хеширования для генерации адресов и записей); не управляет физическим вводом и выводом, лишь передает команды соответствующим методам доступа, которые считывают данные в системные буферы или записывают их оттуда на диск.
- препроцессор языка DML: преобразует внедренные в прикладные программы DML-операторы в вызовы стандартных функций базового языка (для генерации соответствующего кода препроцессор языка DML должен взаимодействовать с процессором запросов).
- компилятор языка DDL: преобразует DDL-команды в набор таблиц, содержащих метаданные, после чего таблицы сохраняются в системном каталоге, а управляющая информация — в заголовках файлов с данными.
- контроллер словаря: управляет доступом к системному каталогу и обеспечивает работу с ним (системный каталог доступен большинству компонентов СУБД).
Базы данных (БД) — это организованный набор фактов в определенной предметной области. БД — это информация, упорядоченная в виде набора элементов, записей одинаковой структуры. Для обработки записей используются специальные программы, позволяющие их упорядочить, делать выборки по указанному правилу. Базы данных относятся к компьютерной технологии хранения, поиска и сортировки информации.
БД — это совокупность взаимосвязанных данных при предельно малой избыточности, допускающей их оптимальное использование в определённых областях человеческой деятельности. БД, в зависимости от способа представления данных и отношений между ними, могут иметь реляционную (таблицы связаны между собой), сетевую или иерархическую структуры. На эффективность БД с той или иной структурой влияют условия её применения. Данные в БД организованы, как правило, в виде таблиц. Табличный способ отображения информации широко используется в документах и отчётах, поскольку он удобен и позволяет наглядно представлять различного рода данные.
Пример простейшей базы данных в виде таблицы
В БД может храниться миллионы записей. В любое время можно найти запись, которая необходима в данный момент. Результатом поиска информации в приведенной БД могут быть названия, суммы, количество, даты. В базах данных можно проводить сортировку информации и вывод её на печать, удаление старой и вставка новой информации, просматривать БД целиком или по частям. С числами в таблицах можно проводить обычные математические операции. Фамилии людей и названия предметов можно упорядочить по алфавиту.
Программное обеспечение для управления и поддержки работоспособности БД называют системой управления базами данных (СУБД). СУБД осуществляют ввод, проверку, систематизацию, поиск и обработку данных, распечатку их в виде отчётов.
Среди множества СУБД наиболее часто используются пакеты программ dBASE разных версий, FoxBase +, FoxPro, Fox Soft Ware, Clipper, совместимые с dBASE по системе команд и файлам.
Например, БД, созданная в одной СУБД, может использоваться в другой совместимой с ней СУБД, имеющей формат файлов dBASE (*.dbf). Однако есть иные СУБД, например PARADOX и RBase, несовместимые с dBASE. Кроме СУБД для DOS, существуют СУБД, работающие в среде Windows, например Access, MS Works и др.
В основе БД лежит представление данных в виде таблиц. Основными понятиями в СУБД являются поля и записи. В полях содержатся данные. Поле характеризуется длиной. Совокупность всех полей в строке называется записью.
Структуру простейшей базы данных можно рассматривать как прямоугольную таблицу, состоящую из вертикальных столбцов и горизонтальных строк. Вертикальные столбцы принято называть полями, а горизонтальные строки — записями. Единицей хранимой информации является горизонтальная строка-запись, которая хранит информацию, например, об одном сотруднике фирмы. Каждая запись представляет собой совокупность полей.
Типы данных
В СУБД можно обрабатывать следующие типы данных:
- Символьный (Character).
- Числовой (Numeric).
- Дата календарная (Date).
- Логический (Logical).
- имя поля
- тип поля
- длина поля
- количество десятичных знаков
- СУБД поддерживает пять типов полей:
Данные символьного типа — это любая последовательность символов длиной не более 254.
Числовые данные делятся на 2 вида: целые и вещественные. Длина числового поля должна быть достаточной, чтобы поместились знак числа, целая часть, точка (десятичная) и дробная часть.
Значения календарной даты по умолчанию отображаются в Американском формате ММ/ЧЧ/ГГ (ММ-месяц, ЧЧ-число, ГГ-год). Длина этого поля установлена автоматически и равна 8.
Данные логического типа имеют значения ДА (YES) и НЕТ (NO).
В математической логике они называются Истина (True) и Ложь (False). В логических полях БД используются только первые буквы латинских слов Y,T,N,F. Длина логического поля равна 1.
В поле примечаний отмечается признак, который указывает, что к записи прилагается дополнительный фрагмент текста.
Структура базы данных
Структуру простейшей базы данных можно рассматривать как прямоугольную таблицу, состоящую из вертикальных столбцов и горизонтальных строк. Вертикальные столбцы принято называть полями, а горизонтальные строки — записями. Единицей хранимой информации является горизонтальная строка-запись, которая хранит информацию, например, об одном ученике в классе в журнале. Каждая запись представляет собой совокупность полей.
Каждое поле БД характеризуется рядом параметров.
СИМВОЛЬНЫЙ — поля этого типа предназначены для хранения в них информации, которая рассматривается как строка символов и может состоять из букв, цифр, знаков препинания и т.п.
ЧИСЛОВОЙ — поля этого типа предназначены только для хранения чисел.
ДАТА — поля этого типа предназначены для хранения каких-либо дат в фиксированном формате: число, месяц, год.
ЛОГИЧЕСКИЙ — поля этого типа предназначены для хранения альтернативных значений вида «ДА» — «НЕТ» или «ПРАВДА» — «ЛОЖЬ». При этом значению «ДА» соответствует нахождение в поле символа «Т», а значение «НЕТ» — символа «F».
ПРИМЕЧАНИЕ (Memo) — поля этого типа используются для хранения фрагментов текста (примечаний).
Длина поля — это ширина вертикального столбца таблицы в символах.
Длина полей СИМВОЛЬНОГО типа представляют собой количество символов, которое Вы хотите уместить в поле.
Длина поля ЧИСЛОВОГО типа равна количеству десятичных разрядов числа, умещающегося в поле, включая знак числа, десятичную точку, целую и дробную часть. Например, если Вы описываете значение «-546.78», то длина равна 7.
Длина ЛОГИЧЕСКОГО поля всегда равна 1, так как его значение «T» или «F».
Количество десятичных знаков — это количество разрядов после десятичной точки. Данная характеристика имеет значение только для полей числового типа. Для всех остальных она равна нулю. Количество десятичных знаков не должно превосходить величины, на 2 меньшей, чем длина соответствующего числового поля. Это автоматически контролируется системой.
Чтобы описать структуру базы данных необходимо последовательно от поля к полю задать все вышеописанные их характеристики. Вы как бы разлиновываете таблицу, определяете ширину граф и их заголовки. При анализе возможной структуры базы Вам необходимо серьезно отнестись к вопросу распределения информации по полям и определения типов этих полей.
4.Функции СУБД.
Данная функция предоставляет пользователям возможности выполнения самых основных операций, которые осуществляются с данными — это сохранение, извлечение и обновление информации. Она включает в себя обеспечение необходимых структур внешней памяти как для хранения данных, непосредственно входящих в БД, так и для служебных целей, например, для ускорения доступа к данным. В некоторых реализациях СУБД активно используются возможности существующих файловых систем, в других работа производится вплоть до уровня устройств внешней памяти
Типовая организация современной СУБД
СУБД состоит из нескольких программных компонентов, каждый из которых нацелен на выполнение специфической операции.
Логически в современной реляционной СУБД можно выделить внутреннюю часть — ядро СУБД, компилятор языка БД (обычно SQL), подсистему поддержки времени выполнения, набор утилит.
Ядро СУБД отвечает за управление данными во внешней памяти, управление буферами оперативной памяти, управление транзакциями и журнализацию.
Ядро СУБД обладает собственным интерфейсом, не доступным пользователям напрямую и используемым в программах, производимых компилятором SQL и утилитах БД.
Ядро СУБД является основной резидентной частью СУБД. При использовании архитектуры «клиент-сервер» ядро является основной составляющей серверной части системы.
Обобщенная компонентная струк¬тура СУБД:
- контроль прав доступа проверяет наличие у данного пользо¬вателя полномочий для выполнения затребованной операции;
- процессор команд получает управление после проверки полномочий пользователя для выпол¬нения затребованной операции;
- средства контроля целостности осуществляют в случае выполнения операций, которые изменяют содержимое базы данных, про¬верку того, удовлетворяет ли затребованная операция всем установленным ограничениям поддержки целостности данных;
- оптимизатор запросов определяет оптимальную стратегию выполнения запроса;
- контроллер транзакций осуществляет требуемую обработку операций, поступающих в процессе выполнения транзакций;
- планировщик отвечает за бесконфликтное выполнение па¬раллельных операций с базой данных и управляет относительным по¬рядком выполнения операций, затребованных в отдельных транзакциях;
- контроллер восстановления гарантирует восстановление ба¬зы данных до непротиворечивого состояния при возникновении сбоев;
- контроллер буфера отвечает за перенос данных между опера¬тивной памятью и же¬стким диском.
На главную
1. Организация баз данных и знаний Лекция 1
Введение в Базы Данных.
СУБД
2. Структура курса
2
3. Расписание занятий
3
4. Содержание курса: Теоретическая часть
Содержание курса:
Теоретическая часть
Введение в базы данных.
Понятие СУБД.
Проектирование БД.
Модели данных.
Реляционная модель данных.
Теория нормальных форм.
Реляционная алгебра.
Язык SQL.
СУБД MySQL.
4
5. Содержание курса: Практическая часть:
Содержание курса:
Практическая часть:
Модуль 1 – Лабораторные занятия:
Проектирование баз данных.
Работа с логической структурой данных.
Построение реляционных баз данных.
Модуль 2 – Лабораторные занятия:
Изучение основ работы с СУБД MySQL
Индивидуальное задание на проектирование
базы данных.
5
6. Работа с курсом
Лекции – презентации
Практика – занятие в аудитории
Модуль 1 – доска и мел
Модуль 2 – компьютерный класс
6
7. Контроль и оценка успеваемости
Контроль и оценка успеваемости
Межсессионный теоретический контроль:
Межсессионный практический контроль:
Модуль 1 – выполнение индивидуального задания на
проектирование БД
Модуль 2 – создание и заполнение реляционной БД в
СУБД MySQL
Сессионный контроль:
Модульная контрольная работа 1 — тест
Модульная контрольная работа 2 – тест
Экзамен – в конце семестра
Оценка «автоматом»
средний бал по всем пунктам.
7
8. Тест
8
9. Просмотр текущей успеваемости
9
10. Итоговая оценка успеваемости
10
11. Определение Базы Данных
БД это…
«Набор связных данных»!
11
11
12. Предпосылки возникновения БД
Ввод данных
Обработка запросов
Хранение и извлечение информации
Сортировка
12
13. Картотека
Картотека (др.-греч.
χάρτης «лист
папируса» и θήκη
«место хранения») —
упорядоченное
собрание данных,
как правило на
карточках малого
формата.
Представляет собой
каталог.
13
14. Картотека
Каждая карта является информационной
единицей и предоставляет сведения о
каком-либо хранимом объекте, с целью
облегчения поиска этого объекта по
определённым признакам.
Упорядочение осуществляется
обязательно по логическим критериям,
по алфавиту, дате и т. д.
Примеры:
Картотека пациентов в поликлинике
Каталог библиотеки
14
15. Картотека
Картотека, как правило, состоит из
единственного собрания «однородных»
логически связанных данных, является
аналогом таблицы базы данных.
Особенности:
хранение всех данных в одном месте:
для поиска требуемой информации
необходимо просмотреть всю картотеку;
хранение данных с использованием
индексирования.
15
16. Предшественники баз данных.
Основные направления применения
компьютерной техники:
1.
Численные расчеты.
Исторически оно появилось раньше и
способствовало развитию методов численного
решения сложных математических задач,
развитию языков программирования,
ориентированных на решение вычислительных
задач.
2.
Хранение и обработка данных.
Целью любой информационной системы
является хранение и обработка данных о
каких-либо объектах реального мира.
16
17. Информация и данные
Информация представляет собой сведения об
окружающих человека предметах, явлениях и
процессах и является объектом таких операций
как восприятие, передача, преобразование,
хранение и использование.
Когда используется термин «данные», то речь
идет об информации, представленной в
формализованном виде, пригодной для
автоматической обработки при возможном
участии человека.
17
18. Файловые системы
Файл – это неструктурированный объем
информации.
Файловая система — набор программ,
которые выполняют для пользователей
некоторые операции, каждая программа
определяет свои собственные данные и
управляет ими.
Операции над файлами:
удаление, создание файла или каталога,
переименование, открытие, закрытие,
чтение из файла, поиск, …
18
19. Файловые системы
Метод доступа к информации:
различные алгоритмы доступа, которые
зависят от внутренней организации файла
Например:
Файл с данными о заказчиках
Файл с данными о студентах
Метод доступа:
множество операций над множествами
студентов или заказчиков.
19
20. Файловые системы
Архитектура 70-х годов.
Каждый отдел работает со своими данными с
помощью своего специализированного
приложения, которое в коде жестко определяет
физическую структуру и методы хранение
записей в файле.
Компьютер отдела N
Ввод данных
Программа
обработки файла
Выдача отчетов
0выип
Определение
файлов
Прикладные программы
Файлы Отдела N
20
21. Файловые системы
Компьютер отдела
Продаж
Компьютер отдела
Делопроизводства
и бухгалтерии
Ввод данных
Программа
обработки файла
Выдача отчетов
Определение
0выип
файлов
Прикладные программы
Ввод данных
Программа
обработки файла
Выдача отчетов
Определение
0выип
файлов
Прикладные программы
Файлы Отдела
Продаж
Файлы Отдела
Делопроизводства
и бухгалтерии 21
22. Недостатки (ограничения) файловых систем :
разделение и изоляция данных:
сложность доступа к данным в
изолированном файле, возрастающая
при увеличении количества файлов,
требуемых для получения необходимой
информации.
дублирование данных:
неэкономичное расходование ресурсов,
возможность нарушения целостности
(появление противоречивых данных).
22
23. Недостатки (ограничения) файловых систем :
зависимость от данных (и программ):
сложность изменения структуры данных,
новый вид данных – новая программа.
Приложение — единственный способ
доступа к данным.
несовместимость файлов:
вследствие различий языков
программирования, использованных при
создании приложения.
добавление новой информации
фиксированные запросы/быстрое
увеличение количества приложений.
23
24. Недостатки файловых систем
целостность хранимой информации
данные не защищены от неправильной
интерпретации при выводе;
вся ли необходимая информация об
объекте хранится?
совместный доступ к данным
параллельное выполнение программ на
том же самом файле
безопасность данных
Трудности с организацией безопасности
файлов
24
25. Параллельное выполнение программ
Какое конечное значение будет у переменной AC?
Program1
AC=AC-50
AC
#103 450
Program2
AC=AC-100
25
26. Проблемы безопасности
Разрешить доступ к файлам только
уполномоченному персоналу
Возможность ограничить доступ к
частям файлов
Возможность управления использования
одних и тех же данных разными
пользователями
Защита от несанкционированного
использования
Защита от несанкционированного
вывода информации
26
27. Пример использования файлов для хранения данных
Допустим, что мы строим
информационную систему, в которой
нам необходимо хранить информацию о:
студентах
предметах
преподавателях
и о том, кто что преподает и кто чему учится
27
28. Можно ли это реализовать в файлах ?
Попробуем сохранить наши данные в
файлах:
students.txt
courses.txt
professors.txt
Попробуем описать на языке
программирования задачи работы с
данными
28
29. Работа с данными
Добавить преподавателя “Mary Johnson”
в курс “CSE444”:
Write a C/Java program to do the following:
Read ‘students.txt’
Read ‘courses.txt’
Find&update the record “Mary Johnson”
Find&update the record “CSE444”
Write “students.txt”
Write “courses.txt”
29
30. Проблемы…
Системная ошибка:
Read ‘students.txt’
Read ‘courses.txt’
Find&update the record “Mary Johnson”
Find&update the record “CSE444”
Write “students.txt”
Write “courses.txt”
В чем дело?
Большой объем данных (более 50GB)
ОШИБКА !
Проблема с открытием такого файла.
Одновременный доступ большим числом
пользователей
Файл students.txt – заблокирован для записи30
31. Необходимо трансформировать архитектуру
Система “client-server” — СУБД
подключение
Файлы
с
Database server
СУБД (еще одна
программа)
Приложения31
32. Новая архитектура
Клиенты
Лондонское
отделение
Западное
отделение
Северное
отделение
Восточное
отделение
Сервер базы данных
Южное
отделение
Клиенты
Клиенты
База данных
Клиенты
32
33. БД – База Данных
Совместно используемый набор
логически связанных данных (и их
описание! — Метаданные),
предназначенных для удовлетворения
информационных потребностей
организации
База данных представляет
собой большой, структурированный
набор данных
База данных содержит модель чегонибудь из реального мира
33
34. Что такое База Данных?
“Набор информации, хранящейся в
компьютере”
Oxford English Dictionary
“Один или
несколько больших структурированных
множеств постоянных данных, обычно
связанных с программным обеспечением для
обновления и запросов данных ”
Free On-Line Dictionary of Computing
“Cовокупность данных, упорядоченная для
удобства и быстроты поиска и извлечения ”
Dictionary.com
34
35. Понятие «База Данных»
База данных – это совокупность
связанных данных, организованных по
определенным правилам,
предусматривающим общие принципы
описания, хранения и манипулирования,
независимая от прикладных программ.
Отличительные признаки БД:
База данных хранится и обрабатывается в
вычислительной системе
Данные в базе данных логически
структурированы (систематизированы)
База данных включает метаданные,
описывающие логическую структуру БД
35
36. Другие варианты определения «База Данных»
1.
совместно используемый набор логически
связанных данных (и их описание!),
предназначенных для удовлетворения
информационных потребностей организации.
2.
структурированный организованный набор
данных, описывающих характеристики какихлибо физических или виртуальных систем.
3.
совместно используемый набор логически
связанных дынных (и описание этих данных),
предназначенный для удовлетворения
информационных потребностей организации.
36
37. Какие бывают Базы Данных
Библиотечные
каталоги
Медицинская
документация
Банковские счета
Складской учет
Учет персонала
Каталоги продукции
Телефонные
справочники
Расписание поездов
Заказы авиабилетов
Данные кредитных
карт
Данные о студентах
История клиентов
Цены на фондовом
рынке
Форумы
и так далее …
37
38. Классификации БД
По технологии хранения:
По содержимому:
БД во вторичной памяти (традиционные)
БД в оперативной памяти (in-memory databases)
БД в третичной памяти (tertiary databases)
Географические
Исторические
Научные
Мультимедийные
…
По степени распределенности:
Централизованные (сосредоточенные)
Распределенные
38
39. СУБД Система управления базами данных
СУБД — программное обеспечение, с
помощью которого пользователи могут
определять, создавать и поддерживать
актуальной базу данных, а также
осуществлять к ней контролируемый
доступ
или
СУБД — специализированная программа
(чаще комплекс программ),
предназначенная для организации и
ведения базы данных.
39
40. СУБД
Приложения
СУБД
Ресурсы «железа»
Абстракция данных
позволяет
данному интерфейсу
быть четко определенным,
и, соответственно,
разделять приложения
и системы
управления данными.
40
41. Основные программные компоненты среды СУБД :
Основные программные компоненты
среды СУБД :
41
42. Основные программные компоненты среды СУБД :
Основные программные компоненты
среды СУБД :
процессор запросов:
преобразует запросы в последовательность низкоуровневых
инструкций для контроллера базы данных.
контроллер базы данных:
взаимодействует с запущенными пользователями прикладными
программами и запросами (принимает запросы; проверяет
внешние и концептуальные схемы для определения
концептуальных записей, удовлетворяющих требованиям
запроса; затем вызывает контроллер файлов для выполнения
поступившего запроса).
контроллер файлов:
манипулирует предназначенными для хранения данных
файлами и отвечает за распределение доступного дискового
пространства; создает и поддерживает список структур и
индексов, определенных во внутренней схеме (в случае
использования хешированных файлов, вызывает функцию
хеширования для генерации адресов и записей); не управляет
физическим вводом и выводом, лишь передает команды
соответствующим методам доступа, которые считывают данные
в системные буферы или записывают их оттуда на диск.
42
43. Основные программные компоненты среды СУБД :
Основные программные компоненты
среды СУБД :
препроцессор языка DML:
преобразует внедренные в прикладные программы DMLоператоры в вызовы стандартных функций базового
языка (для генерации соответствующего кода
препроцессор языка DML должен взаимодействовать с
процессором запросов).
компилятор языка DDL:
преобразует DDL-команды в набор таблиц, содержащих
метаданные, после чего таблицы сохраняются в
системном каталоге, а управляющая информация — в
заголовках файлов с данными.
контроллер словаря:
управляет доступом к системному каталогу и
обеспечивает работу с ним (системный каталог доступен
большинству компонентов СУБД).
43
44. Основные программные компоненты среды СУБД :
Основные программные компоненты
среды СУБД :
44
45. Изменение архитектуры
Ранняя архитектура:
Приложение →
Файлы
С использованием СУБД:
Приложение →
Система управления БД →
База данных
45
46. Почему вам это нужно?
Базы данных — неизбежность
Базы данных — везде
Базы данных — огромный рынок
(~20 млрд USD в год)
Базы данных — основа для бизнесаналитики и анализа данных
Базы данных — это интересно!
46
47. БД – широкая область для компьютерных наук
Языки программирования и разработка
программного обеспечения
Структуры данных и алгоритмы
Логика, дискретная математика, теория
вычислений
Задачи систем:
параллелизм, операционные системы,
организация файлов, сети, распределенные
системы …
47
48. Три аспекта изучения СУБД
1.
Построение модели и проектирование
базы данных.
2.
Программирование – описание
различных запросов к базе данных и
операций над данными.
3.
Позволяет исследовать различные
проблемы до реализации.
SQL – Structured Query Language
язык структурированных запросов
Непосредственная реализация СУБД.
48
49. Уровни пользователей БД
1.
Программист системы баз данных (DBMS programmer)
2.
Конструктор баз данных (Database designer)
3.
Создание программного обеспечения, которое позволяет
пользователям взаимодействовать с системой баз данных
Администратор баз данных (Database administrator)
5.
Проектирует логическую схему базы данных
Разработчик приложений
(Database application developer)
4.
Непосредственно создает программное обеспечение
системы базы данных
Управляет системой баз данных
Конечные пользователи (End users)
Использование системы баз данных для
достижения какой-либо цели
49
50. Словарь данных — Метаданные
Словарь или каталог хранит
информацию о самой базе данных
Это данные о данных или ‘метаданные’
Почти каждый аспект СУБД использует
словарь
Словарь содержит
Описание объектов базы данных
(таблицы, пользователи, правила, виды,
индексы,…)
Информацию о доступе к данным (кто в
какой момент что использует)
Схемы и отображения
50
51. Системы Баз Данных
Система Баз Данных состоит из
Данных (Базы Данных)
Процедур по работе с данными
Программного обеспечения
Аппаратных средств
Пользователей
(мы будем подробно рассматривать в
курсе выделенное жирным)
51
52. Данные
Наиболее важный компонент СУБД для
конечных пользователей. В системном
каталоге содержатся:
имена, типы и размеры элементов данных;
имена связей;
ограничения целостности данных;
имена зарегистрированных пользователей,
которым предоставлены некоторые права
доступа к данным;
используемые индексы и структуры
хранения.
52
53. Процедуры по работе с данными
К процедурам относятся инструкции и правила, которые
должны учитываться при проектировании и
использовании базы данных.
Описание процедур — инструкции о правилах
выполнения:
регистрация в СУБД;
использование отдельного инструмента СУБД или
приложения;
запуск и остановка СУБД;
создание резервных копий СУБД;
обработка сбоев аппаратного и программного обеспечения,
включая процедуры идентификации вышедшего из строя
компонента, исправления отказавшего компонента, а также
восстановления базы данных после устранения
неисправности;
изменение структуры таблицы, реорганизация базы
данных, размещенной на нескольких дисках, способы
улучшения производительности и методы архивирования
данных на вторичных устройствах хранения.
53
54. Пользователи
Обслуживание информационных потребностей
пользователей — цель проектирования,
создания и поддерживания базы данных.
По способу использования пользователями
системы:
Рядовые пользователи, обычно не знающие о
наличии СУБД (обращающиеся к базе данных с
помощью специальных приложений, позволяющих в
максимальной степени упростить выполняемые ими
операции).
Опытные пользователи, знакомые со структурой
базы данных и возможностями СУБД (для выполнения
требуемых операций могут использовать язык
запросов высокого уровня, например SQL, и даже
способны создавать собственные прикладные
программы).
54
55. Языки по работе с данными, существующие в СУБД
Data definition language (DDL) –
Язык определения данных
описательный язык, который позволяет
администратору баз данных или
пользователю описать и именовать сущности
и атрибуты, необходимые для работы
некоторого приложения, а также связи,
имеющиеся между различными сущностями,
кроме того, указать ограничения
целостности и защиты.
определяет структуру базы данных.
Результат работы DDL-операторов — набор
таблиц, хранимых в системном каталоге.
55
56. Языки по работе с данными, существующие в СУБД
Data manipulation language (DML) –
Язык манипулирования данными
содержит набор операторов для поддержки
основных операций манипулирования
содержащимися в базе данными
позволяет выполнять операции с данными
(добавление, удаление, извлечение,
модификация)
программист, указывает на то, какие данные
ему необходимы и как их можно получить определяет все операции доступа к данным,
которые должны быть выполнены для
56
получения требуемой информации.
57. Языки по работе с данными, существующие в СУБД
Data Сontrol Language (DCL) –
Язык контроля над данными
язык баз данных для осуществления
административных функций, присваивающих
или отменяющих право (привилегию)
использовать базу данных, таблицы в базе
данных, а также выполнять те или иные
операторы.
GRANT — применяется для присвоения
привилегии;
REVOKE — применяется для отмены
привилегии.
57
58. Функции компонентов баз данных
Приложение
базы данных
Пользователь
1. Создание и обработка
форм
2. Создание и передача
запросов
3. Создание и обработка
отчетов
4. Выполнение логики
приложения
5. Управление приложением
СУБД
1. Создание базы данных
2. Создание таблиц
3. Создание поддерживающих
структур
4. Чтение данных из базы
5. Изменение данных базы
6. Поддержка структур базы
данных
7. Установка правил
8. Управление параллельной
обработкой
9. Обеспечение безопасности
10. Сохранение и извлечение
копий
База данных
1. Данные пользователя
2. Метаданные
3. Индексы и
регулярные структуры
4. Хранимые процедуры
5. Триггеры
6. Метаданные
приложения
58
59. Преимущества СУБД
1 Контроль за избыточностью данных
Традиционные файловые системы хранят одинаковые
данные в нескольких файлах. Базы данных максимально
ограничивают степень избыточности данных за счет
интеграции файлов.
Избыточность допускается при дублировании ключевых
элементов для моделирования связей
СУБД допускают дублировании данных для повышения
производительности системы.
2 Непротиворечивость данных
Устранение избыточности данных или контроль над ней
позволяет уменьшить риск возникновения противоречивых
состояний. Изменение одного значения элемента данных
требует выполнить только одну операцию обновления,
причем новое значение станет доступным сразу всем
пользователям базы данных.
Если элемент данных, с ведома системы, хранится в базе
данных в нескольких экземплярах, то система сможет
следить за тем, чтобы копии не противоречили друг другу.
59
60. Преимущества СУБД
3 Больше полезной информации при том же объеме хранимых
данных
Благодаря интеграции рабочих данных организации, на основе тех
же данных можно получать дополнительную информацию.
4 Совместное использование данных
Большее количество пользователей может работать с большим
объемом данных.
Возможность создания новых приложений на основе уже
существующей в БД информации, позволяющей добавлять в БД
только новые данные; а также возможность исключать из
функционала программы функции, реализованные в СУБД
5 Поддержка целостности данных
Целостность базы данных означает корректность и
непротиворечивость хранимых в ней данных, и, обычно,
описывается с помощью ограничений, которые не должны
нарушаться в базе данных.
Ограничения можно применять к элементам данных внутри одной
записи или к связям между записями.
Интеграция данных позволяет АБД задавать требования по
поддержке целостности данных, а СУБД применять их.
60
61. Преимущества СУБД
6 Повышенная безопасность
Без привлечения соответствующих мер безопасности
интегрированные данные становятся более уязвимыми для
несанкционированного доступа со стороны пользователей,
чем данные в файловой системе.
Интеграция позволяет АБД определить требуемую систему
безопасности базы данных, а СУБД привести ее в действие.
Система обеспечения безопасности может быть выражена в
форме имен и паролей для идентификации пользователей,
которые зарегистрированы в этой базе данных.
Доступ к данным со стороны зарегистрированного
пользователя может быть ограничен только некоторыми
операциями.
7 Применение стандартов
Интеграция позволяет АБД определять и применять
необходимые стандарты для регламентирования формата
данных при обмене ими между системами, соглашениях об
именах, формах представления документации, процедурах
обновления и правилах доступа.
61
62. Преимущества СУБД
8 Повышение эффективности с увеличением масштабов системы
9 Возможность нахождения компромисса для противоречивых
требований
Потребности одних пользователей/отделов могут противоречить
потребностям других пользователей.
АБД, может принимать решения о проектировании и способе
использования базы данных, при которых имеющиеся ресурсы
всей организации в целом будут использоваться наилучшим
образом.
Эти решения обеспечивают оптимальную производительность для
самых важных приложений, причем чаще всего за счет менее
критичных.
10 Повышение доступности данных и их готовности к работе
Данные, которые пересекают границы отделов, в результате
интеграции становятся непосредственно доступными конечным
пользователям.
Во многих СУБД предусмотрены языки запросов или инструменты
для создания отчетов, которые позволяют пользователям вводить
не предусмотренные заранее запросы и почти немедленно
получать требуемую информацию на своих терминалах, не
прибегая к помощи программиста, который для извлечения этой
информации из базы данных должен был бы создать специальное 62
программное обеспечение.
63. Преимущества СУБД
11 Улучшение показателей производительности
На базовом уровне СУБД обеспечивает все низкоуровневые
процедуры работы с файлами, которую обычно выполняют
приложения. Наличие этих процедур позволяет программисту
сконцентрироваться на разработке более специальных,
необходимых пользователям функций, не заботясь о подробностях
их воплощения на более низком уровне.
Во многих СУБД предусмотрена также среда разработки четвертого
поколения с инструментами, упрощающими создание приложений
баз данных. Результатом является повышение производительности
работы программистов и сокращение времени разработки новых
приложений (с соответствующей экономией средств).
12 Упрощение сопровождения системы за счет независимости от
данных
В файловых системах описания данных и логика доступа к данным
встроены в каждое приложение, поэтому программы становятся
зависимыми от данных.
В СУБД описания данных отделены от приложений, а потому
приложения защищены от изменений в описаниях данных. Эта
особенность называется независимостью от данных.
Наличие независимости программ от данных значительно упрощает
обслуживание и сопровождение приложений, работающих с базой
63
данных.
64. Преимущества СУБД
13 Улучшенное управление параллельной работой
В некоторых файловых системах при одновременном
доступе к одному и тому же файлу двух пользователей
может возникнуть конфликт двух запросов, результатом
которого будет потеря информации или утрата ее
целостности.
Во многих СУБД предусмотрена возможность параллельного
доступа к базе данных и гарантируется отсутствие
подобных проблем.
14 Развитые службы резервного копирования и
восстановления
Ответственность за обеспечение защиты данных от сбоев
аппаратного и программного обеспечения в файловых
системах возлагается на пользователя.
В современных СУБД предусмотрены средства снижения
вероятности потерь информации при возникновении
различных сбоев.
64
65. Недостатки СУБД
1 Сложность
Обеспечение необходимой функциональности СУБД влечет
за собой усложнение проектирования и усложнение
программного обеспечения СУБД, а также необходимость
понимания принципов работы СУБД всеми сотрудниками,
работающими с ней.
2 Размер
Сложность и широта функциональных возможностей СУБД,
превращает ее в чрезвычайно сложный программный
продукт, требующий много места на диске и нуждающийся
в большом объеме оперативной памяти для эффективной
работы.
3 Стоимость СУБД
В зависимости от имеющейся вычислительной среды и
требуемых функциональных возможностей стоимость СУБД
может изменяться в очень широких пределах. Кроме того,
сопровождение системы составляет некоторый процент от
ее общей стоимости.
65
66. Недостатки СУБД
4 Дополнительные затраты на аппаратное
обеспечение
Для удовлетворения требований,
предъявляемых СУБД и базой данных, может
понадобиться приобрести дополнительные
устройства хранения информации или более
мощный компьютер.
5 Затраты на преобразование
Стоимость подготовки персонала для работы
с новой системой, оплату услуг
специалистов, оказывающих помощь в
преобразовании и запуске новой системы.
66
67. Недостатки СУБД
6 Производительность
Обычно файловая система создается для некоторых
специализированных приложений, потому ее
производительность может быть весьма высока. А
СУБД предназначены для решения более общих задач
и обслуживания сразу нескольких приложений, что
сказывается на производительности.
7 Более серьезные последствия при выходе
системы из строя
Централизация ресурсов повышает уязвимость
системы. Выход из строя одного из ее компонентов
может привести к полному прекращению всей работы
организации.
67
68. Функции СУБД
1 Хранение, извлечение и обновление данных
СУБД должна предоставлять пользователям возможность
сохранять, извлекать и обновлять данные в базе данных
(самая фундаментальная функция СУБД).
Способ реализации этой функции в СУБД должен позволять
скрывать от конечного пользователя внутренние детали
физической реализации системы (например, файловую
организацию или используемые структуры хранения).
2 Каталог, доступный конечным пользователям
СУБД должна иметь доступный конечным пользователям
каталог, в котором хранится описание элементов данных
(системный каталог).
3 Поддержка транзакций
СУБД должна иметь механизм, который гарантирует
выполнение либо всех операций обновления данной
транзакции, либо ни одной из них
68
69. Функции СУБД
4 Службы управления параллельной работой
СУБД должна иметь механизм, который гарантирует
корректное обновление баз данных при параллельном
выполнении операций обновления многими
пользователями.
5 Службы восстановления
СУБД должна предоставлять средства восстановления базы
данных на случай какого-либо ее повреждения или
разрушения.
6 Службы контроля доступа к данным
СУБД должна иметь механизм, гарантирующий возможность
доступа к базе данных только санкционированных
пользователей.
Термин безопасность относится к защите базы данных от
преднамеренного или случайного несанкционированного
доступа. Предполагается, что СУБД обеспечивает
механизмы подобной защиты данных.
69
70. Функции СУБД
7 Поддержка обмена данными
СУБД должна обладать способностью к интеграции с
коммуникационным программным обеспечением.
Любая СУБД должна обладать способностью
интеграции с разнообразными существующими
диспетчерами обмена данными (DEM — Data Exchange
Manager).
8 Службы поддержки целостности данных
СУБД должна обладать инструментами контроля за
тем, чтобы данные и их изменения соответствовали
заданным правилам (еще один тип защиты базы
данных). Целостность базы данных означает
корректность и непротиворечивость хранимых
данных.
70
71. Функции СУБД
9 Службы поддержки независимости от данных
СУБД должна обладать инструментами поддержки
независимости программ от фактической структуры
базы данных.
10 Вспомогательные службы
СУБД должна предоставлять некоторый набор
различных вспомогательных служб, предназначенных
для оказания помощи АБД в эффективном
администрировании базы данных.
Утилиты, работающие на внешнем уровне, могут быть
созданы самим АБД, но утилиты, работающие на
внутреннем уровне системы должны быть
предоставлены разработчиком СУБД.
71
72. Некоторые современные СУБД
1.
MySQL:
2.
PostgreSQL:
3.
www.postgresql.org
Open source, powerful
Microsoft Access:
4.
www.mysql.org
Open source, quite powerful
Simple system, lots of nice GUI wrappers
Commercial systems:
Oracle (www.oracle.com)
SQL Server (www.microsoft.com/sql)
DB2 (www.ibm.com/db2)
72
73. Области применения БД: Биология
Старый способ:
«Мокрая» химия
Новый способ:
Микроматрицы ДНК
Поиск в банках данных
GenBank, Ensembl, GDB,
SwissProt, Entrez using
BLAST, FASTA, GCG, EMBOSS
73
74. Области применения БД: Астрономия
Старый способ:
Запись на время работы
телескопа
Новый способ:
Sloan Digital Sky Survey
Systematically mapping
¼ of the entire sky
12 TB to date,
15 TB final in 2007
Совместное распознавание
звезд
74
75. Области применения БД: Океанография
Старый способ:
Field work
Simplified Calculations
Новый способ:
Finite Element Analysis
In situ sensors
CODAR
75
76. Национальная служба погоды США
Сбор данных
Распространение данных
Радары погоды
Спутники
Прогнозы
Сводки
По радио: aviation, marine, military channels
FTP, HTTP, email, RSS: public
Часть глобальной сети ООН
76
77. National Weather Service: Network
77
78. НСП: Шлюз данных
models radar
bulletins
ftp
email
satellite
buoys
web form
Шлюз
Anonymous FTP
FTPMail
RSS
http web
services
(XML/SOAP)
“Family of
Services”
(Direct phone line)
Общество
78
79. Национальная служба погоды
Компьютерные модели
Содержит более 10 расчетных моделей погоды от
регионального до мирового масштаба
Хранит факсы/изображения
Хранят текстовую информацию, полученную из
расчетных моделей
Специальные данные в оригинальных форматах
Дополнительная текстовая информация
Предупреждения, прогнозы, советы, обсуждения
Более ~100 различных типов текстов
79
80. Национальная служба погоды
Данные наблюдений
Данные с радаров
Хранятся как минимум 24 часа
Собираются с самолетов, буев, кораблей,
метеозондов
Специальные форматы, преобразовываемые в XML
Multicast by connecting a router directly to NWS as well
as FTP
SL.us008001/DF.of/DC.radar/DS.p19r1/SI.kfws/sn.0114
Данные со спутников –
Cloud Water Vapor, Cloud Liquid Water, Rain Rate, Sea
Ice Concentration, Sea Ice Age, Sea Ice Edge, Soil
Moisture, Surface Wind, Water Vapor over oceans,
Surface Temperature, Snow Water Content, Cloud
Amount, and EDR Surface Type
80
81. Национальная служба погоды
81
82. Рекомендуемые источники информации по лекции
http://ru.wikipedia.org/wiki/База_данных
http://ru.wikipedia.org/wiki/Система_упр
авления_базами_данных
http://ru.wikipedia.org/wiki/Картотека
http://citforum.ru/database/osbd/contents
.shtml
82
83. Рекомендуемые источники информации по курсу
https://www.coursera.org/course/db
http://www.intuit.ru/department/database
/workwdb/
http://www.mstu.edu.ru/study/materials/
zelenkov/toc.html
http://www.intuit.ru/studies/courses?page
=1&service=0&option_id=3
83
84. Рекомендуемые источники информации по курсу
http://wiki.auditory.ru/Категория:Базы_данных
Кузин А. В., Левонисова С. В.
Базы данных. – Академия, 2008
Ульман Л.
MySQL Руководство по изучению языка. – 2004
Ульман Дж, Уидом Дж.
Введение в системы баз данных
К. Дж. Дейт
Введение в системы баз данных
С.Д. Кузнецов
Основы современных баз данных
…
84
Лекция 2 СИСТЕМА УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ
Содержание 2. 1. История развития СУБД (становление и поколения) 2. 2. Основные функции СУБД 2. 2. 1 Непосредственное управление данными во внешней памяти 2. 2. 2. Управление буферами оперативной памяти 2. 2. 3. Управление транзакциями 2. 2. 4. Журнализация 2. 2. 5. Поддержка языков БД 2. 3. Типовая организация СУБД 2. 4. Компоненты СУБД 2. 5. Архитектура многопользовательских СУБД 2. 6. Преимущества и недостатки СУБД 2. 7. Способы разработки и выполнения приложений
Определение СУБД (DBMS) – программное обеспечение, с помощью которого пользователи могут определять, создавать и поддерживать БД, а также осуществлять к ней контролируемый доступ. Фактически – прослойка между БД и пользователем (прикладной программой) для скрытия особенностей хранения и управления данными (абстрагирование).
История развития СУБД (становление и поколения) СУБД выросли из файловых систем. Примерное начало становления СУБД – 60 -е годы 20 века (нет данных о разработках других стран (СССР, Европа)): для управления данными американского проекта Apollo в начале 60 -х создано программное обеспечение GUAM, в середине 60 -х на базе GUAM создана первая коммерческая СУБД IMS (Information Management System); в середине 60 -х фирма General Electric создала систему IDS (Integrated Data Store) – сетевая СУБД (более сложные взаимосвязи, чем у иерархических СУБД, попытка создания стандарта баз данных).
Формирование стандартов БД – в 1965 на конференции CODASYL (Conference on Data System Languages) создана группа List Processing Task Force, переименованная в 1967 в DBTG (Data Base Task Group) – предложен стандарт в отчетах 1969, 1971 на сетевые. DBTG-системы + системы на основе иерархического подхода – СУБД первого поколения (будут рассмотрены при изучении иерархической и сетевой модели данных), имеют ряд недостатков: для выполнения простых запросов требуют написания достаточно сложных программ; независимость от данных реализована в минимальной степени; отсутствие теоретических основ для описания (только технические стандарты).
В 1970 опубликована работа (E. F. Codd, IBM) о реляционной модели данных, устраняющей недостатки иерархической и сетевой моделей. На базе этой модели появилось множество экспериментальных СУБД. Первые коммерческие реляционные СУБД – конец 70 -х – начало 80 -х (экспериментальная СУБД System R (IBM, Сан-Хосе, Калифорния) – создана для проверки реляционной модели, в ходе проекта создан язык SQL; СУБД DB 2 (IBM); Oracle (Oracle Corporation)). Реляционные СУБД относятся к СУБД второго поколения. Реляционная модель также имеет ряд недостатков, один из них – ограниченные возможности моделирования. Наиболее значимые работы по устранению этого недостатка реляционной модели (в области семантического моделирования данных – исследований о способах представления смыслового значения, о модели более точно описывающей реальный мир): 1976, Чен предложил модель «сущность-связь» (ER-модель) – технология проектирования баз данных (будем рассматривать); Кодд предложил расширенные версии реляционной модели (RM/T (1979) и RM/V 2 (1990)).
В 1970 опубликована работа (E. F. Codd, IBM) о реляционной модели данных, устраняющей недостатки иерархической и сетевой моделей. На базе этой модели появилось множество экспериментальных СУБД. Первые коммерческие реляционные СУБД – конец 70 -х – начало 80 -х (экспериментальная СУБД System R (IBM, Сан-Хосе, Калифорния) – создана для проверки реляционной модели, в ходе проекта создан язык SQL; СУБД DB 2 (IBM); Oracle (Oracle Corporation)). Реляционные СУБД относятся к СУБД второго поколения. Реляционная модель также имеет ряд недостатков, один из них – ограниченные возможности моделирования. Наиболее значимые работы по устранению этого недостатка реляционной модели (в области семантического моделирования данных – исследований о способах представления смыслового значения, о модели более точно описывающей реальный мир): 1976, Чен предложил модель «сущность-связь» (ER-модель) – технология проектирования баз данных (будем рассматривать); Кодд предложил расширенные версии реляционной модели (RM/T (1979) и RM/V 2 (1990)).
Основные функции СУБД Для СУБД характерно наличие следующих функций и служб (сервисов) (первые восемь — Эдгар Кодд, 1982): СУБД должна предоставлять пользователям возможность сохранять, изменять и обновлять данные в БД; СУБД должна иметь доступный конечным пользователям каталог, в котором хранится описание элементов данных; СУБД должна иметь механизм, который гарантирует выполнение либо всех операций обновления данной транзакции, либо ни одной из; СУБД должна иметь механизм, который гарантирует корректное обновление БД при параллельном выполнении операций обновления многими; СУБД должна предоставлять средства восстановления БД на случай ее повреждения или разрушения (этот вопрос связан с поддержкой транзакций);
СУБД должна иметь механизм, гарантирующий возможность доступа к БД только санкционированных пользователей; СУБД должна обладать способностью к интеграции с коммуникационным программным; СУБД должна обладать инструментами контроля за тем, чтобы данные и их изменения соответствовали заданным правилам (целостность БД); СУБД должна обладать инструментами поддержки независимости программ от фактической структуры БД; СУБД должна предоставлять некоторый набор различных вспомогательных служб (в основном для эффективного администрирования БД).
Компоненты СУБД Рис. 2. 1. Основные компоненты типичной СУБД
Компоненты типичной СУБД: процессор запросов – основной компонент СУБД – преобразует запросы в последовательность низкоуровневых инструкций для контроллера базы данных; контроллер базы данных – принимает запросы, проверяет внешние и концептуальные схемы для определения тех концептуальных записей, которые необходимы для выполнения запроса; контроллер файлов – манипулирует файлами БД (создает и поддерживает список структур и индексов, определенных во внутренней схеме, но не управляет вводом-выводом данных непосредственно, а лишь передает запросы соответствующим методам доступа, которые обмениваются данными между системными буферами и диском); препроцессор языка DML – преобразует внедренные в прикладные программы DML-операторы в вызовы стандартных функций базового языка (взаимодействуя с процессором запросов);
компилятор языка DDL – преобразует DDL-команды в набор таблиц, содержащих метаданные; контроллер словаря – управляет доступом к системному каталогу и обеспечивает работу с ним (почти все компоненты СУБД имеют доступ к системному каталогу).
компилятор языка DDL – преобразует DDL-команды в набор таблиц, содержащих метаданные; контроллер словаря – управляет доступом к системному каталогу и обеспечивает работу с ним (почти все компоненты СУБД имеют доступ к системному каталогу).
Архитектура многопользовательских СУБД Эффективность функционирования информационной системы (ИС) во многом зависит от ее архитектуры. ПБД размещается на компьютерах сотрудников подразделений, являющихся клиентами корпоративной базы данных. СУБД должна предоставлять пользователям возможность сохранять, изменять и обновлять данные в БД; Сервером определенного ресурса в компьютерной сети называется компьютер (программа), управляющий этим ресурсом, клиентом — компьютер (программа), использующий данный ресурс. Различают следующие архитектуры (по мере развития): 1) Телеобработка 2) Файловый сервер 3) Технология «клиент/сервер» .
Преимущества технологии «клиент/сервер» : более широкий доступ к существующим базам данных; повышение производительности системы (по сравнению с выше перечисленными подходами); снижение стоимости аппаратного обеспечения (серверная машина – более мощная, чем клиентские); снижение сетевого трафика (по сети идут только необходимые данные); повышается уровень непротиворечивости данных (проверка целостности данных выполняется централизованно на сервере, а не у клиентов). Расширение двухуровневой технологии «клиент/сервер» переход к трехуровневой структуре (эффективна в Internet): тонкий (неинтеллектуальный) клиент – управление только пользовательским интерфейсом (например, web browser); средний уровень (клиент) – управление логикой пользовательского приложения; сервер базы данных.
Преимущества СУБД: контроль за избыточностью данных; непротиворечивость данных; больше полезной информации при том же объеме хранимых данных в БД хранится вся информация; совместное использование данных; поддержка целостности данных; повышенная безопасность; применение стандартов; повышение эффективности с ростом масштабов системы; возможность нахождения компромисса для противоречивых требований; повышение доступности данных и их готовности к работе; улучшение показателей производительности; упрощение сопровождения системы за счет независимости от данных; улучшенное управление параллельностью; развитые службы резервного копирования и восстановления.
Недостатки СУБД: сложность и размер; стоимость СУБД и дополнительные затраты на аппаратное обеспечение; затраты на преобразование; производительность; серьезные последствия при выходе системы из строя.