Презентация "SQL Запросы в базах данных"

Подписи к слайдам:
SQL Запросы в базах данных Объединение таблиц, группировка записей Объединение таблиц (внутреннее объединение)

Синтаксис самого простого объединения следующий:

SELECT имена_столбцов_таблицы_1, имена_столбцов_таблицы_2

FROM имя_таблицы_1, имя_таблицы_2;

Например, у нас есть две таблицы:

  • в первой хранятся идентификаторы авторов и их имена (users);
  • - во второй темы, созданные авторами и их идентификаторы (topics).

Объединение таблиц (внутреннее объединение)

Необходимо создать запрос, чтобы в ответе были не идентификаторы авторов, а их имена.

Создадим простое объединение:

SELECT topic_name, name FROM topics, users

Объединение таблиц (внутреннее объединение)

Получилось не совсем то, ожидалось.

Такое объединение научно называется декартовым произведением, когда каждой строке первой таблицы ставится в соответствие каждая строка второй таблицы.

Чтобы результирующая таблица выглядела так, как нам нужно, необходимо указать условие объединения.

Мы связываем наши таблицы по идентификатору автора, это и будет нашим условием.

Т.е. мы укажем в запросе, что необходимо выводить только те строки, в которых значения поля id_author таблицы topics совпадают со значениями поля id_user таблицы users:

SELECT topic_name, name FROM topics, users

WHERE topics.id_autor=users.id_user;

Объединение таблиц (внутреннее объединение)

Т.е. мы в запросе сделали следующее условие: если в обеих таблицах есть одинаковые идентификаторы, то строки с этим идентификатором необходимо объединить в одну результирующую строку.

Объединение таблиц (внутреннее объединение)

На схеме это выглядит следующим образом:

Если в одной из объединяемых таблиц есть строка с идентификатором, которого нет в другой объединяемой таблице, то в результирующей таблице строки с таким идентификатором не будет. В нашем примере есть пользователь Oleg (id=5), но он не создавал тем, поэтому в результате запроса его нет.

При указании условия название столбца пишется после названия таблицы, в которой этот столбец находится (через точку). Это сделано во избежание путаницы, так как столбцы в разных таблицах могут иметь одинаковые названия.

Синтаксис объединения с условием:

 

SELECT имя_таблицы_1.имя_столбца1_таблицы_1,

имя_таблицы_1.имя_столбца2_таблицы_1,

имя_таблицы_2.имя_столбца1_таблицы_2,

имя_таблицы_2.имя_столбца2_таблицы_2

FROM

имя_таблицы_1, имя_таблицы_2

WHERE

имя_таблицы_1.имя_столбца_по_которому_объединяем =

имя_таблицы_2.имя_столбца_по_которому_объединяем;

Если имя столбца уникально, то название таблицы можно опустить (как мы делали в примере), но делать это не рекомендуется. Объединения дают возможность выбирать любую информацию из любых таблиц, причем объединяемых таблиц может быть и три, и четыре, условий для объединения может быть не одно. 

Объединение таблиц (внутреннее объединение)

Объединение таблиц (внешнее объединение)

Позволяет выводить все строки одной таблицы и имеющиеся связанные с ними строки из другой таблицы.

Например: нам надо вывести всех пользователей и темы, которые они создавали, если таковые имеются. Если мы воспользуемся внутренним объединением, рассмотренным выше, то получим в итоге следующее: 

То есть в результирующей таблице есть только те пользователи, которые создавали темы. А нам надо, чтобы выводились все имена.

Объединение таблиц (внешнее объединение)

Немного изменим запрос:

 

SELECT users.name, topics.topic_name

FROM users LEFT OUTER JOIN topics

ON users.id_user=topics.id_author;

И получим желаемый результат - все пользователи и темы, ими созданные. Если пользователь не создавал тему, но в соответствующем столбце стоит значение NULL. 

Объединение таблиц (внешнее объединение)

В запрос было добавлено ключевое слово - LEFT OUTER JOIN, указав тем самым, что из таблицы слева надо взять все строки, и поменяли ключевое слово WHERE на ON.

Кроме ключевого слова LEFT OUTER JOIN может быть использовано ключевое слово RIGHT OUTER JOIN. Тогда будут выбираться все строки из правой таблицы и имеющиеся связанные с ними из левой таблицы.

Если написать FULL OUTER JOIN произойдет полное внешнее объединение, которое извлечет все строки из обеих таблиц и свяжет между собой те, которые могут быть связаны.

Синтаксис для внешнего объединения следующий:

SELECT имя_таблицы_1.имя_столбца, имя_таблицы_2.имя_столбца

FROM имя_таблицы_1 ТИП ОБЪЕДИНЕНИЯ имя_таблицы_2

ON условие_объединения;

Объединение таблиц (внешнее объединение)

Поменяем в нашем запросе левостороннее объединение на правостороннее

Теперь есть все темы (все строки из правой таблицы), а пользователи только те, которые темы создавали (т.е. из левой таблицы выбираются только те строки, которые связаны с правой таблицей).

Группировка записей и функция COUNT()

Для того, чтобы посмотреть какие сообщения и в каких темах имеются воспользуемся запросом

SELECT*FROM posts;

Группировка записей и функция COUNT()

Для того, чтобы узнать сколько сообщений имеется на форуме можно воспользоваться встроенной функцией COUNT().

Эта функция подсчитывает число строк. Причем, если в качестве аргумента этой функции выступает *, то подсчитываются все строки таблицы. А если в качестве аргумента указывается имя столбца, то подсчитываются только те строки, которые имеют значение в указанном столбце. В нашем примере оба аргумента дадут одинаковый результат, т.к. все столбцы таблицы имеют тип NOT NULL.

Напишем запрос, используя в качестве аргумента столбец id_topic:

 

SELECT COUNT(id_topic) FROM posts;

Группировка записей и функция COUNT()

Получим:

Т.е., в наших темах имеется 4 сообщения

Группировка записей и функция COUNT()

Для того чтобы узнать сколько сообщений имеется в каждой теме, нужно сгруппировать наши сообщения по темам и вычислить для каждой группы количество сообщений. Для группировки в SQL используется оператор GROUP BY.

 

SELECT id_topic, COUNT(id_topic) FROM posts

GROUP BY id_topic;

Оператор GROUP BY указывает СУБД сгруппировать данные по столбцу id_topic (т.е. каждая тема - отдельная группа) и для каждой группы подсчитать количество строк: 

Для оператора GROUP BY можно задавать такие же условия, как и для оператора WHERE, только WHERE фильтрует строки, а HAVING - группы.

Группировка записей и функция COUNT()

Результат выполнения запроса:

Если бы в поле id_topic были возможны отсутствия значений, то такие строки были бы объединены в отдельную группу со значением NULL.

Группировка записей и функция COUNT()

Предположим, что нас интересуют только те группы, в которых больше двух сообщений. В обычном запросе мы указали бы условие с помощью оператора WHERE, но этот оператор умеет работать только со строками, а для групп те же функции выполняет оператор HAVING:

 

SELECT id_topic, COUNT(id_topic) FROM posts

GROUP BY id_topic

HAVING COUNT(id_topic) > 2;

Результат: