Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практические SQL запросы на выборку.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
9.64 Mб
Скачать

Использование агрегатных функций в подзапросах

Один тип функций, который автоматически может производить одиночное значение для любого числа строк, конечно же, - агрегатная функция.

Любой запрос использующий одиночную функцию агрегата без предложения GROUP BY будет выбирать одиночное значение для использования в основном предикате. Например, вы хотите увидеть все Продаж имеющие сумму приобретений выше средней на 4-е Октября ( вывод показан на Рисунок 8):

SELECT * FROM Orders WHERE amt > ( SELECT AVG (amt) FROM Orders WHERE odate = #10/04/1990# );

Номер чека

Сумма покупки

Дата покупки

Номер заказчика

Номер продавца

3002

1 900,10р.

3 октября 1990 г.

2007

1004

3005

5 160,45р.

3 октября 1990 г.

2003

1002

3006

1 098,16р.

3 октября 1990 г.

2008

1007

3009

1 713,23р.

4 октября 1990 г.

2008

1003

3008

4 723,00р.

5 октября 1990 г.

2006

1001

3010

1 309,95р.

6 октября 1990 г.

2004

1002

3011

9 891,88р.

6 октября 1990 г.

2006

1001

Рисунок 8 Выбор всех сумм со значением выше средней на 10/04/1990

Средняя сумма приобретений на 4 Октября - 1788.98 ( 1713.23 + 75.75) делится пополам, что в целом равняется = 894.49. Все строки со значением в поле amt выше этого - являются выбранными.

Имейте ввиду что сгруппированные агрегатные функции, которые являются агрегатными функциями определенными в терминах предложения GROUP BY, могут производить многочисленные значения. Они, следовательно, не позволительны в подзапросах такого характера. Даже если GROUP BY и HAVING используются таким способом, что только одна группа выводится с помощью подзапроса, команда будет отклонена в принципе. Вы должны использовать одиночную агрегатную функцию с предложением WHERE что устранит нежелательные группы. Например, следующий запрос который должен найти среднее значение комиссионных продавца в Лондоне -

SELECT AVG (comm) FROM Salespeople GROUP BY city HAVlNG city = ‘London’;

не может использоваться в подзапросе! Во всяком случае это не лучший способ формировать запрос.

SELECT AVG (comm) FROM Salespeople WHERE city = ‘London’;

Использование подзапросов которые выдают много строк с помощью оператора in

Вы можете использовать подзапросы которые производят любое число строк если вы используете специальный оператор IN (операторы BETWEEN, LIKE, и IS NULL не могут использоваться с подзапросами ). Как вы помните, IN определяет набор значений, одно из которых должно совпадать с другим термином уравнения предиката в порядке, чтобы предикат был верным. Когда вы используете IN с подзапросом, SQL просто формирует этот набор из вывода подзапроса. Мы можем, следовательно, использовать IN чтобы выполнить такой же подзапрос который не будет работать с реляционным оператором, и найти все атрибуты таблицы Продажи для продавца в Лондоне (вывод показывается в Рисунке 9):

SELECT * FROM Orders WHERE snum IN ( SELECT snum FROM Salespeople WHERE city = ‘LONDON’ );

Номер чека

Сумма покупки

Дата покупки

Номер заказчика

Номер продавца

3003

767,19р.

3 октября 1990 г.

2001

1001

3002

1 900,10р.

3 октября 1990 г.

2007

1004

3008

4 723,00р.

5 октября 1990 г.

2006

1001

3011

9 891,88р.

6 октября 1990 г.

2006

1001

Рисунок 9 Использование подзапроса с IN

В ситуации подобно этой, подзапрос - более прост для пользователя чтобы понимать его и более прост для компьютера чтобы его выполнить, чем если бы Вы использовали объединение:

SELECT onum, amt, odate, cnum, Orders.snum FROM Orders, Salespeople WHERE Orders.snum = Salespeople.snum AND Salespeople.city = ‘London’;

Номер чека

Сумма покупки

Дата покупки

Номер заказчика

Номер продавца

3003

767,19р.

3 октября 1990 г.

2001

1001

3008

4 723,00р.

5 октября 1990 г.

2006

1001

3011

9 891,88р.

6 октября 1990 г.

2006

1001

3002

1 900,10р.

3 октября 1990 г.

2007

1004

Хотя это и произведет тот же самый вывод что и в примере с подзапросом, SQL должен будет просмотреть каждую возможную комбинацию строк из двух таблиц и проверить их снова по составному предикату. Проще и эффективнее извлекать из таблицы Продавцов значения поля snum где city = ‘London’, и затем искать эти значения в таблице Продажи, как это делается в варианте с подзапросом. Внутренний запрос дает нам snums=1001 и snum=1004. Внешний запрос, затем, дает нам строки из таблицы Продажи где эти поля snum найдены.

Строго говоря, быстрее или нет работает вариант подзапроса, практически зависит от реализации - в какой программе вы это используете. Эта часть вашей программы называемой - оптимизатор, пытается найти наиболее эффективный способ выполнения ваших запросов.

Хороший оптимизатор во всяком случае преобразует вариант объединения в подзапрос, но нет достаточно простого способа для вас чтобы выяснить выполнено это или нет. Лучше сохранить ваши запросы в памяти чем полагаться полностью на оптимизатор.

Конечно вы можете также использовать оператор IN, даже когда вы уверены что подзапрос произведет одиночное значение. В любой ситуации где вы можете использовать реляционный оператор сравнения (=), вы можете использовать IN. В отличие от реляционных операторов, IN не может заставить команду потерпеть неудачу если больше чем одно значение выбрано подзапросом. Это может быть или преимуществом или недостатком. Вы не увидите непосредственно вывода из подзапросов; если вы полагаете что подзапрос собирается произвести только одно значение, а он производит различные. Вы не сможете объяснить различия в выводе основного запроса. Например, рассмотрим команду, которая похожа на предыдущую:

SELECT onum, amt, odate FROM Orders WHERE snum = ( SELECT snum FROM Orders WHERE cnum = 2001 );

Номер чека

Сумма покупки

Дата покупки

3003

767,19р.

3 октября 1990 г.

3008

4 723,00р.

5 октября 1990 г.

3011

9 891,88р.

6 октября 1990 г.

Вы можете устранить потребность в DISTINCT используя IN вместо (=), подобно этому:

SELECT onum, amt, odate FROM Orders WHERE snum IN ( SELECT snum FROM Orders WHERE cnum = 2001 );

Номер чека

Сумма покупки

Дата покупки

3003

767,19р.

3 октября 1990 г.

3008

4 723,00р.

5 октября 1990 г.

3011

9 891,88р.

6 октября 1990 г.

Что случится если есть ошибка и один из Продажи был аккредитован к различным продавцам? Версия использующая IN будет давать вам все Продаж для обоих продавцов. Нет никакого очевидного способа наблюдения за ошибкой, и поэтому сгенерированные отчеты или решения сделанные на основе этого запроса не будут содержать ошибки. Вариант использующий (=), просто потерпит неудачу.

Это, по крайней мере, позволило вам узнать что имеется такая проблема. Вы должны затем выполнять поиск неисправности, выполнив этот подзапрос отдельно и наблюдая значения которые он производит.

В принципе, если вы знаете что подзапрос должен( по логике) вывести только одно значение, вы должны использовать =. IN является подходящим, если запрос может ограниченно производить одно или более значений, независимо от того ожидаете вы их или нет. Предположим, мы хотим знать комиссионные всех продавцов обслуживающих заказчиков в Лондоне:

SELECT comm FROM Salespeople WHERE snum IN ( SELECT snum FROM Customers WHERE city = ‘London’ );

Выводимыми для этого запроса, показанного в Рисунке 10, являются значения комиссионных продавца Peel (snum = 1001), который имеет обоих заказчиков в Лондоне. Это - только для данного случая. Нет никакой причины чтобы некоторые заказчики в Лондоне не могли быть назначенными к кому-то еще. Следовательно, IN - это наиболее логичная форма чтобы использовать ее в запросе.

Комиссионные

0,12

Рисунок 10 Использование IN с подзапросом для вывода одного значения

Между прочим, префикс таблицы для поля city необязателен в предыдущем примере, несмотря на возможную неоднозначность между полями city таблицы Заказчика и таблицы Продавцов.

SQL всегда ищет первое поле в таблице обозначенной в предложении FROM текущего подзапроса. Если поле с данным именем там не найдено, проверяются внешние запросы. В вышеупомянутом примере, "city" в предложении WHERE означает что имеется ссылка к Customer.city( поле city таблицы Заказчиков). Так как таблица Заказчиков указана в предложении FROM текущего запроса, SQL предполагает что это - правильно. Это предположение может быть отменено полным именем таблицы или префиксом псевдонима, о которых мы поговорим позже когда будем говорить об соотнесенных подзапросах. Если возможен беспорядок, конечно же, лучше всего использовать префиксы.