
Гадасин_Д_В_Методические_указания_по_выполнению_практических_занятия
.pdfкортежей каждой, а 250 кортежей S с неизвестными значениями того же общего атрибута b
разделены на 13 – 3 = 10 групп содержит в среднем по 250 / 10 = 25 кортежей.
2.Значения 0 и 1 упоминаются в обеих гистограммах – это позволят утверждать,
что 150 кортежей R, удовлетворяющие условию b=0, подлежат соединению со 100
кортежами S, обладающими тем же значением атрибута b, с образованием 150 * 100 = 15000
соединенных кортежей. Аналогичным образом должны быть соединены 200 кортежей R с b=1 и 80 кортежей S с тем же значением b=1, что даст в итоге еще 200 * 80 = 16000 кортежей.
3.Оценка степени влияния, оказываемого прочими кортежами, на общий результат не столь тривиальна. Считаем, что каждое значение, присутствующее в отношении с меньшим множеством различных значений (в данном случае – S), должно наличествовать и во множестве значений другого отношения – операнда.
4.Одним из 11 оставшихся значений S является заведомо известное значение 2,
поэтому есть основание считать, что 2 присутствует и в R. Таким образом, в итоговое отношение, как можно ожидать, будут включены дополнительно 70 * 50 = 3500 кортежей со значением 2 атрибута b и 100 * 25 = 2500 кортежей с компонентами b, равными 5.
5. Наконец, следует учесть вероятность одновременного наличия в обоих отношениях 9 других значений – допустим, что каждое из них присутствует в 50 кортежах
R и 25 кортежах S и поэтому вносит в итоговое отношение 50 * 25 = 1250 кортежей.
6.Общая оценка размера результата соединения составляет
15000 + 16000 + 3500 + 250 + 9 * 1250 = 48250 кортежей.
7.В том случае, если был бы применен более простой метод прогнозирования,
основанный на предположении о равенстве количеств экземпляров каждого значения в каждом отношении, в качестве оценки того же параметра была бы получена величина
1000*500/14 ≈ 35714 кортежей.
41
Список источников
1.Б. Новиков, Е. Горшкова, Н. Графеева Основы технологий баз данных: учебное пособие. - Второе изд. - Москва: ДМК, 2016.
2.Бэрон Шварц, Вадим Ткаченко, Петр Зайцев MySQL по максимуму. - Третье изд.
- СПб: Питер, 2012.
42