Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Проект по описательной статистике (окончательный).docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
99.38 Кб
Скачать

«Лучшее»

После этапа сбора данных было получено 2 дискретных вариационных ряда: количество комментариев под темами, имеющими вопросительные и утвердительные заголовками.

Количество комментариев под темами с заголовком-утверждением:

2977, 1953, 1812, 1663, 1452, 1411, 1314, 1218, 1169, 1144, 1119, 1076, 1075, 1047, 1033, 1032, 1031, 885, 696, 605, 591, 529, 517, 492, 482, 388, 375, 236, 232, 202

Количество комментариев под темами с заголовком-вопросом:

1575, 1574, 1382, 1315, 1080, 1077, 965, 874, 868, 815, 807, 767, 717, 683, 667, 652, 640, 613, 541, 529, 523, 516, 495, 398, 398, 369, 357, 323, 306, 43

Далее необходимо двум полученным дискретным рядам придать вид интервалов. Для этого проведём следующие действия:

  1. Сначала необходимо определить количество интервалов по формуле Стерджеса (k = 1 + 3,322 * lgn)

k = 1 + 3,322 * lg30 = 1 + 3,322 * 1,48 = 6 (интервалов)

  1. Далее, высчитываем величину интервалов по формуле (h = (xmax – xmin)/k)

hу = (2977 - 202) / 6 = 462,5 (комментария) – величина одного интервала вариационного ряда комментариев с заголовком-утверждением

hв = (1575 - 43) / 6 = 255,3 (комментария) – величина одного интервала вариационного ряда комментариев с заголовком-вопросом

  1. Составить интервальные вариационные ряды (таблица 5).

Следующим этапом построим гистограммы распределения, по которым определим тип распределения (график 1). Из графического представления данных можно сделать вывод – оба ряда имеют распределение отличное от нормального. Далее найдём основные параметры вариационного ряда комментариев под темами, имеющими заголовок-утверждение:

x* = (x1+x2…xn)/n

x * =(2977 + 1953 + 1812 + 1663 + 1452 + 1411 + 1314 + 1218 + 1169 + 1144 + 1119 + 1076 + 1075 + 1047 + 1033 + 1032 + 1031 + 885 + 696 + 605 + 591 + 529 + 517 + 492 + 482 + 388 + 375 + 236 + 232 + 202) / 30 = 991,87

Mo = не имеет Me = 1032,5

Rx = xmax-xmin Rx = 2977 – 202 = 2775 (комментариям равен разброс значений вариационного ряда тем с заголовками-утверждениями)

D = -x*)2 * n

D = 349970,38 (таблица 6)

(единицам равняется средний уровень рассеивания количества комментариев относительно среднего показателя)

Vx = / x* *100

Vx = 591,58 / 991,87 * 100 = 59,64%

Так как выборка имеет распределение отличное от нормального, следовательно, граница однородности – 50%. Так как выборка имеет коэффициент вариации равный 59,64% - делаем вывод, что выборка количества комментариев под темами, имеющими заголовок-утверждение – качественно неоднородна.

Далее найдём основные параметры вариационного ряда комментариев под темами, имеющими заголовок-вопрос:

x* = (x1+x2…xn)/n

x * = (1575 + 1574 + 1382 + 1315 + 1080 + 1077 + 965 + 874 + 868 + 815 + 807 + 767 + 717 + 683 + 667 + 652 + 640 + 613 + 541 + 529 + 523 + 516 + 495 + 398 + 398 + 369 + 357 + 323 + 306 + 43) / 30 = 729,06

Mo – 398 Me = 659,5

Rx = xmax-xmin Rx = 1575 – 43 = 1532 (комментарию равен разброс значений вариационного ряда тем с заголовками-вопросами)

D = -x*)2 * n

D = 113684,58 (таблица 7)

(единицам равняется средний уровень рассеивания количества комментариев относительно среднего показателя)

Vx = / x* *100

Vx = 337,17 / 729,06 * 100 = 46,24%

Так как выборка имеет распределение отличное от нормального, следовательно, граница однородности – 50%. Так как выборка имеет коэффициент вариации равный 46,24% - делаем вывод, что выборка количества комментариев под темами, имеющими заголовок-вопрос – качественно однородна.

После вычисления основных величин вариационных рядов, необходимо провести их сравнительный анализ. Для удобства восприятия занесём данные о них в таблицу и сравним показатели.

Тип заголовка

Показатель

Заголовок-утверждение

Заголовок-вопрос

x*

991,87

729,06

Mo

-

398

Me

1032,5

659,5

Rx

2775

1532

591,58

337,17

Vx

59,64

46,24

Исходя из данных сравнительной таблицы можно сделать следующие выводы:

  1. Среднее и медианное значения комментариев больше у тем, имеющих заголовки-утверждения, нежели заголовки-вопросы.

  2. Разброс значений, а также среднее квадратическое отклонение меньше среди тем, имеющих заголовки-вопросы.

  3. Выборка значений заголовков-вопросов однородна, нежели выборка заголовков-утверждений, которая, однако, также близка к однородности.

При условном переносе данных на рекламную сферу, можно заключить: при выполнении долгосрочных задач при проведении рекламных кампаний предпочтение стоит отдать заголовкам-утверждениям. Так как разница относительно отклонения от средних значений у заголовков-утверждений и заголовков-вопросов – незначительна, в отличие от средних показателей, где разница – велика.