методичка_1 / гл3
.docГлава 3
Глава 3
Компьютерное построение гистограмм.
Откройте программу Excel. Если Вы выполняли задания по информатике раньше и сохранили свой файл, загрузите его. Задание выполняйте на новом листе. Введите его название: Гистограммы. В ячейку А1 введите дату выполнения работы, в ячейку А2 – факультет и номер группы, в ячейку А3 – фамилии студентов, выполняющих работу. В конце работы в названии файла укажите группу и фамилии студентов и сохраните файл.
Теория
Пусть получена выборка: х1, х2, ..., хn, где n – объем выборки. Диапазоном данных считается область чисел между минимальным из полученных статистических данных и максимальным хMIN х хMAX. Для удобства анализа диапазон можно расширить, взяв в качестве рассматриваемых границ числа a и b, кратные 10 (или 5, или 100 и т.п.)
a
хMIN
х
хMAX
b.
Диапазон обрабатываемых статистических
данных разбивается на равные интервалы
.
Ширина интервалов
зависит от того, на какое количество
интервалов k
предполагается
разбить диапазон. Частота
mi
(частота интервала) – это число измерений,
которые попали в заданный интервал.
Чтобы получить относительную
частоту
– надо частоту разделить на объем
выборки. Чтобы получить плотность
относительных частот
– надо
относительную частоту разделить на
величину интервала.
Дополнительно.
Исследователи,
которые анализируют одни и те же данные,
вправе выбрать разные диапазоны и разные
интервалы (хотя лучше этого избежать).
При этом высоты столбцов гистограммы
будут различаться (высоты столбцов
зависят от
,
т.к. от ширины интервала зависит количество
попавших в интервал значений). Если
проводятся разные исследования одного
и того же явления, полученные данные
(выборки) могут различаться.
Как корректно сравнить эти данные?
Если объемы выборок и используемые интервалы одинаковые, то можно сравнивать гистограммы и частот, и относительных частот, и плотности относительных частот. Если объемы выборок разные, а интервалы одинаковые, то надо сравнивать гистограммы относительных частот или плотности относительных частот. Если и объемы выборок, и интервалы разные, то надо сравнивать гистограммы плотности относительных частот.
Задание 1. Данные по систолическому давлению (в мм рт.ст.) у 100 здоровых женщин в возрасте от 60 до 69 лет представлены в таблице:
|
121 |
127 |
132 |
139 |
115 |
120 |
125 |
137 |
139 |
122 |
|
152 |
126 |
133 |
111 |
122 |
123 |
135 |
137 |
139 |
150 |
|
81 |
95 |
136 |
114 |
128 |
140 |
149 |
144 |
125 |
141 |
|
101 |
101 |
129 |
138 |
132 |
145 |
105 |
107 |
130 |
136 |
|
134 |
135 |
115 |
148 |
140 |
146 |
119 |
113 |
127 |
136 |
|
142 |
137 |
111 |
151 |
143 |
116 |
121 |
123 |
127 |
106 |
|
73 |
143 |
106 |
120 |
144 |
147 |
142 |
127 |
131 |
110 |
|
159 |
133 |
109 |
130 |
154 |
148 |
116 |
139 |
118 |
124 |
|
112 |
98 |
134 |
131 |
131 |
156 |
119 |
124 |
113 |
125 |
|
113 |
102 |
139 |
141 |
140 |
112 |
128 |
126 |
118 |
134 |
Построить гистограммы частот, относительных частот и плотности относительных частот в диапазоне от 70 до 160 мм рт. ст., разбив диапазон на интервалы по 10 мм рт. ст.
Внимание. Файл с этими данными откройте в Папке ИНФОРМАТИКА. Лечебный факультет, скопируйте их в ячейки A2:J11 или набирайте сами.
Выполнение задания. Найдите минимальное и максимальное значение давления (используйте статистические функции МИН и МАКС) и проверьте, все ли значения давления лежат в диапазоне от 70 до 160 мм рт. ст. Если это не так, меняйте диапазон построения гистограммы.
В ячейке A12 наберите ‘границы интервалов, мм рт.ст.’, в ячейке В12 наберите ‘середины интервалов, мм рт. ст.’, в ячейке С12 наберите ‘интегральная гистограмма’, в ячейке D12 наберите ‘частота’, в ячейке Е12 наберите ‘относительная частота’, в ячейке F12 наберите ‘плотность относительных частот, 1/мм рт. ст.’. Таким образом, в столбце A у Вас будут границы интервалов (это промежуточная информация, и на гистограмме она не отразится), в столбце В у Вас будут середины интервалов (именно они будут отложены на гистограмме по горизонтальной оси), в столбце С у Вас будет промежуточная информация, и на гистограмме она не отразится, числа в столбцах D, Е и F будут откладываться по вертикали на гистограммах частот, относительных частот и плотности относительных частот, соответственно.
В ячейках A13:A22 задайте границы интервалов 70, 80, …, 160. В ячейках В14:В22 задайте середины интервалов 75, 85, …, 155. В ячейке С14 задайте статистическую функцию ЧАСТОТА. У этой функции два параметра: массив данных и массив интервалов. В качестве массива данных введите ячейки $А$2:$J$11, а в качестве массива интервалов – ячейку А14, в которой стоит число 80. Функция ЧАСТОТА посчитает количество (частоту встречаемости) чисел в ячейках А2:J11, которые меньше 80 (таких чисел только одно), и занесет это количество (единицу) в ячейку С14. Не забудьте зафиксировать адрес массива данных (первый параметр) с помощью знака $: $А$2:$J$11! Скопируйте функцию ЧАСТОТА из ячейки С14 в ячейки С13:С22.
Итак, в ячейке С13 стоит число 0. Это означает, что в массиве нет чисел меньших 70. В ячейке С14 стоит число 1. Это означает, что в массиве одно число меньше 80. Получается, что в интервале от 70 до 80 лежит одно число. В ячейке С15 стоит число 2. Это означает, что в массиве два числа меньше 90, и чтобы найти, сколько чисел лежит в интервале от 80 до 90, надо из содержимого ячейки С15 вычесть содержимое ячейки С14. Занесите формулу =С15-С14 в ячейку D15. Скопируйте содержимое ячейки D15 в ячейки D14:D22. В результате Вы получите таблицу, один столбец которой В14:В22 содержит середины интервалов, а второй столбец D14:D22 – частоты попадания значений массива в этот интервал. Эта таблица будет использована для построения гистограммы частот. Проверьте, в ячейке С22 должно стоять число 100 – объем выборки, а сумма значений в ячейках D14:D22 должна быть равна 100 (в ячейке ниже вычислить =СУММ(D14:D22)). Получите в ячейках Е14:Е22 и F14:F22 относительные частоты и плотность относительных частот.
Постройте гистограмму частот. Для этого из любой ячейки Excel запустите Мастер диаграмм (можно в меню Excel нажать позицию Вставка и выбрать опцию Диаграмма). В окне Мастер диаграмм (шаг 1 из 4): тип диаграммы выберите гистограмма и вид: первый из предлагаемых. В окне Мастер диаграмм (шаг 2 из 4) на вкладке Ряд в окне Подписи по Х введите столбец В14:В22 (адреса ячеек с серединами интервалов). В окне Значения введите столбец D14:D22 и нажмите Далее. В окне Мастер диаграмм (шаг 3 из 4): параметры диаграммы. Во вкладке Заголовки введите Название диаграммы: Норма, Ось Х (категорий): давление, мм рт. ст., Ось Y (значений): частота. Уберите Легенду. Полученную гистограмму надо отредактировать. Для этого «поставьте мышку» на один из столбцов в диаграмме и нажмите правую клавишу. Выберите Формат рядов данных и вкладку Параметры. В окне ширина зазора введите 0. Гистограмма готова (см. рис. 3.1).


![]()
Рис. 3.1
Постройте гистограммы относительных частот и плотности относительных частот.
Дополнительно. Чтобы область построения сделать прозрачной, надо кликнуть мышью на внутренней области диаграммы (но не на столбиках гистограммы и не рядом с осями), выбрать Формат области построения – Вид – Заливка – прозрачная.
Задание 1а. Данные по систолическому давлению (в мм рт.ст.) у 50 женщин в возрасте от 60 до 69 лет с диагнозом гипертония представлены в таблице:
|
192 |
145 |
156 |
177 |
157 |
|
185 |
149 |
153 |
182 |
162 |
|
171 |
151 |
175 |
161 |
178 |
|
119 |
152 |
196 |
165 |
163 |
|
172 |
144 |
161 |
179 |
173 |
|
186 |
173 |
162 |
172 |
194 |
|
193 |
194 |
165 |
158 |
166 |
|
126 |
137 |
176 |
148 |
159 |
|
173 |
187 |
154 |
164 |
137 |
|
187 |
175 |
164 |
169 |
171 |
Построить гистограммы частот, относительных частот и плотности относительных частот. Диапазон выберите самостоятельно, разбив его на интервалы по 10 мм рт. ст.
Внимание. (Файл с этими данными ищем в Папке ИНФОРМАТИКА и копируем их или набираем сами.)
То, что Вы получите после выполнения действий, может выглядеть, как на рис. 3.2.




Рис. 3.2
Границы столбцов расширены, чтобы надписи в ячейках читались. Формат ячеек, содержащих текст, такой: Выравнивание – по горизонтали: по центру, – по вертикали: распределенный.
На рис. 3.3 показаны все три гистограммы.
Дополнительно. По своему усмотрению Вы можете менять форматы осей, линий сетки, заливку области построения, шрифты заголовка, заливку столбцов гистограммы и т.п., вызывая различные меню с помощью левой кнопки мыши, если мышь находится на требуемых областях диаграммы.

Рис. 3.3
Задание 2а. Построить гистограммы частот, относительных частот и плотности относительных частот по данным измерений длительности интервалов RR (мс) по ЭКГ здорового человека, приведенным в таблице:
|
787 |
778 |
836 |
869 |
734 |
792 |
775 |
773 |
799 |
755 |
|
943 |
706 |
819 |
918 |
744 |
734 |
925 |
829 |
815 |
757 |
|
843 |
845 |
777 |
826 |
755 |
741 |
831 |
764 |
801 |
769 |
|
887 |
730 |
755 |
802 |
749 |
823 |
799 |
827 |
753 |
805 |
|
764 |
773 |
780 |
839 |
923 |
788 |
752 |
873 |
793 |
775 |
|
841 |
801 |
790 |
799 |
881 |
827 |
757 |
854 |
894 |
748 |
|
743 |
868 |
718 |
788 |
763 |
828 |
764 |
762 |
822 |
728 |
|
864 |
826 |
791 |
816 |
816 |
808 |
757 |
773 |
907 |
775 |
|
798 |
896 |
740 |
807 |
822 |
872 |
832 |
732 |
883 |
821 |
|
743 |
802 |
746 |
799 |
824 |
771 |
730 |
850 |
857 |
824 |
Задание 2б. Построить гистограммы частот, относительных частот и плотности относительных частот по данным измерений длительности интервалов RR (мс) по ЭКГ у пациента с диагнозом аритмия, приведенным в таблице:
|
676 |
793 |
827 |
734 |
955 |
730 |
489 |
1200 |
1016 |
1028 |
|
1051 |
1074 |
846 |
1036 |
928 |
1025 |
785 |
660 |
715 |
809 |
|
741 |
1020 |
805 |
875 |
712 |
1036 |
928 |
1025 |
812 |
946 |
|
861 |
802 |
844 |
715 |
743 |
651 |
1075 |
882 |
742 |
911 |
|
902 |
668 |
948 |
727 |
681 |
774 |
698 |
797 |
1078 |
1249 |
|
876 |
1268 |
980 |
861 |
748 |
819 |
637 |
691 |
697 |
1047 |
|
1085 |
753 |
758 |
773 |
772 |
1086 |
1376 |
1034 |
690 |
784 |
|
881 |
950 |
854 |
902 |
718 |
646 |
1156 |
1046 |
760 |
1075 |
|
843 |
844 |
681 |
743 |
1175 |
903 |
856 |
725 |
1018 |
741 |
|
1209 |
1001 |
723 |
631 |
1169 |
708 |
739 |
690 |
1219 |
985 |
Задание 2в. Построить гистограммы частот, относительных частот и плотности относительных частот по данным измерений длительности интервалов RR (мс) по ЭКГ у пациента с диагнозом экстрасистолия, приведенным в таблице:
|
720 |
724 |
720 |
420 |
1004 |
728 |
724 |
720 |
732 |
732 |
|
728 |
728 |
440 |
1044 |
752 |
748 |
740 |
744 |
740 |
748 |
|
740 |
420 |
1096 |
776 |
736 |
740 |
740 |
736 |
1080 |
724 |
|
424 |
1096 |
760 |
728 |
744 |
736 |
744 |
760 |
744 |
744 |
|
736 |
732 |
736 |
748 |
748 |
748 |
728 |
736 |
1452 |
716 |
|
736 |
732 |
748 |
736 |
736 |
736 |
736 |
724 |
744 |
744 |
|
700 |
728 |
720 |
404 |
1028 |
716 |
704 |
724 |
740 |
728 |
|
708 |
692 |
688 |
676 |
680 |
688 |
696 |
420 |
748 |
748 |
|
712 |
708 |
704 |
708 |
716 |
724 |
720 |
728 |
736 |
728 |
|
716 |
724 |
720 |
728 |
416 |
1028 |
720 |
764 |
752 |
732 |
Оценить среднее значение и среднеквадратическое отклонение для представленных данных. Построить приближенные функции распределения плотности вероятности.
Задание 3. Предположим, что данные, приведенные в заданиях 1, 2а и 2б распределены по нормальному закону. По экспериментальным данным построить функцию распределения плотности вероятности для нормального распределения и сравнить ее с гистограммой плотности относительных частот.
Внимание. Для нахождения среднего значения и среднеквадратического отклонения используйте функции СРЗНАЧ и СТАНДОТКЛОН, а для функции распределения плотности вероятности – НОРМРАСП.
При построении гистограммы плотности относительных частот используйте тип диаграммы: гистограмма, а для графика функции распределения плотности вероятности тип диаграммы: точечная.
Сначала рассчитайте функцию плотности вероятности для данных, приведенных в Задании 1. Для этого в ячейках М2 и М4 рассчитайте среднее значение и среднеквадратическое отклонение для этих данных.
