Добавил:
По своей натуре перфекционист. Поэтому люблю все аккуратно оформлять и упорядочивать, складывать по полочкам. Вот, не пропадать же добру, нажитому за четыре кропотливых семестра. Тут я выложил все мои ответы, курсовые, отчеты и некоторые ДЗ. Они могут вам помочь для получения зачета или сдачи экзамена. Если чего-то не нашли в папочках, то попытайте удачу в разделе НЕОТСОРТИРОВАННОЕ на моей страничке, там все 4 семестра разложены по папкам. ГРУППА КТ-43-15. Годы обучения 2015-2019. Коллекция будет пополняться. Что ж, удачки :З Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
36
Добавлен:
15.09.2017
Размер:
159.74 Кб
Скачать

МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение

высшего образования

«Чувашский государственный университет имени И.Н. Ульянова»

Факультет информатики и вычислительной техники

Кафедра компьютерных технологий

Дисциплина

«Анализ данных на языке R»

Лабораторная работа №20

Выполнили:

студенты группы КТ 43-15

Сергеев А. С. и Павлов Р. А.

Проверил:

асс. Скворцов А.В

Чебоксары,2017

1. Постановка задачи

Статистические данные, получены в результате проведения опыта , ниже приведен список наиболее популярных эпизодов сериала «Симпсоны». В таблицу включены: названия эпизодов, номер сезона, номер серии в сезоне, количество просмотров в США, общее количество просмотров, рейтинг IMDB, количество голосов на IMDB.

title

season

us_viewers_in_millions

views

imdb_

rating

imdb_

votes

year

The Call of the Simpsons

1

27.6

57.8

7.9

1638

1990

Homer's Night Out

1

30.3

50.8

7.4

1511

1990

Krusty Gets Busted

1

30.4

62.5

8.3

1716

1990

Bart Gets an "F"

2

33.6

59.5

8.2

1638

1990

Two Cars in Every Garage and Three Eyes on Every Fish

2

26.1

65.1

8.1

1457

1990

Dead Putting Society

2

25.4

50.6

8

1366

1990

One Fish, Two Fish, Blowfish, Blue Fish

2

24.2

50.2

8.8

1687

1990

Bart the Daredevil

2

26.2

57.6

8.4

1522

1990

Bart Gets Hit by a Car

2

24.8

56.4

7.8

1340

1991

Homer vs. Lisa and the 8th Commandment

2

26.2

58.2

8

1329

1991

Oh Brother, Where Art Thou?

2

26.8

47.4

8.2

1413

1991

Old Money

2

21.2

44.3

7.6

1243

1991

Lisa's Substitute

2

17.7

57.7

8.5

1684

1991

Blood Feud

2

17.3

52.8

8

1223

1991

Mr. Lisa Goes to Washington

3

20.2

52.1

7.7

1274

1991

Bart the Murderer

3

20.8

64.3

8.7

1446

1991

Like Father, Like Clown

3

20.2

45.5

7.7

1262

1991

Saturdays of Thunder

3

24.7

55.8

7.9

1194

1991

Burns Verkaufen der Kraftwerk

3

21.1

55.9

8.2

1291

1991

Radio Bart

3

24.2

58.9

8.5

1365

1992

Bart the Lover

3

20.5

53.7

8.3

1272

1992

Separate Vocations

3

23.7

61.5

8.2

1201

1992

Colonel Homer

3

25.5

46.9

7.9

1233

1992

Bart's Friend Falls in Love

3

19.5

48.1

7.8

1160

1992

Kamp Krusty

4

21.8

67.1

8.4

1414

1992

Itchy & Scratchy: The Movie

4

20.1

55.7

8.2

1293

1992

Lisa's First Word

4

28.6

62.1

8.5

1350

1992

Selma's Choice

4

24.5

56.3

8

1153

1993

Marge in Chains

4

17.3

68.6

7.7

1080

1993

Homer's Barbershop Quartet

5

19.9

58.3

8.4

1416

1993

Homer Goes to College

5

18.1

64.8

8.6

1476

1993

Marge on the Lam

5

21.7

53.4

8

1132

1993

Boy-Scoutz 'n the Hood

5

20.1

83.2

8.7

1270

1993

Homer the Vigilante

5

20.1

74.6

8.2

1202

1994

Bart Gets Famous

5

20

66.2

8.1

1123

1994

Lisa vs. Malibu Stacy

5

20.5

61.7

8.2

1187

1994

Bart Gets an Elephant

5

17

63.4

7.9

1116

1994

Lady Bouvier's Lover

5

15.1

59.5

7.5

1014

1994

Bart of Darkness

6

15.1

65.1

8.6

1330

1994

Itchy & Scratchy Land

6

14.8

72.7

8.5

1277

1994

Lisa on Ice

6

17.9

63.5

8.4

1236

1994

Fear of Flying

6

15.6

61.5

7.8

1100

1994

And Maggie Makes Three

6

17.3

63.1

8.5

1284

1995

Homie the Clown

6

17.6

73.1

8.5

1254

1995

Homer vs. Patty and Selma

6

18.9

60.5

7.9

1006

1995

Two Dozen and One Greyhounds

6

11.6

62.3

8.1

1051

1995

'Round Springfield

6

12.6

56.1

8.3

1084

1995

Lemon of Troy

6

13.1

70.6

8.6

1285

1995

По статистическим данным, полученным в результате про ведения опыта, требуется:

  1. Изучить данные: максимальное и минимальное, средний рейтинг.

  2. Изучить данные: максимальное и минимальное, среднее количество просмотров.

  3. Нахождение общего количества просмотров.

  4. Нахождение количества просмотров в Америке.

  5. Нахождение количества просмотров во всех странах, кроме Америки.

  6. Статистика просмотров с 1990 года по 1995 год.

  7. Нахождение статистики количества голосов.

  1. Изучить данные: максимальное и минимальное, средний рейтинг.

> max(serial$imdb_rating)

[1] 8.8

> min(serial$imdb_rating)

[1] 7.4

> mean(serial$imdb_rating)

[1] 8.160417

Из этого видим, что рейтинг сериала держится достаточно стабильно – средняя оценка сериала 8.1. Максимальный рейтинг равен 8.8, а минимальный – 7.4.

  1. Изучить данные: максимальное и минимальное, среднее количество просмотров.

> max(serial$views)

[1] 83.2

> min(serial$views)

[1] 44.3

> mean(serial$views)

[1] 59.52083

Отсюда следует, что среднее количество просмотров равно 59.52083 млн. . Максимальное количество просмотров равно 83,2 млн., а минимальный 44.3.

  1. Нахождение общего количества просмотров.

sum (serial$views)

> sum (serial$views)

[1] 2857

Мы нашли общее количество просмотров равно 2857 млн..

  1. Нахождение количества просмотров в Америке.

> sum (serial$us_viewers_in_millions)

[1] 1017.5

Мы нашли общее количество просмотров в Америке равно 1017.5 млн..

  1. Нахождение количества просмотров во всех странах, кроме Америки.

> sum (serial$views)-sum (serial$us_viewers_in_millions)

[1] 1839.5

Мы нашли количество просмотров во всех странах, кроме Америки, оно равно 1839.5 млн..

  1. Статистика просмотров с 1990 года по 1995 год.

> ggplot(data = serial, aes(x = year, y = views)) + geom_point()

Мы нашли статистику просмотров с 1990 года по 1995 год. И можем сделать вывод, что в 1993 году было наибольшее количество просмотров, чем в остальных годах.

  1. Нахождение статистики количества голосов.

> ggplot(serial,aes(x=year,y=imdb_votes))+

+ geom_bar(stat = "identity")

Мы нашли статистику количества голосов. И можем сделать вывод, что в 1991 году было наибольшее количество голосов, чем в остальных годах.

Соседние файлы в папке Язык R Отчет (Скворцов)