- •Python для науки о данных: перезагрузка Ремикс популярной книги Генри Гарнера "Clojure для науки о данных", 2015
- •Об авторе оригинала книги
- •Содержание
- •Предисловие автора к оригиналу книги на Clojure
- •Статистика
- •Скачивание исходного кода примеров
- •Обследование данных
- •Исправление данных
- •Описательные статистики
- •Среднее значение
- •Интерпретация математических обозначений
- •Медиана
- •Дисперсия
- •Квантили
- •Дискретизация данных
- •Гистограммы
- •Нормальное распределение
- •Центральная предельная теорема
- •Булочник господина Пуанкаре
- •Генерирование распределений
- •Асимметрия
- •Графики нормального распределения
- •Способы сопоставительной визуализации
- •Коробчатые диаграммы
- •Интегральные функции распределения
- •Важность визуализации
- •Визуализация данных об электорате
- •Обработка столбцов
- •Добавление производных столбцов
- •Сопоставительная визуализация электоральных данных
- •Визуализация электоральных данных рф
- •Сравнительная визуализация
- •Функции массы вероятности
- •Точечные графики
- •Настройка прозрачности разброса
Python для науки о данных: перезагрузка Ремикс популярной книги Генри Гарнера "Clojure для науки о данных", 2015
Статистика, большие данные и
машинное обучение
для программистов на Python
Об авторе оригинала книги
Генри Гарнер — выпускник Оксфордского университета и опытный разработчик, технический директор и инструктор.
Он начал свою карьеру на техническом поприще в крупнейшем в Великобритании операторе телекоммуникационных услуг BT, работая с традиционной инфраструктурой хранилищ данных. В составе малочисленной команды за 3 года он разработал сложные модели данных с целью извлечения ценных сведений из необработанных данных и использовал веб-приложения, чтобы представить результаты. Эти приложения были использованы внутри организации руководителями и операторами высшего звена для отслеживания работы бизнеса и производительности системы.
Затем он продолжил карьеру, уже в качестве со-основателя социально-медийного аналитического стартапа Likely. В качестве технического директора он возглавил техническое направление, приведя к внедрению событийного конвейера данных "только с добавлением", смоделированного по архитектуре Lambda. В 2011 г. он перешел на Clojure и возглавил гибридную команду, состоящую из программистов и аналитиков данных, которая разрабатывает механизмы рекомендательных систем на основе методов коллаборативной фильтрации и кластерного анализа. Он разработал учебный курс и состоял сопредседателем серии вечерних занятий, проводимых служащими Likely для профессиональных разработчиков, которые хотели изучать Clojure.
Сегодня Генри работает с развивающимися компаниями, консультируя относительно разработки и лидерского потенциала в технической области. Он регулярно выступает на семинарах и встречах разработчиков на Clojure в Лондоне и округе.
Содержание
Python для науки о данных: перезагрузка 1
Об авторе оригинала книги 2
Содержание 3
Предисловие автора к оригиналу книги на Clojure 5
1 7
Статистика 7
Скачивание исходного кода примеров 8
Обследование данных 8
Исправление данных 13
Описательные статистики 15
Среднее значение 16
Интерпретация математических обозначений 17
Медиана 18
Дисперсия 19
Квантили 21
Дискретизация данных 22
Гистограммы 23
Нормальное распределение 26
Центральная предельная теорема 27
Булочник господина Пуанкаре 30
Генерирование распределений 31
Асимметрия 33
Графики нормального распределения 34
Способы сопоставительной визуализации 37
Коробчатые диаграммы 37
Интегральные функции распределения 38
Важность визуализации 41
Визуализация данных об электорате 43
Обработка столбцов 45
Добавление производных столбцов 47
Сопоставительная визуализация электоральных данных 50
Визуализация электоральных данных РФ 52
Сравнительная визуализация 54
Функции массы вероятности 55
Точечные графики 57
Настройка прозрачности разброса 60
Резюме 62
Предисловие автора к оригиналу книги на Clojure 15
1 17
Статистика 17
Скачивание исходного кода примеров 18
Выполнение примеров 18
Скачивание данных 19
Обследование данных 19
Исправление данных 24
Описательные статистики 26
Среднее значение 27
Интерпретация математических обозначений 27
Медиана 29
Дисперсия 30
Квантили 31
Образование статистических групп 32
Гистограммы 34
Нормальное распределение 36
Центральная предельная теорема 37
Булочник господина Пуанкаре 40
Генерирование распределений 41
Асимметрия 43
Графики нормального распределения 44
Способы сопоставительной визуализации 46
Коробчатые диаграммы 46
Интегральные функции распределения 47
Важность визуализации 49
Визуализация данных об электорате 51
Добавление столбцов 54
Добавление производных столбцов 55
Сопоставительная визуализация электоральных данных 57
Визуализация данных о выборах в России 59
Сравнительная визуализация 61
Функции массы вероятности 62
Точечные графики 64
Настройка прозрачности разброса 67
Резюме 68
