ТСХА_ Лекц_2_R__2018_испр
.pdfИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЭКОЛОГИИ, АГРОХИМИИ И ПОЧВОВЕДЕНИИ
Лекция 2
2018
Основы работы в программной среде
R
1.Общие сведения о программной среде R
2.R как калькулятор
3.Создание векторов
4.Операции с векторами
5.Простейшие графики
6.Проверка и задание рабочей директории
7.Фреймы (таблицы данных), создать фрейм,
загрузить из файла и сохранить в файл
2
R – это язык программирования для анализа данных, и в то же время – это свободная программная среда с открытым
исходным кодом, развиваемая в рамках проекта GNU («GNU is Not Unix»).
The GNU Project— проект по разработке свободного программного обеспечения - был запущен известным программистом Ричардом Столлманом 27 сентября 1983 года в Массачусетском технологическом институте.
Целью проекта было разработать достаточно свободного программного обеспечения «чтобы можно было обойтись без программного обеспечения, которое не является свободным».
3
В августе 1993 г. двое молодых новозеландских ученых анонсировали свою новую разработку, которую они назвали R. По замыслу создателей, Роберта Джентльмена и Росса Ихака, она должна была стать новой реализацией языка S, отличающейся от коммерческой S-PLUS некоторыми деталями, например, обращением с глобальными и локальными переменными, а также работой с памятью. Фактически, они создали не полный аналог S-PLUS, а новую «ветку» на «дереве S».
Язык S возник ещё в 1976 году в компании Bell Labs, и был назван, естественно, «по мотивам» языка С.
4
Преимущества R
Удобное средство для пакетного анализа данных
Возможность построения красивых графиков
Полностью бесплатный и быстрый для изучения язык
Существует очень много ориентированных на биологию, почвоведение и экологию специализированных пакетов
Наличие поддержки:
форумы: Stackoverflow, R mailing list, …
докуметация (http://www.r-project.org, help(...))
5
Microsoft office – WYSIWYG
Latex, Markdown* (R) - WYSIWYM
WYSIWYG от англ. What |
WYSIWYM от англ. What |
|
You See Is What You Get |
You See Is What You Mean |
|
(«что видишь, то и |
(“что ты видишь, есть то, что |
|
получишь») — свойство |
ты имеешь в виду”). Поль- |
|
прикладных программ или |
зователь задаёт только |
|
веб-интерфейсов, в которых |
логическую структуру |
|
содержание отображается в |
документа и его контент. |
|
процессе редактирования и |
Оформление документа, его |
|
выглядит максимально |
итоговый внешний вид |
|
близко похожим на |
возложено на отдельное ПО. |
|
конечную продукцию. |
Таким образом достигается |
|
|
|
полная независимость |
|
|
содержания документа от |
6 * Упрощенный язык разметки |
его формы. |
Excel
В клетках – данные, формулы, функции, графики и т.п.
Попытка свалить все в кучу приводит к хаосу.
WYSIWYM
|
ИНТЕРПРЕ- |
|
ДАННЫЕ |
||
ТАТОР (R) |
||
|
||
|
ОТОБРАЖЕНИЕ ДАННЫХ
Правило:
Каждая переменная вносится в отдельную колонку и название колонки приравнивается к имени переменной.
Достаточен самый простой формат данных - csv
7
Формат CSV
от англ. Comma-Separated Values — значения,
разделённые запятыми) — текстовый формат,
предназначенный для представления табличных данных.
Каждая строка файла — это одна строка таблицы.
Для R – разделитель по умолчанию– точка с запятой
8
9
10