Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
diplom_Final (1).docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.3 Mб
Скачать

2.4.Анализ данных

Анализ статистики сайта проводится на основе данных о посетителях сайта, которые собираются и затем записываются в базу данных, для реализации данной задачи используется комбинированный счетчик посещений - внешняя программа плюс картинка.

Принцип работы счетчика посещений заключается в следующем: в страницы динамического сайта подгружается внешняя программа, которой передаются так называемые переменные окружения. В момент генерации страницы вызывается код внешней программы и полученная из переменных окружения информация записывается в базу данных.

В этих переменных хранится вся базовая информация о текущем посетителе сайта, в том числе:

  • IP-адрес посетителя (REMOTE_ADDR);

  • Браузер посетителя (HTTP_USER_AGENT);

  • Адрес страницы, откуда пришел посетитель (HTTP_REFERER);

  • Адрес страницы, куда пришел (REQUEST_URI);

  • Параметры вызова страницы (QUERY_STRING).

При просмотре страницы браузером срабатывает java-скрипт, который собирает дополнительную информацию (например, экранное разрешение, глубина цвета и так далее) и вызывает счетчик-картинку, который дописывает дополнительную информацию в базу данных.

Такой способ сбора статистики единственный вариант получить максимально полную информацию обо всех посетителях сайта.

2.5.Исследование информационных потоков

В ходе изучения и анализа информационных потоков и алгоритмов переработки данных в системе были рассмотрены следующие данные:

  1. Входные данные:

  • данные о местонахождении посетителя - страна, город, регион;

  • данные о "предыдущей странице" - реферер, использованные поисковые слова, каталоги и т.д.;

  • информация о сессиях - просмотренные страницы, время начала сессии, средняя продолжительность сессии и т.д.;

  • информация о компьютере - ip-адрес, браузеры, операционные системы, разрешение экрана и т.д.

  1. Выходные данные - на выходе получаем отчеты, сгруппированные по категориям:аудитория, посещаемость сайта (сводная статистика), просмотров на хост, просмотров на пользователя, время просмотра страниц, старые/новые пользователи, скорость загрузки страниц, страницы, популярные домены (варианты обращения), популярные страницы, популярные заголовки, точки входа, точки выхода, пути по сайту (глубина просмотра сайта), внутренние переходы, ссылки (реффереры), ссылающиеся домены, ссылающиеся страницы, переходы с каталогов, переходыс рейтингов, переходы с поисковых систем, история переходов, поисковые фразы, найденные страницы, партнеры, отслеживание целей (рекламные кампании), источники, фразы, список достижений целей, стоимость рекламы, система, агенты, accept-languages, операционные системы, браузеры, экранное разрешение, глубина цвета, использование Cookies, использование Java, использование JavaScript, география, IP адреса, языки, города, страны, разное, сейчас на сайте, индексация сайта, роботы, администрирование, размер базы данных, пользователи online, журналпосещений, локализация, конфигурация, настройки, управление базой данных, словари данных, отчет по почте, права доступа, гостевой вход, фильтры, обновление, регистрация.

В результате исследования информационных потоков была построена DFD модель, которая показывает, какие информационные потоки возникают при выполнении функций (см. рис 2.3, 2.4).

Рис.2.3 Декомпозиция блока сбора и анализа статистики данных.

Рис 2.4 Декомпозиция блока формирование вывод отчетов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]