Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

КП

.pdf
Скачиваний:
12
Добавлен:
15.03.2015
Размер:
749.92 Кб
Скачать

12

биоритмам

1

0,033426184

12

благодаря

1

0,033426184

12

бог

1

0,033426184

12

будет

1

0,033426184

12

буду

1

0,033426184

12

бы

1

0,033426184

12

бывало

1

0,033426184

12

была

1

0,033426184

12

вампир

1

0,033426184

12

вечера

1

0,033426184

12

вечерних

1

0,033426184

12

видеть

1

0,033426184

12

видит

1

0,033426184

12

внезапно

1

0,033426184

12

внимание

1

0,033426184

12

воздух

1

0,033426184

12

возникло

1

0,033426184

12

воле

1

0,033426184

12

волн

1

0,033426184

12

волнах

1

0,033426184

12

полоса

1

0,033426184

12

волос

1

0,033426184

12

воскресенье

1

0,033426184

12

впадает

1

0,033426184

12

время

1

0,033426184

12

отвечала

1

0,033426184

12

вспоминает

1

0,033426184

12

всяком

1

0,033426184

12

выбирали

1

0,033426184

12

выглядит

1

0,033426184

12

выйти

1

0,033426184

12

высоко

1

0,033426184

12

вышла

1

0,033426184

12

где

1

0,033426184

12

главным

1

0,033426184

12

говорил

1

0,033426184

12

голове

1

0,033426184

12

город

1

0,033426184

12

городка

1

0,033426184

12

городок

1

0,033426184

12

городскому

1

0,033426184

12

груди

1

0,033426184

12

дальше

1

0,033426184

12

двадцать

1

0,033426184

12

два-три

1

0,033426184

12

двери

1

0,033426184

12

движений

1

0,033426184

12

двух

1

0,033426184

12

девы

1

0,033426184

12

делал

1

0,033426184

12

деревья

1

0,033426184

12

десяти

1

0,033426184

12

детстве

1

0,033426184

12

дома

1

0,033426184

12

дремлет

1

0,033426184

12

других

1

0,033426184

12

дыхание

1

0,033426184

12

жара

1

0,033426184

12

желаний

1

0,033426184

12

жены

1

0,033426184

12

жизнь

1

0,033426184

12

заведений

1

0,033426184

12

заката

1

0,033426184

12

закрыто

1

0,033426184

12

заметила

1

0,033426184

12

запирали

1

0,033426184

12

заслоняли

1

0,033426184

12

затем

1

0,033426184

12

звездным

1

0,033426184

12

звуки

1

0,033426184

12

звуков

1

0,033426184

12

здешней

1

0,033426184

12

земле

1

0,033426184

12

землей

1

0,033426184

12

знакомые

1

0,033426184

12

золотом

1

0,033426184

12

из

1

0,033426184

12

изредка

1

0,033426184

12

именно

1

0,033426184

12

иногда

1

0,033426184

12

инстинкт

1

0,033426184

12

итак

1

0,033426184

12

каждую

1

0,033426184

12

казаться

1

0,033426184

12

как

1

0,033426184

12

квартала

1

0,033426184

12

кипарис

1

0,033426184

12

кипарисов

1

0,033426184

12

когда-то

1

0,033426184

12

костела

1

0,033426184

12

костюм

1

0,033426184

12

краски

1

0,033426184

12

кровь

1

0,033426184

12

собственных

1

0,033426184

12

кроссовки

1

0,033426184

12

кто-то

1

0,033426184

12

кэпшоу

1

0,033426184

12

лежал

1

0,033426184

12

лента

1

0,033426184

12

летаргию

1

0,033426184

12

летом

1

0,033426184

12

линией

1

0,033426184

12

лишь

1

0,033426184

12

лунный

1

0,033426184

12

лунным

1

0,033426184

12

луны

1

0,033426184

12

любитель

1

0,033426184

12

люди

1

0,033426184

12

лютеранского

1

0,033426184

12

лягушек

1

0,033426184

12

марии

1

0,033426184

12

машин

1

0,033426184

12

между

1

0,033426184

12

месяц

1

0,033426184

12

миль

1

0,033426184

12

миновала

1

0,033426184

12

мир

1

0,033426184

12

мира

1

0,033426184

12

многих

1

0,033426184

12

могла

1

0,033426184

12

моложе

1

0,033426184

12

мост

1

0,033426184

12

мостовой

1

0,033426184

12

мрачно

1

0,033426184

12

мрачные

1

0,033426184

12

муж

1

0,033426184

12

налево

1

0,033426184

12

направлению

1

0,033426184

12

нарушал

1

0,033426184

12

нарушают

1

0,033426184

12

нарушил

1

0,033426184

12

наслаждаться

1

0,033426184

12

наступающей

1

0,033426184

12

наступившую

1

0,033426184

12

научилась

1

0,033426184

12

началось

1

0,033426184

12

небо

1

0,033426184

12

небом

1

0,033426184

12

ней

1

0,033426184

12

неплохой

1

0,033426184

12

нет

1

0,033426184

12

никаких

1

0,033426184

12

никогда

1

0,033426184

12

никого

1

0,033426184

12

них

1

0,033426184

12

ничего

1

0,033426184

12

ночи

1

0,033426184

12

ночного

1

0,033426184

12

ночью

1

0,033426184

12

облака

1

0,033426184

12

обретала

1

0,033426184

12

оглянулась

1

0,033426184

12

огоньки

1

0,033426184

12

один

1

0,033426184

12

одиннадцать

1

0,033426184

12

одиноком

1

0,033426184

12

одиночество

1

0,033426184

12

одна

1

0,033426184

12

опасалась

1

0,033426184

12

опасения

1

0,033426184

12

оправдались

1

0,033426184

12

оправленный

1

0,033426184

12

осенней

1

0,033426184

12

остановилась

1

0,033426184

12

острые

1

0,033426184

12

отблесков

1

0,033426184

12

оушн-авеню

1

0,033426184

12

ощущение

1

0,033426184

12

пастора

1

0,033426184

12

пением

1

0,033426184

12

пену

1

0,033426184

12

первый

1

0,033426184

12

переливающийся

1

0,033426184

12

песка

1

0,033426184

12

пляж

1

0,033426184

12

пляжа

1

0,033426184

12

пляжу

1

0,033426184

12

плясали

1

0,033426184

12

побережья

1

0,033426184

12

поднималось

1

0,033426184

12

подряд

1

0,033426184

12

подсказал

1

0,033426184

12

покойный

1

0,033426184

12

полосками

1

0,033426184

12

полосы

1

0,033426184

12

последний

1

0,033426184

12

похитил

1

0,033426184

12

почувствовала

1

0,033426184

12

появиться

1

0,033426184

12

привлекала

1

0,033426184

12

приглушала

1

0,033426184

12

пробежала

1

0,033426184

12

пробежек

1

0,033426184

12

продолжала

1

0,033426184

12

прохожих

1

0,033426184

12

прошло

1

0,033426184

12

прямо

1

0,033426184

12

пустынно

1

0,033426184

12

пустынном

1

0,033426184

12

пустынный

1

0,033426184

12

путь

1

0,033426184

12

пять

1

0,033426184

12

работой

1

0,033426184

12

раза

1

0,033426184

12

раздолье

1

0,033426184

12

размеренность

1

0,033426184

12

разу

1

0,033426184

12

рака

1

0,033426184

12

расширялся

1

0,033426184

12

ричард

1

0,033426184

12

рокот

1

0,033426184

12

росший

1

0,033426184

12

сама

1

0,033426184

12

сбудется

1

0,033426184

12

свернула

1

0,033426184

12

свет

1

0,033426184

12

светилась

1

0,033426184

12

светом

1

0,033426184

12

светоотражающими

1

0,033426184

12

своей

1

0,033426184

12

свои

1

0,033426184

12

своим

1

0,033426184

12

сглаживала

1

0,033426184

12

себя

1

0,033426184

12

сентября

1

0,033426184

12

серебром

1

0,033426184

12

скалы

1

0,033426184

12

скучная

1

0,033426184

12

случае

1

0,033426184

12

случилось

1

0,033426184

12

сначала

1

0,033426184

12

со

1

0,033426184

12

собой

1

0,033426184

12

совсем

1

0,033426184

12

сосать

1

0,033426184

12

сосен

1

0,033426184

12

спадает

1

0,033426184

12

спине,

1

0,033426184

12

спортивный

1

0,033426184

12

ставку

1

0,033426184

12

стало

1

0,033426184

12

страшного

1

0,033426184

12

струящийся

1

0,033426184

12

суда

1

0,033426184

12

сумраке

1

0,033426184

12

считала

1

0,033426184

12

что

1

0,033426184

12

таверны

1

0,033426184

12

таинственные

1

0,033426184

12

так

1

0,033426184

12

твою

1

0,033426184

12

тебя

1

0,033426184

12

темнота

1

0,033426184

12

тень

1

0,033426184

12

теперь

1

0,033426184

12

тому

1

0,033426184

12

тревоги

1

0,033426184

12

тридцать

1

0,033426184

12

туристов

1

0,033426184

12

увидела

1

0,033426184

12

углы

1

0,033426184

12

уже

1

0,033426184

12

неподвижный

1

0,033426184

12

умерший

1

0,033426184

12

утром

1

0,033426184

12

фонарей

1

0,033426184

12

холмами

1

0,033426184

12

центре

1

0,033426184

12

цикад

1

0,033426184

12

час

1

0,033426184

12

часто

1

0,033426184

12

часть

1

0,033426184

12

человек

1

0,033426184

12

четыре

1

0,033426184

12

шагов

1

0,033426184

12

шутил

1

0,033426184

12

этого

1

0,033426184

12

этому

1

0,033426184

12

я

1

0,033426184

12

янтарь

1

0,033426184

12

шесть

1

0,033426184

Рис. 1 Результат поиска по ключевым словам (Google)

Рис. 2 Результаты поиска по ключевым словам (Яндекс)

Рис. 3 Результаты поиска (Mail.ru)

При подсчѐте количества слов следует учесть, что:

Названия городов, стран и др., имеющие в своѐм составе более двух слов (Нью-Йорк, Санкт-Петербург, Мун Лайт Бей) считаются как одно слово;

Числительные, имеющие в составе более двух слов, считаются как одно

слово;

Знаки препинания (точка, запятая, тире, двоеточие) – не учитываются;

Для упрощения расчѐта можно использовать MS Excel.

После выбора текста для анализа, необходимо заполнить таблицу 3, анало-

гичную представленной выше.

 

 

 

 

Таблица 3.

 

Ранг, частота и коэффициент Зипфа для приведѐнного выше текста.

 

 

 

 

 

 

Ранг

 

Слово

Частота

Коэффициент Зипфа

 

 

 

 

 

 

 

 

 

 

 

 

После заполнения таблицы необходимо построить график зависимости

.

После заполнения таблицы необходимо определить значимые (на ваш

 

взгляд) слова (10-12), записать их ранги и частоты. В трѐх поисковых системах про-

извести поиск по ключевым словам в порядке уменьшения слов (от 10..12 до 5…7) в

каждом случае отметить общее количество найденных ссылок, а так же порядковый номер ссылки на искомый документ.

Повторить опыт с теми же словами, взятыми в кавычки. Объяснить получен-

ный результат.

Вкурсовом проекте должно содержаться:

1.Титульный лист, оформленный по образцу (см. пример оформления титульного листа);

2.Цель курсового проекта, используемые методы и средства для дости-

жения цели, постановка задачи;

3.Введение (1 страница – кратко охарактеризовать общие алгоритмы ра-

боты поисковых систем, выявить преимущества и недостатки, сказать

оперспективах развития);

4.Исходный текст (2 – 2.5 стр.);

5.Таблица рангов слов, их частоты и коэффициента Зипфа (таблица 3);

6.Гистограмму распределения слов (от большей встречаемости к мень-

шей);

7.Перечень значимых слов

8.Таблицу с результатами поиска в трѐх поисковых системах (с кавыч-

ками и без);

9.Перечень значимых слов;

10.На любом языке программирования представить программу, позволя-

ющую рассчитывать коэффициент Зипфа для введѐнного текста, отби-

рать значимые слова;

11.Вывод;

12.Список использованной литературы.

13.К отчѐту приложить CD, который должен содержать

Текст пояснительной записки;

Файл excel с расчѐтами;

Исходный код программы.