
КП
.pdf12 |
биоритмам |
1 |
0,033426184 |
12 |
благодаря |
1 |
0,033426184 |
12 |
бог |
1 |
0,033426184 |
12 |
будет |
1 |
0,033426184 |
12 |
буду |
1 |
0,033426184 |
12 |
бы |
1 |
0,033426184 |
12 |
бывало |
1 |
0,033426184 |
12 |
была |
1 |
0,033426184 |
12 |
вампир |
1 |
0,033426184 |
12 |
вечера |
1 |
0,033426184 |
12 |
вечерних |
1 |
0,033426184 |
12 |
видеть |
1 |
0,033426184 |
12 |
видит |
1 |
0,033426184 |
12 |
внезапно |
1 |
0,033426184 |
12 |
внимание |
1 |
0,033426184 |
12 |
воздух |
1 |
0,033426184 |
12 |
возникло |
1 |
0,033426184 |
12 |
воле |
1 |
0,033426184 |
12 |
волн |
1 |
0,033426184 |
12 |
волнах |
1 |
0,033426184 |
12 |
полоса |
1 |
0,033426184 |
12 |
волос |
1 |
0,033426184 |
12 |
воскресенье |
1 |
0,033426184 |
12 |
впадает |
1 |
0,033426184 |
12 |
время |
1 |
0,033426184 |
12 |
отвечала |
1 |
0,033426184 |
12 |
вспоминает |
1 |
0,033426184 |
12 |
всяком |
1 |
0,033426184 |
12 |
выбирали |
1 |
0,033426184 |
12 |
выглядит |
1 |
0,033426184 |
12 |
выйти |
1 |
0,033426184 |
12 |
высоко |
1 |
0,033426184 |
12 |
вышла |
1 |
0,033426184 |
12 |
где |
1 |
0,033426184 |
12 |
главным |
1 |
0,033426184 |
12 |
говорил |
1 |
0,033426184 |
12 |
голове |
1 |
0,033426184 |
12 |
город |
1 |
0,033426184 |
12 |
городка |
1 |
0,033426184 |
12 |
городок |
1 |
0,033426184 |
12 |
городскому |
1 |
0,033426184 |
12 |
груди |
1 |
0,033426184 |
12 |
дальше |
1 |
0,033426184 |
12 |
двадцать |
1 |
0,033426184 |
12 |
два-три |
1 |
0,033426184 |
12 |
двери |
1 |
0,033426184 |
12 |
движений |
1 |
0,033426184 |
12 |
двух |
1 |
0,033426184 |
12 |
девы |
1 |
0,033426184 |
12 |
делал |
1 |
0,033426184 |
12 |
деревья |
1 |
0,033426184 |
12 |
десяти |
1 |
0,033426184 |
12 |
детстве |
1 |
0,033426184 |
12 |
дома |
1 |
0,033426184 |
12 |
дремлет |
1 |
0,033426184 |
12 |
других |
1 |
0,033426184 |
12 |
дыхание |
1 |
0,033426184 |
12 |
жара |
1 |
0,033426184 |
12 |
желаний |
1 |
0,033426184 |
12 |
жены |
1 |
0,033426184 |
12 |
жизнь |
1 |
0,033426184 |
12 |
заведений |
1 |
0,033426184 |
12 |
заката |
1 |
0,033426184 |
12 |
закрыто |
1 |
0,033426184 |
12 |
заметила |
1 |
0,033426184 |
12 |
запирали |
1 |
0,033426184 |
12 |
заслоняли |
1 |
0,033426184 |
12 |
затем |
1 |
0,033426184 |
12 |
звездным |
1 |
0,033426184 |
12 |
звуки |
1 |
0,033426184 |
12 |
звуков |
1 |
0,033426184 |
12 |
здешней |
1 |
0,033426184 |
12 |
земле |
1 |
0,033426184 |
12 |
землей |
1 |
0,033426184 |
12 |
знакомые |
1 |
0,033426184 |
12 |
золотом |
1 |
0,033426184 |
12 |
из |
1 |
0,033426184 |
12 |
изредка |
1 |
0,033426184 |
12 |
именно |
1 |
0,033426184 |
12 |
иногда |
1 |
0,033426184 |
12 |
инстинкт |
1 |
0,033426184 |
12 |
итак |
1 |
0,033426184 |
12 |
каждую |
1 |
0,033426184 |
12 |
казаться |
1 |
0,033426184 |
12 |
как |
1 |
0,033426184 |
12 |
квартала |
1 |
0,033426184 |
12 |
кипарис |
1 |
0,033426184 |
12 |
кипарисов |
1 |
0,033426184 |
12 |
когда-то |
1 |
0,033426184 |
12 |
костела |
1 |
0,033426184 |
12 |
костюм |
1 |
0,033426184 |
12 |
краски |
1 |
0,033426184 |
12 |
кровь |
1 |
0,033426184 |
12 |
собственных |
1 |
0,033426184 |
12 |
кроссовки |
1 |
0,033426184 |
12 |
кто-то |
1 |
0,033426184 |
12 |
кэпшоу |
1 |
0,033426184 |
12 |
лежал |
1 |
0,033426184 |
12 |
лента |
1 |
0,033426184 |
12 |
летаргию |
1 |
0,033426184 |
12 |
летом |
1 |
0,033426184 |
12 |
линией |
1 |
0,033426184 |
12 |
лишь |
1 |
0,033426184 |
12 |
лунный |
1 |
0,033426184 |
12 |
лунным |
1 |
0,033426184 |
12 |
луны |
1 |
0,033426184 |
12 |
любитель |
1 |
0,033426184 |
12 |
люди |
1 |
0,033426184 |
12 |
лютеранского |
1 |
0,033426184 |
12 |
лягушек |
1 |
0,033426184 |
12 |
марии |
1 |
0,033426184 |
12 |
машин |
1 |
0,033426184 |
12 |
между |
1 |
0,033426184 |
12 |
месяц |
1 |
0,033426184 |
12 |
миль |
1 |
0,033426184 |
12 |
миновала |
1 |
0,033426184 |
12 |
мир |
1 |
0,033426184 |
12 |
мира |
1 |
0,033426184 |
12 |
многих |
1 |
0,033426184 |
12 |
могла |
1 |
0,033426184 |
12 |
моложе |
1 |
0,033426184 |
12 |
мост |
1 |
0,033426184 |
12 |
мостовой |
1 |
0,033426184 |
12 |
мрачно |
1 |
0,033426184 |
12 |
мрачные |
1 |
0,033426184 |
12 |
муж |
1 |
0,033426184 |
12 |
налево |
1 |
0,033426184 |
12 |
направлению |
1 |
0,033426184 |
12 |
нарушал |
1 |
0,033426184 |
12 |
нарушают |
1 |
0,033426184 |
12 |
нарушил |
1 |
0,033426184 |
12 |
наслаждаться |
1 |
0,033426184 |
12 |
наступающей |
1 |
0,033426184 |
12 |
наступившую |
1 |
0,033426184 |
12 |
научилась |
1 |
0,033426184 |
12 |
началось |
1 |
0,033426184 |
12 |
небо |
1 |
0,033426184 |
12 |
небом |
1 |
0,033426184 |
12 |
ней |
1 |
0,033426184 |
12 |
неплохой |
1 |
0,033426184 |
12 |
нет |
1 |
0,033426184 |
12 |
никаких |
1 |
0,033426184 |
12 |
никогда |
1 |
0,033426184 |
12 |
никого |
1 |
0,033426184 |
12 |
них |
1 |
0,033426184 |
12 |
ничего |
1 |
0,033426184 |
12 |
ночи |
1 |
0,033426184 |
12 |
ночного |
1 |
0,033426184 |
12 |
ночью |
1 |
0,033426184 |
12 |
облака |
1 |
0,033426184 |
12 |
обретала |
1 |
0,033426184 |
12 |
оглянулась |
1 |
0,033426184 |
12 |
огоньки |
1 |
0,033426184 |
12 |
один |
1 |
0,033426184 |
12 |
одиннадцать |
1 |
0,033426184 |
12 |
одиноком |
1 |
0,033426184 |
12 |
одиночество |
1 |
0,033426184 |
12 |
одна |
1 |
0,033426184 |
12 |
опасалась |
1 |
0,033426184 |
12 |
опасения |
1 |
0,033426184 |
12 |
оправдались |
1 |
0,033426184 |
12 |
оправленный |
1 |
0,033426184 |
12 |
осенней |
1 |
0,033426184 |
12 |
остановилась |
1 |
0,033426184 |
12 |
острые |
1 |
0,033426184 |
12 |
отблесков |
1 |
0,033426184 |
12 |
оушн-авеню |
1 |
0,033426184 |
12 |
ощущение |
1 |
0,033426184 |
12 |
пастора |
1 |
0,033426184 |
12 |
пением |
1 |
0,033426184 |
12 |
пену |
1 |
0,033426184 |
12 |
первый |
1 |
0,033426184 |
12 |
переливающийся |
1 |
0,033426184 |
12 |
песка |
1 |
0,033426184 |
12 |
пляж |
1 |
0,033426184 |
12 |
пляжа |
1 |
0,033426184 |
12 |
пляжу |
1 |
0,033426184 |
12 |
плясали |
1 |
0,033426184 |
12 |
побережья |
1 |
0,033426184 |
12 |
поднималось |
1 |
0,033426184 |
12 |
подряд |
1 |
0,033426184 |
12 |
подсказал |
1 |
0,033426184 |
12 |
покойный |
1 |
0,033426184 |
12 |
полосками |
1 |
0,033426184 |
12 |
полосы |
1 |
0,033426184 |
12 |
последний |
1 |
0,033426184 |
12 |
похитил |
1 |
0,033426184 |
12 |
почувствовала |
1 |
0,033426184 |
12 |
появиться |
1 |
0,033426184 |
12 |
привлекала |
1 |
0,033426184 |
12 |
приглушала |
1 |
0,033426184 |
12 |
пробежала |
1 |
0,033426184 |
12 |
пробежек |
1 |
0,033426184 |
12 |
продолжала |
1 |
0,033426184 |
12 |
прохожих |
1 |
0,033426184 |
12 |
прошло |
1 |
0,033426184 |
12 |
прямо |
1 |
0,033426184 |
12 |
пустынно |
1 |
0,033426184 |
12 |
пустынном |
1 |
0,033426184 |
12 |
пустынный |
1 |
0,033426184 |
12 |
путь |
1 |
0,033426184 |
12 |
пять |
1 |
0,033426184 |
12 |
работой |
1 |
0,033426184 |
12 |
раза |
1 |
0,033426184 |
12 |
раздолье |
1 |
0,033426184 |
12 |
размеренность |
1 |
0,033426184 |
12 |
разу |
1 |
0,033426184 |
12 |
рака |
1 |
0,033426184 |
12 |
расширялся |
1 |
0,033426184 |
12 |
ричард |
1 |
0,033426184 |
12 |
рокот |
1 |
0,033426184 |
12 |
росший |
1 |
0,033426184 |
12 |
сама |
1 |
0,033426184 |
12 |
сбудется |
1 |
0,033426184 |
12 |
свернула |
1 |
0,033426184 |
12 |
свет |
1 |
0,033426184 |
12 |
светилась |
1 |
0,033426184 |
12 |
светом |
1 |
0,033426184 |
12 |
светоотражающими |
1 |
0,033426184 |
12 |
своей |
1 |
0,033426184 |
12 |
свои |
1 |
0,033426184 |
12 |
своим |
1 |
0,033426184 |
12 |
сглаживала |
1 |
0,033426184 |
12 |
себя |
1 |
0,033426184 |
12 |
сентября |
1 |
0,033426184 |
12 |
серебром |
1 |
0,033426184 |
12 |
скалы |
1 |
0,033426184 |
12 |
скучная |
1 |
0,033426184 |
12 |
случае |
1 |
0,033426184 |
12 |
случилось |
1 |
0,033426184 |
12 |
сначала |
1 |
0,033426184 |
12 |
со |
1 |
0,033426184 |
12 |
собой |
1 |
0,033426184 |
12 |
совсем |
1 |
0,033426184 |
12 |
сосать |
1 |
0,033426184 |
12 |
сосен |
1 |
0,033426184 |
12 |
спадает |
1 |
0,033426184 |
12 |
спине, |
1 |
0,033426184 |
12 |
спортивный |
1 |
0,033426184 |
12 |
ставку |
1 |
0,033426184 |
12 |
стало |
1 |
0,033426184 |
12 |
страшного |
1 |
0,033426184 |
12 |
струящийся |
1 |
0,033426184 |
12 |
суда |
1 |
0,033426184 |
12 |
сумраке |
1 |
0,033426184 |
12 |
считала |
1 |
0,033426184 |
12 |
что |
1 |
0,033426184 |
12 |
таверны |
1 |
0,033426184 |
12 |
таинственные |
1 |
0,033426184 |
12 |
так |
1 |
0,033426184 |
12 |
твою |
1 |
0,033426184 |
12 |
тебя |
1 |
0,033426184 |
12 |
темнота |
1 |
0,033426184 |
12 |
тень |
1 |
0,033426184 |
12 |
теперь |
1 |
0,033426184 |
12 |
тому |
1 |
0,033426184 |
12 |
тревоги |
1 |
0,033426184 |
12 |
тридцать |
1 |
0,033426184 |
12 |
туристов |
1 |
0,033426184 |
12 |
увидела |
1 |
0,033426184 |
12 |
углы |
1 |
0,033426184 |
12 |
уже |
1 |
0,033426184 |
12 |
неподвижный |
1 |
0,033426184 |
12 |
умерший |
1 |
0,033426184 |
12 |
утром |
1 |
0,033426184 |
12 |
фонарей |
1 |
0,033426184 |
12 |
холмами |
1 |
0,033426184 |
12 |
центре |
1 |
0,033426184 |
12 |
цикад |
1 |
0,033426184 |
12 |
час |
1 |
0,033426184 |
12 |
часто |
1 |
0,033426184 |
12 |
часть |
1 |
0,033426184 |
12 |
человек |
1 |
0,033426184 |

12 |
четыре |
1 |
0,033426184 |
12 |
шагов |
1 |
0,033426184 |
12 |
шутил |
1 |
0,033426184 |
12 |
этого |
1 |
0,033426184 |
12 |
этому |
1 |
0,033426184 |
12 |
я |
1 |
0,033426184 |
12 |
янтарь |
1 |
0,033426184 |
12 |
шесть |
1 |
0,033426184 |
Рис. 1 Результат поиска по ключевым словам (Google)
Рис. 2 Результаты поиска по ключевым словам (Яндекс)

Рис. 3 Результаты поиска (Mail.ru)
При подсчѐте количества слов следует учесть, что:
Названия городов, стран и др., имеющие в своѐм составе более двух слов (Нью-Йорк, Санкт-Петербург, Мун Лайт Бей) считаются как одно слово;
Числительные, имеющие в составе более двух слов, считаются как одно
слово;
Знаки препинания (точка, запятая, тире, двоеточие) – не учитываются;
Для упрощения расчѐта можно использовать MS Excel.
После выбора текста для анализа, необходимо заполнить таблицу 3, анало-
гичную представленной выше.
|
|
|
|
Таблица 3. |
|
|
Ранг, частота и коэффициент Зипфа для приведѐнного выше текста. |
||||
|
|
|
|
|
|
Ранг |
|
Слово |
Частота |
Коэффициент Зипфа |
|
|
|
|
|
|
|
|
|
|
|
|
|
После заполнения таблицы необходимо построить график зависимости |
. |
||||
После заполнения таблицы необходимо определить значимые (на ваш |
|
взгляд) слова (10-12), записать их ранги и частоты. В трѐх поисковых системах про-
извести поиск по ключевым словам в порядке уменьшения слов (от 10..12 до 5…7) в
каждом случае отметить общее количество найденных ссылок, а так же порядковый номер ссылки на искомый документ.
Повторить опыт с теми же словами, взятыми в кавычки. Объяснить получен-
ный результат.
Вкурсовом проекте должно содержаться:
1.Титульный лист, оформленный по образцу (см. пример оформления титульного листа);
2.Цель курсового проекта, используемые методы и средства для дости-
жения цели, постановка задачи;
3.Введение (1 страница – кратко охарактеризовать общие алгоритмы ра-
боты поисковых систем, выявить преимущества и недостатки, сказать
оперспективах развития);
4.Исходный текст (2 – 2.5 стр.);
5.Таблица рангов слов, их частоты и коэффициента Зипфа (таблица 3);
6.Гистограмму распределения слов (от большей встречаемости к мень-
шей);
7.Перечень значимых слов
8.Таблицу с результатами поиска в трѐх поисковых системах (с кавыч-
ками и без);
9.Перечень значимых слов;
10.На любом языке программирования представить программу, позволя-
ющую рассчитывать коэффициент Зипфа для введѐнного текста, отби-
рать значимые слова;
11.Вывод;
12.Список использованной литературы.
13.К отчѐту приложить CD, который должен содержать
Текст пояснительной записки;
Файл excel с расчѐтами;
Исходный код программы.