Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
10
Добавлен:
05.06.2015
Размер:
915.46 Кб
Скачать

Міністерство освіти і науки України

Кіровоградський національній технічний університет

Механіко – технологічний факультет

Кафедра програмного забезпечення

Дисципліна: «Мережі ЕОМ»

Лабораторна робота №7

Тема: «Створення пошукової програми - робота.».

Виконав

ст. гр. ПМ – 06

Безушко О.С.

Перевірив

викладач

Резніченко В.А.

Кіровоград 2009

Ціль:  Освоєння методики пошуку інформації в INTERNET.

Завдання: Створити пошукову програма-робот для пошуку ресурсів методом індексації.

Методичні вказівки до  виконання роботи:

  1. Дати коротку характеристику пошукових програм-роботів.

Основні характеристики пошукових систем

Розмір пошукової системи

Параметр, що характеризує об'єм інформації, проіндексованою системою:

(URL) - кількість сторінок, що зберігаються в індексах адрес;

(DOC) - кількість проіндексованих документів (останніх, як правило, менше,ніж (URL), оскільки по декількох URL може знаходитися один і той же документ).

(SERV) - кількість проіндексованих серверів.

На одному сервері може розташовуватися від однієї до декількох тисяч сторінок, тому дана цифра більше свідчить про широту обхвату системи, чим про її інформаційний об'єм. Від розміру пошукової системи залежить, чи буде Ваш веб-сайт представлений в її індексах, скільки сторінок веб-сайту буде проїндексировано і так далі

  1. Привести блок-схему алгоритму роботи програми-робота.

Опис елементів, які, як правило, враховуються усіма пошуковими системами:

1. Слова та фрази, що найбільш часто зустрічаються на сторінці, а також на всьому сайті.

2. Співвідношення усіх слів і словосполучень на сайті до кількості ключових слів і словосполучень на сайті.

3. Співвідношення усіх слів і словосполучень на сторінці до кількості ключових слів і словосполучень на сторінці.

4. Індекс цитування сторінки, індекс цитування сайту.

5. Популярність тематики тексту на сторінці сайту, а також тематики сайту у цілому, виходячи із статистики запитів до пошукової системи.

6. Об'єм сайту: загальна кількість веб-сторінок сайту, а також обсяг тексту на кожній конкретно узятій сторінці.

7. Використання на сайті фреймів.

8. Наявність файлів "робот" і "мапа сайту".

9. Географічне розташування сайту.

10. Вік сайту та окремих сторінок.

11. Періодичність оновлення інформації на сайті та на кожній сторінці.

12. Назва URL домену сайту та URL окремо взятих сторінок.

13. Число зображень, мультимедійних та інших файлів на сайті.

14. Наявність альтернативних написів, спливаючих підказок на картинках та інших елементах веб-дазайна. Довжина цих написів.

15. Наявність дзеркал сайту на різних мовах.

16. Розміри, жирність, реєстр, стиль ключових слів та фраз.

17. Як далеко від початку веб-сторінки та в якому порядку розташовані ключові слова.

18. Наявність і зміст різних мета-тегів.

19. Коментарі всередині програмного коду сайту.

20. Типи сторінок сайту (HTML, PHP).

21. Наявність на сайті веб-сторінок з несуттєвими відмінностями одна від одної.

22. Відповідність ключових слів сайту семантичному ядру сторінок інших сайтів, які на нього посилаються.

23. Наявність "шумових слів" (стоп слів).

24. Загальна кількість гіперпосилань сайту.

25. Кількість внутрішніх посилань сайту і їх взаємне розташування.

26. Кількість зовнішніх гіперпосилань сайту.

27. Структура сайту, рівень вкладеності його сторінок.

  1. Створити пошукову програма-робот (метод індексації).

<td valign="top" style="width:216px;">

<!--U1DRIGHTER1Z-->

<!-- <block7> -->

<!-- </block7> -->

<!-- <block8> -->

<!-- </block8> -->

<!-- <block9> -->

<table border="0" cellpadding="0" cellspacing="0" width="216">

<tr><td height="36" colspan="3" style="background:url('/.s/t/996/8.gif');padding-left:20px;color:#ACC5FF;"><b><!-- <bt> --><!--<s3163>-->Поиск<!--</s>--><!-- </bt> --></b></td></tr>

<tr><td width="26" valign="top" style="background:url('/.s/t/996/9.gif');"><img src="/.s/t/996/10.gif" border="0"></td><td width="175" style="background:url('/.s/t/996/11.gif');padding:5px;"><!-- <bc> --><iframe src="/gadget/?w=165;h=125;id=1639;mid=897;" width="165" height="125" scrolling="yes" allowTransparency="true" frameborder="0" style="background-color:transparent;"></iframe><!-- </bc> --></td><td width="15" valign="top" style="background:url('/.s/t/996/12.gif');"><img src="/.s/t/996/13.gif" border="0"></td></tr>

<tr><td colspan="3"><img src="/.s/t/996/14.gif" border="0"></td></tr>

</table>

<!-- </block9> -->

<!-- <block10> -->

<table border="0" cellpadding="0" cellspacing="0" width="216">

<tr><td height="36" colspan="3" style="background:url('/.s/t/996/8.gif');padding-left:20px;color:#ACC5FF;"><b><!-- <bt> --><!--<s5171>-->Календарь<!--</s>--><!-- </bt> --></b></td></tr>

<tr><td width="26" valign="top" style="background:url('/.s/t/996/9.gif');"><img src="/.s/t/996/10.gif" border="0"></td><td width="175" style="background:url('/.s/t/996/11.gif');padding:5px;"><div align="center"><!-- <bc> --><table border="0" cellspacing="1" cellpadding="2" class="calTable"><tr><td align="center" class="calMonth" colspan="7"><a title="Ноябрь 2009" class="calMonthLink" href="javascript://" rel="nofollow" onclick="window.location.href='http://sknmn.moy.su/news/2009-11';return false;">«</a>  <a class="calMonthLink" href="javascript://" rel="nofollow" onclick="window.location.href='http://sknmn.moy.su/news/2009-12';return false;">Декабрь 2009</a>  <a title="Январь 2010" class="calMonthLink" href="javascript://" rel="nofollow" onclick="window.location.href='http://sknmn.moy.su/news/2010-01';return false;">»</a></td></tr><tr><td align="center" class="calWday">Пн</td><td align="center" class="calWday">Вт</td><td align="center" class="calWday">Ср</td><td align="center" class="calWday">Чт</td><td align="center" class="calWday">Пт</td><td align="center" class="calWdaySe">Сб</td><td align="center" class="calWdaySu">Вс</td></tr><tr><td> </td><td align="center" class="calMday">1</td><td align="center" class="calMdayIs"><a class="calMdayLink" href="http://sknmn.moy.su/news/2009-12-02" title="2 Сообщений">2</a></td><td align="center" class="calMday">3</td><td align="center" class="calMday">4</td><td align="center" class="calMday">5</td><td align="center" class="calMday">6</td></tr><tr><td align="center" class="calMdayA">7</td><td align="center" class="calMday">8</td><td align="center" class="calMday">9</td><td align="center" class="calMday">10</td><td align="center" class="calMday">11</td><td align="center" class="calMday">12</td><td align="center" class="calMday">13</td></tr><tr><td align="center" class="calMday">14</td><td align="center" class="calMday">15</td><td align="center" class="calMday">16</td><td align="center" class="calMday">17</td><td align="center" class="calMday">18</td><td align="center" class="calMday">19</td><td align="center" class="calMday">20</td></tr><tr><td align="center" class="calMday">21</td><td align="center" class="calMday">22</td><td align="center" class="calMday">23</td><td align="center" class="calMday">24</td><td align="center" class="calMday">25</td><td align="center" class="calMday">26</td><td align="center" class="calMday">27</td></tr><tr><td align="center" class="calMday">28</td><td align="center" class="calMday">29</td><td align="center" class="calMday">30</td><td align="center" class="calMday">31</td></tr></table><!-- </bc> --></div></td><td width="15" valign="top" style="background:url('/.s/t/996/12.gif');"><img src="/.s/t/996/13.gif" border="0"></td></tr>

<tr><td colspan="3"><img src="/.s/t/996/14.gif" border="0"></td></tr>

</table>

<!-- </block10> -->

<!-- <block11> -->

<table border="0" cellpadding="0" cellspacing="0" width="216">

<tr><td height="36" colspan="3" style="background:url('/.s/t/996/8.gif');padding-left:20px;color:#ACC5FF;"><b><!-- <bt> --><!--<s5347>-->Архив записей<!--</s>--><!-- </bt> --></b></td></tr>

<tr><td width="26" valign="top" style="background:url('/.s/t/996/9.gif');"><img src="/.s/t/996/10.gif" border="0"></td><td width="175" style="background:url('/.s/t/996/11.gif');padding:5px;"><!-- <bc> --><ul class="archUl"><li class="archLi"><a class="archLink" href="http://sknmn.moy.su/news/2009-12">2009 Декабрь</a></li></ul><!-- </bc> --></td><td width="15" valign="top" style="background:url('/.s/t/996/12.gif');"><img src="/.s/t/996/13.gif" border="0"></td></tr>

<tr><td colspan="3"><img src="/.s/t/996/14.gif" border="0"></td></tr>

</table>

  1. Запустити програму на виконання.

  1. Внести зміни в локальні WEB – сторінки. (Вставити адресні посилання, отримані в результаті роботи програми).

  1. Відбити в звіті результати роботи програми-робота.

+

  1. Висновки.

Виконуючи дану лабораторну роботу, я освоїв роботу з Web – дизайнов, розібрався з методом індексації та освоїв принципи розробки пошукових роботів в мережі Internet. Спираючись на результати роботи, можна сміливо сказати, що метод індексації є один з найкращих для організації пошукових систем.

Контрольні питання:

  1. Які методи пошуку існують у Internet?

  2. Який алгоритм роботи програми-робота?

Соседние файлы в папке СЕТИ