Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы ЭОИС,Т.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
690.05 Кб
Скачать
  1. Базовые принципы экранной типографики. Особенности восприятия человеком экранного текста. Специфика отображения шрифтов на экране

Типографика – это графическое оформление печатного текста посредством набора и верстки с использованием норм и правил, специфических для данного языка. Другими словами, типографика – это и искусство, и ремесло, и набор правил, которые используют шрифты и оформительские средства для достижения одной-единственной цели – сделать текст наиболее оптимальным в восприятии читателя. Экранная типографика - оформление текста для его прочтения с монитора компьютера.

В то же время есть вещи, которые пользователя ни в коем случае нельзя заставлять делать, так как есть высокая вероятность того, что он текст просто не дочитает:

  1. Не заставляйте пользователя менять размер шрифта. Читателю совершенно не хочется постоянно менять настройки размера шрифта в браузере при каждом посещении нового сайта.

  2. Не нужно пытаться убедить пользователя в том, что прокрутка страниц — это плохо. В таком случае девяносто процентов всех страниц в Интернете – плохие. В прокрутке нет абсолютно ничего отрицательного, как нет негативных сторон и в перелистывании страниц книги.

  3. Не пытайтесь сказать пользователю, что текст на сайте не важен. Девяносто пять процентов того, чем занимается веб-дизайнер, – это типографика.

Следуя этим, несомненно, простым ограничениям, мы получаем несколько правил, достаточно простых для того, чтобы им было легко следовать.

  1. Размер шрифта. Пользователь хочет читать, поэтому текст должен подстраиваться под желания пользователя, но никак не наоборот.

  2. Свободное пространство. Текст должен дышать – это не вопрос вкуса. Больше свободного пространства – больше возможности глазу отдохнуть от необходимости искать нужный текст.

  3. Удобное межстрочное расстояние. «Плотно стиснутые по вертикали строки уменьшают скорость чтения, поскольку верхняя и нижняя строки охватываются глазом одновременно. Глазу не удается сфокусироваться на отдельной строке, и читатель тратит энергию там, где этого делать не должен. По этой причине он быстрее устает. Это относится и к тем случаям, когда интерлиньяж (расстояние между строками) слишком велик». Стандартная рекомендация – это межстрочное расстояние в 140 процентов от стандартного.

  4. Контрастность текста. Не стоит употреблять следующие цветовые комбинации: серый текст на светло-сером фоне, текст серебряного цвета на белом фоне, серый текст на желтом фоне и так далее. Шрифт близкого к фону оттенка плохо виден, излишняя контрастность раздражает.

  5. Никаких слов картинками. Т.к. буквы на мониторе являются совокупностью пикселей, то на экранах с крупными пикселями нельзя будет четко воспринимать мелкие буквы – пиксели сольются или буквы размажутся.

Т.к. в мониторах используется принцип «излучения света», в отличии от бумаги, то при большой яркости, например, светлых букв на черном фоне, символы будут размазываться для человека. На экране текст можно заставить менять цвет, моргать, увеличиваться. Человеку тяжело видеть подобные «эффекты» – это утомляет. Минус и тире – совершенно разные символы! Нельзя ставить минус вместо тире. Тире в полтора раза длиннее его и тоньше.

  1. Информационно-поисковые системы: определение, назначение, техническая суть, классификация, характеристики, архитектура, примеры и перспективы развития. Основные принципы оптимизации текста для поисковых систем

Информационно-поисковая система – это прикладная компьютерная среда для обработки, хранения, сортировки, фильтрации и поиска больших массивов структурированной информации.

По характеру предоставления логической организации хранимой информации ИПС разделяются на:

  • Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области. 

  • В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов соподчиненность по смысловому содержанию. 

  • В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент. 

Рисунок-архитектура информационно-поисковой системы на примере ИПС Google

1. URLServer — список всех адресов.

2. Crawler — робот, который загружает страницы из списка адресов и передает в StoreServer.

3. StoreServer сохраняет страницы в Repository, чаще всего в виде HTML документа. При этом вся дополнительная информация, такая как картинки, flash-анимация и прочее, не сохраняется.

4. Indexer разбирает сохраненные в RepositoryHTML-документы в последовательности слов и сохраняет их в Barrles (база данных).

5. Lexicon — список всех слов. Чаще всего слова храняться в таблице с двумя полями “номер” и “слово”. Таким образом достигается экономия места в базе данных, так как длинные слова заменяются достаточно коротким номером.

6. Anchors — выделенные компонентом Indexer ссылки (URL).

7. URLResolver — обработчик URL. Если находятся новые ссылки, то они передаются в URLServer.

8. Links определяет какие сайт на какие ссылаются и передает это в PageRank.

9. PageRank — определяет рейтинг сайта, основным критерием является количество ссылок на этот сайт (подробнее смотрите раздел про PageRank).

10. Searcher — клиент. Чаще всего клиент пользуется статической базой данных, которая обновляется примерно раз в сутки.

Основные принципы оптимизации текста для поисковых систем.

Для поиска в указателе пользователь должен сформулировать запрос и отправить его в поисковую машину. Запрос может быть очень простым, как минимум он должен состоять из одного слова. Для построения более сложного запроса нужно использовать булевы операторы, позволяющие уточнять и расширять условия поиска.

Чаще всего используются такие булевы операторы: 

  • AND – все выражения, соединенные оператором «AND», должны присутствовать на искомых страницах или в документах. В некоторых поисковых машинах вместо слова AND используется оператор «+».

  • OR – по крайней мере, одно из выражений, соединенных оператором «OR», должно присутствовать на искомых страницах или в документах. 

  • NOT – выражение или выражения, следующие за оператором «NOT» не должно (не должны) появляться на искомых страницах или в документах. В некоторых поисковых машинах вместо слова NOT используется оператор «-».

  • FOLLOWEDBY – одно из выражений должно следовать непосредственно за другим. 

  • NEAR – одно из выражений должно находиться на расстоянии от другого, не большем, чем заданное количество слов. 

  • Кавычки – заключенные в кавычки слова рассматриваются как фраза, которую следует найти в документе или файле. 

Примеры информационно-поисковых систем:

  • Google самая популярная в мире поисковая система. Наглая, как и все американцы, но предоставляющая много возможностей. В общем, бесспорный мировой лидер среди поисковых роботов. 

  • Яндекс — отечественная поисковая система. Это одно из её немногих достоинств. В остальном имеем медленное обновление поисковой базы, постоянную смену правил игры (как для пользователей, так и для владельцев сайтов), своеобразное понимание качества поисковой выдачи и т.д. В общем, она популярна в Рунете лишь потому, что большинство пользователей не догадывается о существовании других искалок. 

  • Bingновая поисковая система от Microsoft. Bing заменила все предыдущие поисковики от этой всемирно известной компании. И, надо сказать, не случайно. Bing на порядок лучше старых поисковых систем от Microsoft. 

Перспективы развития поисковых систем

Задаваемый булевыми операторами поиск является буквальным – машина осуществляет поиск слов или фраз точно в таком виде, в каком их ввели. Это может порождать проблемы, когда введенные слова многозначны. Например, английское слово «Bed» может означать кровать, клумбу, место, где рыба мечет икру, и многое другое. Если пользователя интересует только одно из этих значений, ему не нужны страницы со словом, имеющим другие значения. Можно построить буквальный поисковый запрос, нацеленный на отсечение нежелательных значений, но было бы неплохо, если бы сама поисковая машина могла оказывать соответствующую помощь. 

Один из вариантов работы поисковой машины – концептуальный поиск. Часть такого поиска предусматривает использование статистического анализа страниц, содержащих введенные пользователем слова или фразы, для нахождения других страниц, которые могли бы этого пользователя заинтересовать. Понятно, что для концептуального поиска требуется хранить больше информации о каждой странице, и каждый поисковый запрос потребует большего числа вычислений. В настоящее время многие группы разработчиков занимаются повышением результативности и производительности поисковых машин такого типа. Другие исследователи сфокусировались на иной области, которую именуют естественно-языковыми запросами (natural-languagequeries).

Идея естественно-языковых запросов состоит в том, чтобы пользователь формулировал запрос так же, как он бы спрашивал у человека, сидящего рядом – при этом не нужно отслеживать булевы операторы или сложные структуры запросов. Наиболее популярным современным сайтом с естественно-языковыми поисковыми запросами является AskJeeves.com, анализирующий запрос с целью выявления ключевых слов, которые затем используются для поиска в построенном этой поисковой машиной указателе сайтов. Упомянутый сайт работает только с простыми поисковыми запросами, однако разработчики в условиях жесткой конкуренции занимаются разработкой машины с естественно-языковыми поисковыми запросами, способной обрабатывать очень сложные запросы. 

  1. Семантические системы: определение, назначение, техническая суть, классификация, характеристики, архитектура, примеры и перспективы развития. Основные принципы оптимизации семантической сети

Семантическая сеть (система) – информационная модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а дуги (рёбра) задают отношения между ними. Объектами могут быть понятия, события, свойства, процессы. Таким образом, семантическая сеть является одним из способов представления знаний. В названии соединены термины из двух наук: семантика в языкознании изучает смысл единиц языка, а сеть в математике представляет собой разновидность графа – набора вершин, соединённых дугами (рёбрами). В семантической сети роль вершин выполняют понятия базы знаний, а дуги (причем направленные) задают отношения между ними. Таким образом, семантическая сеть отражает семантику предметной области в виде понятий и отношений.

Математика позволяет описать большинство явлений в окружающем мире в виде логических высказываний. Семантические сети возникли как попытка визуализации математических формул. Основным представлением для семантической сети является граф. Однако не стоит забывать, что за графическим изображением непременно стоит строгая математическая запись, и что обе эти формы являются не конкурирующими, а взаимодополняющими.

Основной формой представления семантической сети является граф. Понятия семантической сети записываются в овалах или прямоугольниках и соединяются стрелками с подписями — дугами (см. рис.). Это наиболее удобно воспринимаемая человеком форма. Её недостатки проявляются, когда мы начинаем строить более сложные сети или пытаемся учесть особенности естественного языка. Схемы семантических сетей, на которых указаны направления навигационных отношений, называют картами знаний, а их совокупность, позволяющая охватить большие участки семантической сети, атласом знания.

В математике граф представляется множеством вершин V и множеством отношений между ними E. Используя аппарат математической логики, приходим к выводу, что каждая вершина соответствует элементу предметного множества, а дуга – предикату.

Пример семантической сети (системы)

В лингвистике отношения фиксируются в словарях и в тезаурусах. В словарях в определениях через род и видовое отличие родовое понятие занимает определённое место. В тезаурусах в статье каждого термина могут быть указаны все возможные его связи с другими родственными по теме терминами. От таких тезаурусов необходимо отличать тезаурусы информационно- поисковые с перечнями ключевых слов в статьях, которые предназначены для работы дескрипторных поисковых систем.

Классификация семантических сетей

Для всех семантических сетей справедливо разделение по арности и количеству типов отношений.

  • По количеству типов отношений, сети могут быть однородными и неоднородными.

    • Однородные сети обладают только одним типом отношений (стрелок), например, таковой является вышеупомянутая классификация биологических видов (с единственным отношением AKO).

    • В неоднородных сетях количество типов отношений больше двух. Классические иллюстрации данной модели представления знаний представляют именно такие сети. Неоднородные сети представляют больший интерес для практических целей, но и большую сложность для исследования. Неоднородные сети можно представлять как переплетение древовидных многослойных структур. Примером такой сети может быть Семантическая сеть Википедии.

  • По арности:

    • типичными являются сети с бинарными отношениями (связывающими ровно два понятия). Бинарные отношения очень просты и удобно изображаются на графе в виде стрелки между двух концептов. Кроме того, они играют исключительную роль в математике.

    • На практике, однако, могут понадобиться отношения, связывающие более двух объектов – N-арные. При этом возникает сложность – как изобразить подобную связь на графе, чтобы не запутаться. Концептуальные графы (см. ниже) снимают это затруднение, представляя каждое отношение в виде отдельного узла.

  • По размеру:

    • Для решения конкретных задач, например, тех которые решают системы искусственного интеллекта.

    • С. С. отраслевого масштаба должна служить базой для создания конкретных систем, не претендуя на всеобщее значение.

    • Глобальная семантическая сеть. Теоретически такая сеть должна существовать, поскольку всё в мире взаимосвязано. Возможно, когда-нибудь такой сетью станет Всемирная паутина.

Использование семантических сетей

Семантизация - процесс изменения текстов, в которых выделяются семантические отношения без изменения их содержания. В Википедии существуют проекты по семантизации статей и Дерева категорий.

  • Семантизация статей заключается в основном путём использования шаблонов, при этом некоторые категории создаются автоматически.

  • Семантизация Дерева категорий возможна по частям после его анализа и выделения участков с родовыми категориями

Семантическая паутина

Концепция организации гипертекста напоминает однородную бинарную семантическую сеть, однако здесь есть существенное отличие:

  1. Связь, осуществляемая гиперссылкой, не имеет семантики, т.е. не описывает смысла этой связи. Назначение семантической сети состоит в том, чтобы описать взаимосвязи объектов, а не дополнительную информацию по предметной области. Человек может разобраться, зачем нужна та или иная гиперссылка, но компьютеру эта связь не понятна.

  2. Страницы, связываемые гиперссылками, являются документами, описывающими, как правило, проблемную ситуацию в целом. В семантической сети вершины (то, что связывают отношения) представляют собой понятия или объекты реального мира.

Попытка создания семантической сети на основе Всемирной паутины получила название семантической паутины. Эта концепция подразумевает использование языка RDF(языка разметки на основе XML) и призвана придать ссылкам некий смысл, понятный компьютерным системам. Это позволит превратить Интернет в распределённую базу знаний глобального масштаба.

81

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]