
- •Глава 1 Мультимедиа-информация – стандарты и средства представления и хранения.
- •Выполнили: Коковкина, Дроботова, Назаренко, Щепина, Гайдай
- •Звуковая карта
- •Матричные (игольчатые) принтеры
- •1. Планшетные сканеры
- •2. Ручные сканеры
- •3. Барабанные сканеры
- •4. Листопротяжные сканеры
- •Глава 2 Стандарты и средства компьютерного представления текстов.
- •Выполнили: Рочева Людмила, Логинов Олег, Салтанова Елена, Волчкевич Мария Текст
- •Глава 3 Стандарты и средства компьютерного представления аудиоинформации.
- •Аппаратные секвенсоры
- •Программные секвенсоры
- •Функции секвенсоров
- •Глава 4 Стандарты и средства компьютерного представления видеоинформации.
- •Программное обеспечение для работы с видеоинформацией.
- •Видеосигналы.
- •Видеостандарты.
- •Видеоформаты.
- •Сжатие видеоданных.
- •Создание и редактирование видеоизображений.
- •Хранение и воспроизведение видеоизображений.
- •Воспроизведение видеоизображения
- •Обзор программного обеспечения.
Глава 2 Стандарты и средства компьютерного представления текстов.
Содержание темы:
Текст и его составные части; шрифт - гарнитура, кегль, начертание, насыщенность, пропорциональность, кернинг, крекинг, типы шрифтов – растровые, контурные, алгоритмические, формат True Type, Type 1; абзац и формат страниц; создание текста вручную при помощи текстового редактора, использование литературных источников и издательских материалов - проблемы авторского права, использование баз данных, сканирование документов с последующим распознаванием изображения, кодировка символов – стандарт ASCII, стандарт OEM, стандарт ANSI, стандарт UNICODE, текстовые редакторы, осуществляющие работу с символами в разном формате, режим WYSIWYG, RTF, DOC, TEX, PostScript-форматы документов.
Выполнили: Рочева Людмила, Логинов Олег, Салтанова Елена, Волчкевич Мария Текст
Текст состоит из некоторого количества предложений. Одно предложение, даже очень распространённое, сложное, текстом назвать нельзя, поскольку текст можно расчленить на самостоятельные предложения, а части предложения сочетаются по законам синтаксиса сложного предложения, но не текста.
В смысловой цельности текста отражаются те связи и зависимости, которые имеются в самой действительности (общественные события, явления природы, человек, его внешний облик и внутренний мир, предметы неживой природы и т. д.).
Главный тезис — текст состоит из двух или нескольких предложений.
Единство предмета речи — это тема высказывания. Тема — это смысловое ядро текста, конденсированное и обобщённое содержание текста.
Понятие «содержание высказывания» связано с категорией информативности речи и присуще только тексту. Оно сообщает читателю индивидуально-авторское понимание отношений между явлениями, их значимости во всех сферах придают ему смысловую цельность.
В большом тексте ведущая тема распадается на ряд составляющих подтем; подтемы членятся на более дробные, на абзацы (микротемы).
Завершённость высказывания связана со смысловой цельностью текста. Показателем законченности текста является возможность подобрать к нему заголовок, отражающий его содержание.
Некоторыми исследователями замечено, что текст может состоять и из одного предложения. Будь оно распространенное или простое, ничем не осложненное предложение. Так, предложение: «Осень», — является текстом, так как оно обладает одним из главных признаков текста — информативностью.
Шрифты
Символ, кегль, штрихи
Символ — это любая буква, цифра или какой-либо иной графический знак. Совокупность однотипных по рисунку символов называется шрифтом.
Кегль (иногда говорят «кегель»} — размер шрифта по высоте, измеряемый в пунктах.
Шрифт, полученный некоторым общим для всех символов видоизменением, но не увеличением или уменьшением кегля, при сохранении основных принципов шрифтового рисунка называется начертанием. Начертания различаются следующим образом.
1. По плотности (нормальное, узкое, широкое)
2. По насыщенности (светлое, полужирное, жирное)
3. По наклону (постановке) (прямое, курсивное, наклонное)
Как правило, основной текст набирается нормальным (иногда узким), светлым, прямым начертанием. Остальные обычно используются для оформления издания (заголовки, буквицы, титульные листы, обложка) и для выделений в тексте.
Гарнитура - это полный имеющий собственное имя набор начертаний и кеглей или, другими словами, совокупность всех шрифтов одного шрифтового рисунка. Очень часто путают понятия «гарнитура» и «шрифт». На самом деле их надо различать, потому что шрифт — частный случай гарнитуры.
Типы гарнитур: с засечками (серифные), Рубленые (гротесковые), Акцидентные или декоративные
Пропорциональность шрифта.
В большинстве шрифтов символы имеют различную ширину, например буква «М» шире, чем «Н», обязательно придерживаются некоторых пропорций в соотношениях ширин различных символов. Такие шрифты называются пропорциональными. Моноширинными шрифтами называются те, у которых каждый символ имеет одну и ту же ширину знакоместа. Точка, например, в строке будет занимать столько же места, что и буква «Ш». Такой эффект достигается добавлением пробелов до и после символа
Виды цифровых шрифтов
Растровые шрифты. Их особенность — каждый шрифт представлен своим файлом, в котором хранятся точечные рисунки символов определенного размера и определенного разрешения. У растровых шрифтов есть одно достоинство — высокая скорость прорисовки символа. Вся информация на экране отображается в виде набора пикселов (точек), и компьютер прилагает минимум усилий для передачи на монитор такого шрифта. Как правило, используются несколько наиболее ходовых размеров, а если нет подходящего кегля, то берется шрифт ближайшего размера, и bitmap-изображение перестраивается. При пересчете размера конечно же теряется скорость, и все же использование растровых шрифтов остается выигрышным.
Векторные шрифты. Символ представляется в них в виде совокупности векторов. Каждый вектор — прямая линия или часть окружности — описывается координатами относительно базовой точки (точки привязки). При масштабировании эти координаты умножаются на некоторый коэффициент (масштаб). Векторные шрифты хороши для вывода текста на перьевые или струйные плоттеры (графопостроители) и поэтому используются в ряде программ проектирования, конечный результат работы которых — чертеж или схема.
Контурные шрифты - контур символа задается набором кривых (векторов), которые описываются математическими уравнениями второго или третьего порядка, а пространство внутри заполняется точками (растром). Качество отображения шрифта зависит только от устройства вывода: чем выше разрешение, тем меньше размер точки, тем больше их размещается внутри и вдоль контура, тем ровнее линии.
Основные типы контурных шрифтов
Шрифты Туре 1. Контуры символов шрифта Туре 1 описываются кривыми 3-го порядка, структура Туре 1 такова, что на мониторе текст отображается не медленнее, чем bitmap-шрифты, а печатается на принтере или другом выводном устройстве даже быстрее.
Type 1 при выводе на монитор — растровый шрифт, при выводе на принтер (фотонабор) — контурный. Благодаря такому подходу повышается скорость работы, но недостатком этого метода является то, что на экране шрифт может выглядеть не совсем так, как на печати. Еще один минус Type 1: устройство вывода обязательно должно поддерживать язык Post-Script, что стоит довольно дорого.
Type 1 представляется двумя файлами:
*.pfb — непосредственно сам шрифт;
*.pfm — таблица размеров символов (метрика) и таблица кернинга.
Type 1 состоит из двух частей: открытой и закрытой. В открытой части хранится информация об обозначении, заголовке, кодовой таблице шрифта, а также прописан уникальный идентификатор.
Шрифты TrueType
Контур символа описывается кривыми 2-го порядка, в результате чего на построение символа требуется больше векторов и в местах их стыка могут быть неровности, дуги могут быть недостаточно гладкими. Но если шрифт сделан квалифицированным и ответственным художником, то TrueType по качеству не уступает Type 1.
Абза́ц (нем. Absatz — раздел, часть текста) — отрезок письменной речи, состоящий из нескольких предложений.
Абзац, обозначая своего рода «цезуру», является единицей членения, промежуточной между фразой и главой, и служит для группировки однородных единиц изложения, исчерпывая один из его моментов (тематический, сюжетный и т. д.). Выделение фразы в особый абзац усиливает падающий на неё смысловой акцент.
Абзац — малоисследованный компонент литературной формы, имеющий композиционное, сюжетно-тематическое, ритмическое значение и связанный со стилем автора. Характерны, например, краткие абзацы в импрессионистической прозе — симптомы раздробленности, афористичности мысли; или например возвращение к длинному абзацу в несколько страниц у М. Пруста, связанное со стернианской, так называемой «спиралевидной цикличностью» его изложения. Особенно выразителен абзац у А. Белого, который выделяет в особые абзацы даже отдельные части фразы, подчёркивая этим тематическую значимость, ритмическое развитие выделяемых частей.
Для выделения абзаца его, помимо новой строки, печатают со строки красной, то есть отделяют вертикальным отступом от соседних абзацев и/или делают абзацный отступ.
Выбор гарнитуры
Количество гарнитур. Обычно в изданиях рекомендуется использовать не более двух-трех гарнитур, в одной гарнитуре может быть до 27 начертаний (хотя обычно не более четырех), плюс различные кегли — только этим нитуры, заметно отличающейся от первой, способно значительно разнообразить оформление.
Зависимость от вида издания. В неменьшей степени выбор гарнитуры основного текста зависит от вида издания, поэтому художники-шрифтовики создали шрифты с различными задачами и, соответственно, параметрами (ширина симво- ла, соотношение прописной и строчной букв, контрастность штрихов и т. д.).
Издания художественной литературы должны быть набраны шрифтом, символы которого имеют классические пропорции и легко читаются в строке. Предпочтительнее использовать шрифты с засечками. Для изданий большого формата гарнитура должна быть чуть шире, чем для меньших форматов.
Специальная литература (техническая, справочная, учебная для вузов и курсов и пр.). Рисунок шрифта должен быть строгим, не отвлекающим от восприятия материала. Чаще используют гарнитуру с засечками, особенно для учебников, но может быть применена и рубленая.
Энциклопедическая литература. Здесь один из главных критериев — убористость. Иногда применяют узкое начертание, но в этом случае лучше использовать рубленую гарнитуру.
Газеты. Гарнитуры чаще всего выбираются неконтрастные, рубленые. Если качество печати и бумаги достаточно высоки, то можно использовать и шрифты с засечками.
Журналы. Здесь выбор в значительной мере зависит от бумаги, на которой будет напечатано издание. В дорогих журналах на глянцевой бумаге или печатающихся хорошим офсетом можно использовать гарнитуры как с засечками, так и рубленые. В дешевых изданиях практичнее рубленые гарнитуры. При наборе текста в одну колонку на всю полосу выбираются шрифты пошире, при многоколоночной верстке — поуже или применяют узкое начертание.
Учебная литература для школ, а также детская литература гарнитуры выбираются в зависимости от возраста читателей и назначения издания.
Зависимость от кегля. Чем меньше кегль, тем менее контрастные гарнитуры следует выбирать.
Зависимость от бумаги. Например, нельзя использовать шрифты с тонкими штрихами и засечками при печати на газетной бумаге — очко будет рваным.
Выбор кегля
Наиболее удобочитаемым принято считать 10-й кегль.
КЕРНИНГ — измененный интервал между некоторыми буквами слова, регулирование пробела между знаками текста, особенно при наборе малых форматов. К. улучшает вид текста и его удобочитаемость.
Создание документов.
При создании текстовых документов возможно использование нескольких способов ввода информации.
-
Ввод информации вручную с клавиатуры. В этом случае, как правило, автор сам создает файл и сам является собственником авторских прав на этот текст, которые возникают непосредствено при создании этого текста;
-
Поиск и использование информации в глобальной компьютерной сети, базах данных, созданных без участия человека, использующего хранящуюся в них информацию. Как правило, изучаются работы других исследователей по соответствующей теме, и в создающийся файл вставляются фрагменты чужих текстов;
-
Третий способ обычно применяется при отсутствии доступа к чужим базам данных либо затруднениях в поиске информации в глобальных компьютерных сетях, при условии наличии информации на бумажных носителях. В этом случае необходимая информация переводится в цифровой вид с помощью сканера или аналогичного устройства, затем полученный файл переводится в текстовой формат при помощи программы распознавания текста. В этом случае полученный файл требует дополнительной обработки для исправления ошибок программы распознования.
Оптическое распознавание символов (англ. optical character recognition, OCR) — это механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учета в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тесту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.
Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.
Затем работа ведется как с обычным текстовым файлом.
Последние два способа обычно ведут к нарушению авторских прав.
Согласно статье 1259 Гражданского кодекса Российской Федерации, объектами авторского права являются произведения науки, литературы и искусства независимо от достоинств и назначения произведения, а также от способа его выражения. Авторское право распространяется как на обнародованные, так и на необнародованные произведения, существующие в какой-либо объективной форме. В соответствии со статьей 1259 ГК РФ, для возникновения, осуществления и защиты авторских прав не требуется регистрация произведения или соблюдение каких-либо иных формальностей. В отношении программ для ЭВМ и баз данных возможна регистрация, осуществляемая по желанию правообладателя.
Часть произведения (в том числе название произведения или его персонаж), если по своему характеру она может быть признана самостоятельным результатом творческого труда автора и выражена в объективной форме (см. виды объектов авторского права), также является объектом авторского права.
Допускается без согласия автора и без выплаты авторского вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и/или источника заимствования:
(в редакции Федерального закона от 18 декабря 2006 года № 230-ФЗ)
- цитирование в оригинале и в переводе в научных, исследовательских, полемических, критических и информационных целях из правомерно обнародованных произведений в объёме, оправданном целью цитирования, включая воспроизведение отрывков из газетных и журнальных статей в форме обзоров печати;
- использование правомерно обнародованных произведений и отрывков из них в качестве иллюстраций в изданиях, в радио- и телепередачах, звуко- и видеозаписях учебного характера в объёме, оправданном поставленной целью;
- воспроизведение в газетах, передача в эфир или сообщение по кабелю для всеобщего сведения правомерно опубликованных в газетах или журналах статей по текущим экономическим, политическим, социальным и религиозным вопросам или переданных в эфир произведений такого же характера в случаях, когда такие воспроизведение, передача в эфир или сообщение по кабелю не были специально запрещены автором;
- воспроизведение в газетах, передача в эфир или сообщение по кабелю для всеобщего сведения публично произнесенных политических речей, обращений, докладов и других аналогичных произведений в объёме, оправданном информационной целью. При этом за автором сохраняется право на опубликование таких произведений в сборниках;
- воспроизведение или сообщение для всеобщего сведения в обзорах текущих событий средствами фотографии, путем передачи в эфир или сообщения для всеобщего сведения по кабелю произведений, которые становятся увиденными или услышанными в ходе таких событий, в объёме, оправданном информационной целью. При этом за автором сохраняется право на опубликование таких произведений в сборниках;
- воспроизведение правомерно обнародованных произведений без извлечения прибыли рельефно-точечным шрифтом или другими специальными способами для слепых, кроме произведений, специально созданных для таких способов воспроизведения.
Допускается без согласия автора и без выплаты авторского вознаграждения воспроизведение, передача в эфир или сообщение для всеобщего сведения по кабелю произведений архитектуры, фотографии, изобразительного искусства, которые постоянно расположены в месте, открытом для свободного посещения, за исключением случаев, когда изображение произведения является основным объектом таких воспроизведений, передачи в эфир или сообщения для всеобщего сведения по кабелю или когда изображение произведения используется для коммерческих целей.
Кодировка символов.
Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).
Виды кодировок:
ASCII (англ. American Standard Code for Information Interchange) — американская стандартная кодировочная таблица для печатных символов и некоторых специальных кодов. В американском варианте английского языка произносится [э́ски], тогда как в Великобритании чаще произносится [а́ски]; по-русски произносится также [а́ски] или [аски́].
ASCII представляет собой кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов. Изначально разработанная как 7-битная, с широким распространением 8-битного байта ASCII стала восприниматься как половина 8-битной. В компьютерах обычно используют расширения ASCII с задействованной второй половиной байта (например КОИ-8).
ANSI-графика — расширение ASCII-графики. Этот вид цифровой графики создаёт картинку из символов, но использует не только символы, предлагаемые кодировкой ASCII, а все 224 печатных символа, 16 цветов шрифта и 8 фоновых цветов, поддерживаемых драйвером ANSI.SYS, который использовался в системе DOS. ANSI-графика использовалась в BBS.
Файлы часто имели расширение .ans. Для их создания часто использовались специальные программы, в частности пакет TheDraw, написанный Яном Э. Дэвисом (Ian E. Davis) в 1986 году. Этот пакет, среди прочего, позволял создавать анимацию, а также имел «шрифты», то есть наборы больши́х символов, составленных из маленьких.
Почти полное исчезновение BBS и DOS резко уменьшило популярность ANSI-графики. Среды DOS под Windows NT не используют ANSI.SYS; даже просмотр ANSI-графики в среде Windows NT требует специальных программ. Однако, графика ANSI по-прежнему поддерживается консольным текстовым драйвером Linux.
Юнико́д или Унико́д (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.
Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.). Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
Стандарт состоит из двух основных разделов: универсальный набор символов (англ. UCS, universal character set) и семейство кодировок (англ. UTF, Unicode transformation format). Универсальный набор символов задаёт однозначное соответствие символов кодам — элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS.
Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем.[7] Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F
Текстовые редакторы
Те́кстовый реда́ктор — компьютерная программа, предназначенная для обработки текстовых файлов, такой как создание и внесение изменений.
Текстовый процессор — вид прикладной компьютерной программы, предназначенной для производства (включая набор, редактирование, форматирование, иногда печать) любого вида печатной информации. Иногда текстовый процессор называют текстовым редактором второго рода.
Текстовыми процессорами в 1970-е — 1980-е годы называли предназначенные для набора и печати текстов машины индивидуального и офисного использования, состоящие из клавиатуры, встроенного компьютера для простейшего редактирования текста, а также электрического печатного устройства. Позднее наименование «текстовый процессор» стало использоваться для компьютерных программ, предназначенных для аналогичного использования.
Текстовые процессоры, в отличие от текстовых редакторов, имеют больше возможностей для форматирования текста, внедрения в него графики, формул, таблиц и других объектов. Поэтому они могут быть использованы не только для набора текстов, но и для создания различного рода документов, в том числе официальных.
Режимы работы текстовых редакторов:
WYSIWYG (произносится [wɪziwɪɡ], является аббревиатурой от англ. What You See Is What You Get, «что видишь, то и получишь») — свойство прикладных программ, в которых содержание отображается в процессе редактирования и выглядит макcимально близко похожим на конечную продукцию, которая может быть печатным документом, веб-страницей, слайд-презентацией или даже использоваться для освещения театральных событий.
Rich Text Format (RTF, «формат обогащённого текста» (rich с английского — богатый) — проприетарный межплатформенный формат хранения размеченных текстовых документов, предложенный группами программистов, основавшими компании Microsoft и Adobe, как метатэговский формат для редактора Word в 1982 году. С тех пор спецификация формата несколько раз изменялась. RTF-документы поддерживаются всеми современными текстовыми процессорами. После разрыва отношений с Microsoft компания Adobe продолжила развитие метатэговского языка, заложенного в основу RTF, создав в 1985 году язык PostScript.
DOC - Расширение .DOC часто использовалось для обозначения простых текстовых файлов без форматирования, однако позже стало использоваться для двоичных форматов с разметкой.
В 1990-х корпорация Microsoft стала использовать расширение для серии проприетарных форматов файлов своего текстового процессора Microsoft Word. В результате монополии Microsoft на рынке офисных продуктов «DOC» стало синонимом этого формата файлов. Другие значения расширения «.doc» практически вышли из употребления на платформе IBM PC.
Двоичные файлы формата DOC содержат большее количество информации о форматировании текста (например, сценарии), чем файлы документов, использующие другие форматы Microsoft (RTF и др.), но хуже совместимы с текстовыми редакторами сторонних разработчиков.
ΤΕΧ (обычным текстом — TeX; произносится «тех») — система компьютерной вёрстки, разработанная американским профессором информатики Дональдом Кнутом в целях создания компьютерной типографии. В неё входят средства для секционирования документов, для работы с перекрёстными ссылками. Многие считают TeX лучшим способом для набора сложных математических формул. В частности, благодаря этим возможностям, TeX популярен в академических кругах, особенно среди математиков и физиков.
Название произносится как «тех» (от греч. τέχνη — «искусство», «мастерство»). В написании буква E опущена ниже T и X. Внутри самого TeX’а название форматируется как ΤΕΧ.
В отличие от обыкновенных текстовых процессоров и систем компьютерной вёрстки, построенных по принципу WYSIWYG, в ΤΕΧ’е пользователь лишь задает текст и его структуру, а ΤΕΧ самостоятельно на основе выбранного пользователем шаблона форматирует документ, заменяя при этом дизайнера и верстальщика. Документы набираются на собственном языке разметки в виде обычных ASCII-файлов, содержащих информацию о форматировании текста или выводе изображений. Эти файлы (обычно имеющие расширение «.tex») транслируются специальной программой в файлы «.dvi» (device independent — «независимые от устройства»), которые могут быть отображены на экране или напечатаны. DVI-файлы можно специальными программами преобразовать в PostScript, PDF или другой электронный формат.
PostScript (Постскрипт) — язык описания страниц, в основном используемый в настольных издательских системах. Postscript был разработан Джоном Уорноком и Чаком Гешке из Adobe Systems в начале 80-х гг. Исходно Postscript использовался как ядро механизма печати компьютеров Apple, но вскоре стал широко распространенным стандартом для большинства компьютерных систем. Интерпретаторы Postscript (в виде программных или аппаратных компонентов) для печати документов присутствуют практически во всех современных компьютерных системах. В Postscript используется модель изображения текста (или рисунков) на чистой странице. Когда страница готова, она выводится на печать и начинается «прорисовка» изображения очередной страницы. Это есть не что иное, как метод компиляции. Каждый документ Postscript обычно представляет собой программу, которая печатает на принтере (или отображает на экране монитора) следующие друг за другом страницы.