- •1.Понятие информации
- •2. Представление числовой и текстовой информации
- •3. Представление графической информации в компьютере
- •4.Представление звуковой информации в компьютере
- •5.Современный компьютер
- •6.Пользовательский интерфейс
- •7.Архитектура и устройство персонального компьютера
- •8.Технологии компьютерной памяти
- •(9-11 Объеденены)
- •10.Системное программное обеспечение (понятие по, функции и типы операционных систем, параметры и примеры современных ос, понятие и назначение драйверов и утилит).
- •11.Прикладное программное обеспечение (понятие прикладного по, основные группы прикладных программ, программы для работы с текстом, текстовые редакторы и процессоры, основные возможности ms Word).
- •12.Компьютерные сети
- •13. Интернет
- •14.Интернет-сервисы
- •15.Технологии информационного поиска
- •16. Информационная безопасность
- •17. Вредоносное программное обеспечение
- •18. . Искусственный интеллект
- •19. Технологии компьютерной лексикографии
- •20. . Дистанционное обучение
- •21. Технологии оптического распознавания
- •Ocr используется:
- •Характеристики ocr:
- •Программы ocr:
- •Распознавание рукописных текстов
- •22. Текстовые редакторы и процессоры
- •23.Ввод и редактирование текста.
- •24. Авторедактирование текста
- •25. Форматирование текста
- •26. Верстка
- •27.Стили
- •28.Корректура
- •29 Работа с таблицами в ms Word
- •30. Статистическая обработка текста
- •31. Графические возможности ms Word
- •32. Архиваторы
- •33. Браузер
- •34.Компьютерные языки
- •35.Создание презентаций
- •36.Portable Document Format
2. Представление числовой и текстовой информации
Система счисления - способ записи чисел с помощью специальных знаков (цифр).
Классификация систем счисления
Позиционные
Вес каждой цифры изменяется в зависимости от ее положения (позиции) в последовательности цифр, изображающих число. Например, в числе 757,7 первая семерка означает 7 сотен, вторая – 7 единиц, а третья – 7 десятых долей единицы.
Сама же запись числа 757,7 означает сокращенную запись выражения:
700+50+7+0,7==7*102+5*101+7*100+7*10-1=757,7
Значение каждой цифры зависит от ее положения (позиции) в числе.
Непозиционные
В непозиционных системах вес цифры (т.е. вклад, который она вносит в значение числа) не зависит от ее позиции в записи числа.
Так в римской СС в числе XXXII (32) вес цифры X в любой позиции равен просто десяти.
Значение цифры не зависит от места (позиции) в числе.
Виды:
двоичная система счисления (все числа представлены с помощью только двух цифр: 0 и 1).
восьмиричная система счисления (цифры 0, 1,...7)
шестнадцатеричная (кроме привычных 0,…9 в качестве цифр используются буквы A,B,C,D,E,F)
Ввод и вывод числовой информации осуществляется в удобной человеку десятеричной системе счисления
Число и цифра различаются по значению и происхождению.
Число — единица счёта, выражающая количество (один дом, два дома, три дома и т.д.).
Цифра — знак (символ), обозначающий значение числа.
Системы счисления в компьютере
В компьютере чаще всего используется двоичная система счисления (все числа представлены с помощью только двух цифр: 0 и 1).
Один двоичный разряд (0 или 1) принят за единицу информации бит.
Восемь бит составляют один байт.
Для решения ряда задач используются восьмиричная система счисления (цифры 0, 1,...7) и шестнадцатеричная (кроме привычных 0,…9 в качестве цифр используются буквы A,B,C,D,E,F).
Ввод и вывод числовой информации осуществляется в удобной человеку десятеричной системе счисления, а их преобразование производит компьютер под управлением программ по специальному алгоритму.
Алгоритм преобразования:
При переводе десятичного числа в систему с основанием q (q = 2,8,16) его необходимо последовательно делить на q до тех пор, пока не останется остаток, меньший или равный q-1.
Число с основанием q записывается как последовательность остатков от деления, записанных в обратном порядке, начиная с последнего.
Для перевода чисел из одной системы счисления в другую удобно использовать стандартную программу Калькулятор (Вид: Программист).
Запуск: Программы/Стандартные/Калькулятор.
Hex - шестнадцатеричная система счисления
Dec - десятеричная система счисления
Oct - восьмеричная система счисления
Bin - двоичная система счисления
Текст в компьютере
Компьютер обрабатывает информацию представленную в числовой форме.
Для представления текста его символы кодируются двоичными числами.
При вводе в ПК каждая буква кодируется, а при выводе (на экран или печать) по этим числам строятся изображения букв.
Кодировка символов - однозначное соответствие между набором букв и набором чисел.
Таблица символов ASCII
Первоначально для представления печатных символов определили семиразрядные числа (состоящие из 7 двоичных цифр и занимающие в памяти 7 бит). Это давало 128 (два в седьмой степени = 128) чисел для кодирования символов американского английского: 27 строчных букв, 27 прописных, 10 цифр, знаки пунктуации и т.д.) Именно такой, 7-битной, является таблица символов ASCII (American standard code for information interchange).
Символы ASCII являются материалом для ASCII art.
Восьмибитные кодировки
В современных компьютерах минимально адресуемая единица памяти — 8-битный байт, поэтому там используются 8-битные кодировки символов.
8-битная ASCII позволяет закодировать 256 символов (два в восьмой степени). Каждый символ кодируется 8 битами (8-разрядным двоичным числом).
Windows 1251 - 8-битная кодировка для операционных систем MS Windows.
Другие 8-разрядные кодировки: LATIN-1 (OEM), ISO 8859-5, КОИ-8.
Было создано множество разных 8-битных кодировок в связи с расширением круга поддерживаемых языков. Возникли проблемы отображения документов в неправильной кодировке, ограниченности набора символов, преобразования одной кодировки в другую, дублирования шрифтов.
Было решено создать единую 16-битную кодировку для всех языков.
ЮНИКОД
UNICODE (UNIversal CODE) - стандарт 16-разрядного кодирования символов. В 16-разрядном UNICODE можно закодировать 65 536 символов.
Стандарт UNICODE предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (Unicode® Consortium, Unicode Inc.), объединяющей крупнейшие IT-корпорации.
UNICODE включает практически все современные письменности, в том числе:
арабскую,
армянскую,
бенгальскую,
бирманскую,
греческую,
грузинскую,
деванагари,
иврит,
кириллицу,
коптскую,и др
С академическими целями в UNICODE добавлены многие исторические письменности, в том числе:
руны,
древнегреческая,
египетские иероглифы,
клинопись,
письменность майя,
этрусский алфавит.
В UNICODE представлен широкий набор пиктограмм, математических и музыкальных символов.
Стандарт UNICODE состоит из универсального набора символов (UCS, Universal Character Set) и семейства кодировок (UTF, Unicode Transformation Format): UTF-8, UTF-16 и UTF-32.
UTF-8 — обеспечивает наилучшую совместимость со старыми с8-битными кодировками.
UTF-8 изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком.
Ограничения UNICODE:
пока не реализовано изображение «длинных» надстрочных символов, простирающихся над несколькими буквами для церковнославянского языка.
многие символы из языков с алфавитами на основе кириллицы не имеют монолитных форм, другие могут быть представлены набором базового символа с последующим диакритическим знаком.
не предусмотрено традиционное написание сверху вниз для китайского, корейского и японского языков
китайские иероглифы с разными начертаниями в китайском, японском (кандзи) и корейском (ханчча) письме обозначаются одним и тем же символом.
29.01.2010 По данным Google доля кодировки Unicode в интернет-документах приблизилась к 50%.
Unicode обогнал все другие кодировки в мае 2008 года. Тогда его доля составляла около 25%, как и доли ASCII- и западноевропейской кодировок. В 2001 году доля ASCII-кодировки составляла около 55%. Сейчас она снизилась до 20%. Доли других популярных национальных кодировок, в том числе и распространенной в России CP-1251 не превышают 5-10%.
Понятие текста
В семиотике: ТЕКСТ (от лат. textus - ткань, соединение) - объединенная смысловой связью последовательность знаковых единиц любой формы коммуникаций (письмо, песня, танец, рисунок, обряд).
В языкознании: ТЕКСТ - объединенная смысловой связью последовательность вербальных единиц (устный и письменный).
В информатике: ТЕКСТ - форма представления данных в виде последовательности символов (букв, знаков пунктуации, специальных символов) выбранного языка, содержательно рассматриваемой как единое целое.
Электронный текст - это текст, записанный в памяти компьютерной системы. На диски записываются документы, книги, журналы, справочники, словари... .
Гипертекст (hypertext) - текст, представленный в виде ассоциативно связанных блоков, переход между которыми осуществляется с помощью гиперссылок.
Гипертекст может быть расположен в различных частях компьютерной сети. Тогда взаимодействие компонентов определяется протоколом (соглашением). В сети Internet это гипертекстовый протокол передачи. HTTP (HyperText Transfer Protocol) - описывающий процедуры обмена блоками гипертекста. Создание гипертекстов осуществляется с помощью гипертекстового языка разметки документов. (HyperText Markup Language, HTML). Главной задачей HTML является осуществление пользователями гипертекстовой разметки обычных текстов .