Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальная металлургическая академия Украины

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ПР4.doc

Скачиваний:

Добавлен:

06.05.2019

Размер:

75.78 Кб

Скачать

☆

1 / 21 2 > Следующая >>>

Практическая работа №4

Работа с текстовыми файлами

Цель – знакомство с командами, работающими с текстовыми файлами

Характеристика рассмотренных в работе команд и примеры их использования

Команда-фильтр grep: поиск строки по файлам

Команда grep – одна из самых полезных и часто используемых. Она столь же важна для нахождения файлов с нужным содержимым, как ls -- для нахождения файлов с нужным именем. Поэтому стоит хорошо освоить grep -- умелое владение ей позволяет сэкономить массу времени и сил. Кроме того, регулярные выражения широко используются во многих других программах.

Часто возникает задача: надо найти, в каком файле встречается некое слово или фраза. Для этого служит команда "grep". Она ищет "образец" в указанных файлах (или в стандартном вводе, если файлы не указаны) и печатает все строки, в которых он встречается. То есть, она предназначена для поиска строк, соответствующих шаблону, заданному в параметре Шаблон. Каждая найденная строка записывается в стандартный поток вывода.

В шаблоне (образце поиска) могут быть указаны специальные символы *, ^, ?, [, ], $, $, \{, или \}. Например, для поиска строк в файле pgm.s, начинающихся с любой буквы в любом регистре, введите:

grep "^[a-zA-Z]" pgm.s

Нажмите Enter.

Появится список строк файла pgm.s, которые начинаются с какой-либо буквы.

Вообще-то, образец поиска для grep -- это не просто строка, а так называемое "регулярное выражение", некоторые символы в котором приобретают специальное значение:

"." означает "любой символ".
"*" -- любое количество повторений (0 и больше) предшествующего символа.
"^" -- начало строки.
"$" -- конец строки.
Специальное значение имеют также символы ?, [, ], {, }, |, + , \.

Поскольку большинство этих символов имеют специальное значение и для оболочки, то образец следует указывать в одинарных кавычках (прямых апострофах).

Для просмотра всех строк файла sort.c, которые не совпадают с шаблоном, введите:

grep -v bubble sort.c

Нажмите Enter.

Появится список строк файла sort.c, не содержащих слова bubble.

Для просмотра всех строк вывода команды ls, которые содержат слово staff, введите:

ls -l | grep staff

Нажмите Enter.

Пример (найти строку "no"):

grep no *

errs:/bin/ls: file10: No such file or directory

errs:/bin/ls: file11: No such file or directory

proverbs:Dead men tell no tales.

Каждая строка предваряется именем файла, в котором она найдена, и двоеточием; если указан только один файл (или стандартный ввод), то этого не делается -- просто печатается найденная строка.

С ключом "-i" grep ищет, не различая маленькие/заглавные буквы:

Пример (найти все символьные линки в директории /etc):

ls -l /etc | grep '^l'

lrwxrwxrwx 1 root root 21 Dec 9 20:55 initrunlvl -> ../var/run/initrunlvl

lrwxrwxrwx 1root root 38 Dec 9 21:04 localtime -> ../usr/share/zoneinfo/Asia/Novosibirsk

lrwxrwxrwx 1 root root 11 Dec 9 20:44 rmt -> ../sbin/rmt*

Здесь используется то, что для символьных линков ls первым символом строки (тип файла) выводит букву "l".

Если результат grep слишком большой и не помещается на экран, то его можно "переправить" команде просмотра, например, more. Пример (показать список всех поддиректорий из директории /usr/lib):

ls -l /usr/lib | grep '^d' | more

Вообще говоря, в конвейере может участвовать сколько угодно команд. Так, команда

ls -l /usr/doc | grep '^d' | grep 'lib' | more

делает почти то же, что и в предыдущем примере, но отбирает только те директории, в имени которых есть "lib".

Сравнение файлов (команда diff)

Команда diff предназначена для сравнения текстовых файлов. С ее помощью можно сравнивать как отдельные файлы, так и содержимое каталогов.

Если в качестве параметров команды diff заданы обычные файлы, расположенные в различных каталогах, то результат работы команды diff - список несовпадающих строк.

Например, для сравнения двух файлов введите:

diff chap1.bak chap1

Нажмите Enter.

Появится список несовпадающих строк файлов chap1.bak и chap1.

Например, для сравнения двух файлов с игнорированием пробелов введите:

diff -w prog.c.bak prog.c

Нажмите Enter.

В этом случае, если две строки будут отличаться только числом пробелов и табуляций между словами, команда diff -w будет считать их одинаковыми.

Подсчет числа слов, строк и байт в файле (команда wc)

По умолчанию команда wc подсчитывает число строк, слов и байт в файлах, указанных в параметре Файл. Если параметр Файл не задан, то данные читаются из стандартного потока ввода. Результат работы команды записывается в стандартный поток вывода и в нем указывается суммарное число строк, слов и байт во всех заданных файлах. Флаги команды определяют порядок вывода. Под словом понимается символьная строка, отделенная пробелом, символом табуляции или символом новой строки.

Если в команде заданы имена файлов, то эти имена выводятся вместе с результатом подсчета.

Например, для подсчета числа строк, слов и байт в файле с именем chap1 введите:

wc chap1

Нажмите Enter.

Появится число строк, слов и байт в файле chap1.

Например, для подсчета только числа слов и байт введите:

wc -cw chap*

Нажмите Enter.

Появится число байт и слов для каждого файла, имя которого начинается с символов chap, и общий результат.

Потоковый редактор sed

Команда имеет формат:

sed [ -n ] [ -e script ] [ -f sfile ] [ files ]

Команда копирует файлы (по умолчанию со стандартного входа) на стандартный выход, редактирует их в соответствии со своими(!) командами, размещенными в "script" (в командном файле или строке редактора [а не shell!]). По флагу "-f" берет берет файл команд из файла "sfile"; Если есть только опция "-e script", то флаг "-e" можно опустить. Флаг "-n" подавляет вывод (происходящий по умолчанию). "script" состоит из команд редактирования, по одной в строке, имеющих формат:

[ addr [ , addr ] ] cmd [ args ]

"sed" циклически преобразует входные строки в выходные.

Адреса "[ addr [ , addr ] ]" – это либо номера строк, либо последняя строка (символ "$"), либо регулярные выражения в стиле редактора "ed":

"\" используется в многострочных командах для экранирования продолжения строки.
"." совпадает с любым символом.
Если адреса не указаны - просматриваются все входные строки.
Если один адрес, то выбираются совпадающие строки.
Если заданы два адреса, выбираются строки в заданном интервале.
"!cmd" выполняется команда "cmd", для строк, которые не были выбраны по адресам.

Для следующих (основных) функций (команд) максимальное число допустимых адресов указано в скобках.

(1)a\ text Добавляет text после указанной строки

Команда:

who

Результат:

root tty1 Mar 13 17:23

mas tty2 Mar 13 18:50

sae tty6 Mar 13 17:24

sae tty5 Mar 13 17:24

Пример:

who | sed '2a\

новая строка'

Результат:

root tty1 Mar 13 17:23

mas tty2 Mar 13 18:50

новая строка

sae tty6 Mar 13 17:24

sae tty5 Mar 13 17:24

(2)c\ text Удаляет выбранные строки и заменяет их на "text'.

Пример:

who | sed '/sae/ c\

cтрока замены'

Результат:

root tty1 Mar 13 17:23

mas tty2 Mar 13 18:50

строка замены

(2)d Удаляет найденные строки

Пример:

who | sed '2,4d'

Результат:

root tty1 Mar 13 17:23

(1)i\ text Вставляет "text" на место выбранной строки. (сравните с "a\")

Пример:

who | sed '2i\

новая строка'

Результат:

root tty1 Mar 13 17:23

новая строка

mas tty2 Mar 13 18:50

sae tty6 Mar 13 17:24

sae tty5 Mar 13 17:24

(2)p Выводит найденные строки (используется с флагом "-n").

(1)q Выходит из "sed".

(2)r rfile Читает файл "rfile" и выдает на выход.

(2)s/reg_expr/rpl/flags Заменяет регулярное выражение "reg_expr" на "rpl" с учетом флагов "flags":

g	глобально (по всей строке)
p	выводить замены
w wfile	сохранять заменяемое в "wfile".

Пример:

who | sed 's/t/T/'

echo

who | sed 's/t/T/g'

Результат:

rooT tty1 Mar 13 17:23

mas Tty2 Mar 13 18:50

sae Tty6 Mar 13 17:24

sae Tty5 Mar 13 17:24

rooT TTy1 Mar 13 17:23

mas TTy2 Mar 13 18:50

sae TTy6 Mar 13 17:24

sae TTy5 Mar 13 17:24

(2)y/str1/str2/ Заменяет все вхождения символов "str1" соответствующими символами "str2". Длины строк должны быть одинаковыми.

Пример:

who | sed 'y/sae/SAE/'

Результат:

root tty1 MAr 13 17:23

mAS tty2 MAr 13 18:50

SAE tty6 MAr 13 17:24

SAE tty5 MAr 13 17:24

(2)! Cmd Команда(ы) "cmd" применяются к невыбранным строкам.

Пример:

who | sed '2,4!d'

Результат:

mas tty2 Mar 13 18:50

sae tty6 Mar 13 17:24

sae tty5 Mar 13 17:24

(1)= Выдает номера строк.

Пример:

who | sed =

Результат:

root tty1 Mar 13 17:23

mas tty2 Mar 13 18:50

sae tty6 Mar 13 17:24

sae tty5 Mar 13 17:24

(2){ } Скобки группируют команды.

1 / 21 2 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.08.201979.87 Кб4ПР1.doc
#
11.08.201975.26 Кб3ПР15.doc
#
01.04.20251.66 Mб0ПР26 Подготовка и установка windows xp.docx
#
01.04.202581.41 Кб0ПР29 Работа в командной строке. Создание и копи...doc
#
06.05.201975.78 Кб3ПР3.doc
#
06.05.201975.78 Кб3ПР4.doc
#
01.07.20251.72 Mб1ПР_ФПА_УП_2014.doc
#
28.08.201978.34 Кб2ПРАВИЛА ОФОРМЛЕННЯ ПОЯСНЮВАЛЬНОЇ ЗАПИСКИ.doc
#
01.07.2025234.25 Кб0Право кС.docx
#
09.11.2019305.86 Кб7правознавство.лекции .docx
#
12.08.201933.79 Кб2Практ роб №1 Економіка.docx