Библиотека сайта rus-linux.net
10.25. Использование awk с другими командами и с shell
Наибольшего эффекта awk достигает при использовании с другими программами. В этом подразделе обсуждаются некоторые способы взаимодействия программ awk с другими командами.
10.25.1. Функция system
Встроенная функция system (command_line) выполняет команду "command_line", которая может быть строкой, вычисляющей, например, sprintf. Функция system возвращает состояние выполненной команды.
Например:
$1 == "#include" { gsub (/[<>"]/, $2; system ("cat " $2}вызывает команду cat для печати файла, названного во втором поле каждой вводной записи, у которой первое поле #include, после разборки каждого <, > или ", которые должны присутствовать.
10.25.2. Взаимодействие с shell
Во всех приводимых примерах программа awk находилась в файле и из него осуществлялся вызов с помощью ключа -f, либо она представлялась в командной строке, заключенная в одиночные кавычки. Например:
awk '{ print $1 }' ...
Так как awk использует те же символы, что и shell (такие как $ и ", окружающие программу awk), одиночные кавычки обеспечат прохождение программы неизменной через shell к интерпретатору awk.
Пример. Команда addr осуществляет выборку файла addresslist для получения имени, адреса и телефона. Предположим, что addresslist содержит имена и адреса, в котором типичным входом является многострочная запись, такая как:
G. R. Emlin 600 Mountain Avenue Murray Hill, NJ 07974 201-555-1234
Записи разделяются одной пустой строкой. Вы можете выбрать список адресов с помощью командной строки, подобной:
addr EmlinЭто легко выполнить с помощью следующей программы:
awk ' BEGIN { RS = "" } /Emlin/ ' addresslist
Проблема состоит в том, чтобы получить различные шаблоны выборок при каждом запуске программ.
Существует несколько способов сделать это. Один из способов - это создать файл, названный addr, который содержит:
awk ' BEGIN { RS = "" } /'$1'/ ' addresslist
В программе awk один аргумент, хотя установлено два набора кавычек, но они не являются вложенными. $1 заключено в одиночные кавычки и видимо для shell; затем будет заменено на шаблон Emlin при вызове команды addr Emlin.
Второй способ реализации addr полагается на тот факт, что shell заменяет параметры $ в двойных кавычках:
awk " BEGIN { RS = \"\" } /$1/ " addresslist
Кроме того, вы должны защитить кавычки, определяющие RS символами \, так что shell направит их awk без интерпретации. $1 распознается как параметр и shell заменяет его на шаблон, когда команда addr вызывается с шаблоном.
Третий способ реализации addr - использовать ARGV для передачи регулярного выражения программе awk, которая читает список адресов с помощью getline:
awk ' BEGIN { RS = "" while ( getline < "addresslist" ) if ($0 ~ ARGV[1] print $0 } ' $*
Вся обработка выполняется в "действии" оператора BEGIN.
Обратите внимание, что регулярное выражение может быть передано addr. В частности, возможно отыскать отдельно адрес, или номер телефона, или имя.