Filtres

mardi 16 septembre 2008
par Jerome ROBERT
popularité : 5%

X. Commandes et filtres

A. Introduction

Un filtre est une commande qui lit des informations sur l'entrÃ©e standard, les traite par ligne, puis qui affiche ses rÃ©sultats sur la sortie standard :

En aucun cas le contenu du fichier d'origine n'est modifiÃ© !

Nous connaissons dÃ©jÃ des filtres : cat, more.

Nous allons Ã©tudiÃ©s quelques autres, la plupart en partie seulement : n'hÃ©sitez pas Ã consulter la man page associÃ©e.

B. les commandes head et tail

head -N fic
affiche les N premiÃ¨res lignes de fic.

tail -N fic
affiche les N derniÃ¨res lignes de fic.

tail +N fic
affiche de la ligne N Ã la fin de fic.

Par dÃ©faut, N vaut 10.

C. La commandes wc

wc Compter les lignes, mots et caractÃ¨res dâ€™un fichier

wc [ -lwc ] fichier

-l nombre de lignes

-w nombre de mots

-c nombre de caractÃ¨res

exemple:

$ wc fic

45 440 3053 fic

$ wc -l fic

45 fic

$ wc -cw fic

3053 440 fic

$ wc toto tutu titi

1 6 29 toto

46 448 3105 tutu

40 462 1773 titi

87 916 4907 total

Elle permet la recherche de fichiers, suivant de multiples critÃ¨res, Ã partir dâ€™un (ou plusieurs) rÃ©pertoire(s). La recherche a lieu dans toute la sous-arborescence. Des notations complÃ©mentaires permettent dâ€™effectuer des recherches composÃ©es ( ET , OU ).

find rÃ©pertoire options actions

Quelques options

-name fichier	Recherche sur le nom ( protÃ©ger les caractÃ¨res spÃ©ciaux vis Ã vis du shell )
-perm mode	Recherche sur les permissions ( masque en octal )
-newer fichier	Recherche des fichiers plus rÃ©cents quâ€™un fichier donnÃ©
-user login	Recherche sur le propriÃ©taire
-mtime +n	Fichiers modifiÃ©s depuis plus de n jours
-mtime -n	Fichiers modifiÃ©s depuis moins de n jours
-atime +n	Fichiers consultÃ©s depuis plus de n jours
-atime -n	Fichiers consultÃ©s depuis moins de n jours
etc ...

Actions ( exclusives )

-print	Afficher les rÃ©sultats
-exec	Lancer une commande pour chaque fichier trouvÃ©
-ok	Lancer une commande pour chaque fichier trouvÃ©, aprÃ¨s demande de confirmation

Exemples de manipulation de la commande find

$ find . -name .??*rc -print

UX:find: ERROR: Illegal option -- .mwmrc

UX:find: TO FIX: Usage: find path-list predicate-list

$ find . -name '.??*rc' -print

./.exrc

./.mwmrc

./.cshrc

$ find /home -user stage1 -print

/home/stage1

/home/stage1/.profile

/home/stage1/.rhosts

/home/stage1/.exrc

/home/stage1/.mwmrc

/home/stage1/.xsession

/home/stage1/.sh_history

/home/stage1/toto

/home/stage1/tutu

UX:find: ERROR: Cannot read dir /home/ftp/usr: Permission denied

UX:find: ERROR: Cannot read dir /home/ftp/etc: Permission denied

UX:find: ERROR: Cannot read dir /home/ftp/dev: Permission denied

Exemples de manipulation de la commande find ( suite )

$ find /home -user stage1 -name '.??*rc' -print

/home/stage1/.exrc

/home/stage1/.mwmrc

UX:find: ERROR: Cannot read dir /home/ftp/usr: Permission denied

UX:find: ERROR: Cannot read dir /home/ftp/etc: Permission denied

UX:find: ERROR: Cannot read dir /home/ftp/dev: Permission denied

$ find . $ -name '.??*rc' -o -mtime -1 $ -print

./.exrc

./.mwmrc

./.sh_history

./main.c

$ find /home/stage1 /home/stage2 -name '*toto*' -print

/home/stage1/toto

/home/stage2/toto

/home/stage2/toto1

/home/stage2/toto2

$ find /home -name .profile -ok wc {} \;

< wc ... /home/boss/.profile >? y

20 124 660 /home/boss/.profile

< wc ... /home/stage1/.profile >? n

< wc ... /home/stage2/.profile >? n

< wc ... /home/stage3/.profile >? y

25 39 390 /home/stage3/.profile

< wc ... /home/stage4/.profile >? n

$ find /home -name .profile -exec wc {} \;

20 124 660 /home/boss/.profile

25 39 390 /home/stage1/.profile

25 39 390 /home/stage2/.profile

25 39 390 /home/stage3/.profile

25 39 390 /home/stage4/.profile

$ find . -name core -ok rm {} \;

< rm ... ./core >? y

< rm ... ./rep/core >? y

E. la commande sort

sort [options] [ +pos1 [ -pos2 ] ] fichiers...

$ sort -d fic tri suivant l'ordre du dictionnaire.

$ sort -n fic tri numÃ©rique.

$ sort -r fic tri en ordre dÃ©croissant.

$ sort -u fic conserve une seule occurrence de lignes identiques.

$ sort -t: -k3 fic tri sur le troisiÃ¨me champ (sÃ©parateur :)

Lâ€™unitÃ© de traitement est la ligne ou le mot ( champ ). Le critÃ¨re de tri par dÃ©faut est le code Ascii. De multiples options permettent de choisir des critÃ¨res plus rÃ©alistes ( alphabÃ©tique, numÃ©rique ... ). Si aucun fichier n'est donnÃ© en argument ou si on utilise le caractÃ¨re - ( signe moins ), la commande traite son entrÃ©e standard. Le rÃ©sultat du tri est Ã©crit sur la sortie standard.

Options usuelles

-u	Suppression de lignes multiples dans le rÃ©sultat
-o fichier	Sauvegarde du rÃ©sultat dans le fichier spÃ©cifiÃ© ( Ce fichier peut Ãªtre un des fichiers d'entrÃ©e )
-d	Seuls les lettres, chiffres, espaces et tabulations sont significatifs pour le tri
-f	Minuscules et MAJUSCULES sont confondues
-n	Tri numÃ©rique
-r	RÃ©sultat en ordre dÃ©croissant
-tcar	RedÃ©finition du caractÃ¨re sÃ©parateur
-b	Option quasi-indispensable dans les tris alphabÃ©tiques ( pour une bonne gestion du nombre variable d'espaces entre les champs )
etc...

Utilisation des champs

Les notations +pos1 [ -pos2 ] permettent dâ€™indiquer que le tri doit sâ€™effectuer uniquement sur certains champs de la ligne. Il est possible dâ€™indiquer plusieurs couples de position pour opÃ©rer un tri Ã plusieurs passes.

Ces positions sâ€™expriment sous la forme m.n Ã©ventuellement suivie d'une ou plusieurs options parmi b , d , f , i , n ou r .

m Nombre de champs Ã sauter depuis le dÃ©but de la ligne

n Nombre de caractÃ¨res Ã sauter depuis le dÃ©but du champ

Quelques exemples

sort +1 -2 fichier	Tri ( critÃ¨re Ascii ) sur le deuxiÃ¨me champ
sort -rn -o fichier +4 -5 fichier	Tri ( critÃ¨re numÃ©rique, ordre dÃ©croissant ) sur le cinquiÃ¨me champ et rÃ©sultat dans le fichier dâ€™entrÃ©e
sort -t: +2n -3 /etc/passwd	Tri du fichier /etc/passwd selon le numÃ©ro de Â«loginÂ» ( redÃ©finition du sÃ©parateur de champs )
sort +3.0bf -3.2bf fichier	Tri sur les deux premiers caractÃ¨res du quatriÃ¨me champ ( minuscules et majuscules confondues )
sort +3n -4 +0fb -1 fichier	Tri sur le quatriÃ¨me champ ( critÃ¨re numÃ©rique ) puis deuxiÃ¨me passe sur le premier champ ( minuscules et majuscules confondues )

F. la commande cut

cut extrait certains champs ou certaines colonnes(1 caractÃ¨re de large) d'un fichier texte

La commande cut extrait des sous-parties verticales d'un fichier texte.

cut peut travailler sur des champs (sÃ©parÃ©s par le caractÃ¨re suivant l'option -d ou par dÃ©faut par une tabulation). La plupart des fichiers systÃ¨mes d'Unix contiennent des champs sÃ©parÃ©s par le caractÃ¨re ':'

cut [ options ] fichiers

Options

-d car	DÃ©finition du sÃ©parateur de champs ( l'espace devra Ãªtre dÃ©fini entre "" )
-f liste	Liste des numÃ©ros des champs Ã extraire
-c liste	Liste des positions des caractÃ¨res Ã extraire

Dans certains cas (tel que la sortie de la commande who) les diffÃ©rentes informations ne sont pas sÃ©parÃ©es par un caractÃ¨re spÃ©cial mais par un nombre variable de blancs. On est donc amenÃ© Ã utiliser la commande cut sur des colonnes (1 caractÃ¨re de large).

Exemples :

$ cut -c12-18,20-25 fich	rÃ©cupÃ¨re les colonnes 12 Ã 18 et 20 Ã 25
$ cut -f1,6 -d: /etc/passwd	extrait les champs 1 et 6 dÃ©limitÃ©s par :

<
a) NumÃ©rotation des colonnes ou des champs

A-B	de A Ã B inclus
A-	de A Ã la fin (dernier)
-B	du dÃ©but (premier) Ã B
A,B	A et B

Exemple :

$ cut -d: -f 1,3,6-7 /etc/passwd

root:0:/:/sbin/ksh

daemon:1:/:

bin:2:/usr/bin:

sys:3:/:

..............

stage1:1001:/home/ecole1:/usr/bin/ksh

stage2:1002:/home/ecole2:/usr/bin/ksh

..............

$ echo Bonjour cher ami | cut -d" " -f 1,3

Bonjour ami

$ echo Bonjour cher ami | cut -c 1-3,14-16

Bonami

$ echo Bonjour cher ami | cut -c 8-

cher ami

G. la commande grep

grep recherche des lignes dans un fichier texte et les affiche sur la sortie standard

syntaxe : grep motifRecherchÃ© fichier [ fichier2 ...]

Le motif est une expression rÃ©guliÃ¨re. Sans autre option , grep retourne l'ensemble des lignes contenant le motif indiquÃ© (mÃªme s'il n'est qu'une partie d'un mot).

Ces filtres permettent de rechercher des expressions littÃ©rales ou Â«rÃ©guliÃ¨resÂ» dans des fichiers.

Les expressions rÃ©guliÃ¨res consistent en un vocabulaire permettant dâ€™exprimer une sÃ©mantique puissante de recherche ( voir une premiÃ¨re prÃ©sentation dans le chapitre 3 ).

Les lignes comportant les expressions recherchÃ©es sont affichÃ©es sur la sortie standard.

Il y a trois filtres :

grep
Recherche d'expressions littÃ©rales et/ou rÃ©guliÃ¨res

egrep
Accepte des expressions plus riches que Â«grepÂ»

fgrep
Ne traite que des expressions littÃ©rales mais est plus compact et performant

Quelques Options

-i	MAJUSCULES et minuscules sont confondues
-v	Les lignes ne comportant pas l'expression
-x	Les lignes exactement identiques Ã l'expression ( Â«fgrepÂ» seulement )
-c	Afficher le nombre de lignes trouvÃ©es
-l	Afficher uniquement les noms des fichiers
-n	Chaque ligne est prÃ©cÃ©dÃ©e de son numÃ©ro dans le fichier
-e expr	Permet de chercher une expression commenÃ§ant par - ( signe moins )( ne fonctionne pas avec Â«grepÂ» )
-f fichier	Les expressions cherchÃ©es sont dÃ©crites dans un fichier ( une par ligne )( ne fonctionne pas avec Â«grepÂ» )

Quelques Expressions RÃ©guliÃ¨res

^	DÃ©but de ligne
$	Fin de ligne ( se place en fin d'expression )
.	PrÃ©sence dâ€™un caractÃ¨re quelconque
[caractÃ¨res]	Un caractÃ¨re parmi un ensemble
[^caractÃ¨res]	Un caractÃ¨re ne figurant pas dans lâ€™ensemble
car*	Un nombre quelconque d'apparitions du caractÃ¨re ( Ã©ventuellement 0 )
exp1\|exp2	Le caractÃ¨re \| signifie OU et relie deux expressions ( egrep )

Notations frÃ©quentes et utiles

^$	Ligne vide ( un dÃ©but et une fin )
.	Ligne non vide
.*	Â«Reste de la ligneÂ» ou Â«ligne complÃ¨teÂ» suivant le contexte

Quelques exemples

grep '^abc' fichier	Lignes commenÃ§ant par la chaÃ®ne Â«abcÂ»
grep '^[abc]' fichier	Lignes commenÃ§ant par a ou b ou c
grep â€˜^[^0-9]â€™ fichier	Lignes ne commenÃ§ant pas par un chiffre
grep 'abc.$' fichier	Lignes se terminant par la chaÃ®ne Â«abcÂ» suivie dâ€™un caractÃ¨re quelconque
fgrep -f motifs fichier	Recherche des expressions littÃ©rales indiquÃ©es dans le fichier Â«motifsÂ»
grep -n '^' fichier	NumÃ©roter toutes les lignes ( toutes les lignes ont un dÃ©but )
grep -i 'toto $' fichier*	Lignes se terminant par la chaÃ®ne Â«totoÂ» ( minuscules ou majuscules ) suivie dâ€™un nombre quelconque dâ€™espaces
egrep '^abc\|ef $' fichier*	Lignes commenÃ§ant par la chaÃ®ne Â«abcÂ» ou bien se terminant par la chaÃ®ne Â«efÂ» suivie dâ€™un nombre quelconque dâ€™espaces ( Penser Ã invoquer "egrep" , grep ne connaÃ®t pas le signe \| )

H. La commande tr

Ce filtre lit l'entrÃ©e standard pour effectuer des substitutions ou des suppressions de caractÃ¨res.

tr [options] [ chaine1 [ chaine2 ] ]

Dans la syntaxe de base, les caractÃ¨res mentionnÃ©s dans Â«chaine1Â» sont remplacÃ©s par ceux de mÃªme position dans Â«chaine2Â».

[a-z]	Les lettres minuscules ( intervalle )
[an]*	n fois le caractÃ¨re a ( * seul signifie : Â«un nombre quelconqueÂ» )
\xyz	Code Ascii en octal du caractÃ¨re

Options

-d
Supprimer les caractÃ¨res apparaissant dans Â«chaine1Â»

-s
Les caractÃ¨res consÃ©cutifs identiques sont rÃ©duits Ã un seul exemplaire

-c
NÃ©gation -> Les caractÃ¨res n'apparaissant pas dans Â«chaine1Â»

Quelques exemples

tr "[a-z]" "[A-Z]" < fichier
Transformer les minuscules en MAJUSCULES.

tr -sc "[A-Z][a-z]" "[\012*]" < fichier
Les caractÃ¨res non alphabÃ©tiques sont transformÃ©s en un saut de ligne. Les sauts de ligne consÃ©cutifs sont Ã©liminÃ©s. On obtient un mot alphabÃ©tique par ligne.

tr -d "abcd" < fichier
Les caractÃ¨res a , b , c et d sont supprimÃ©s.

I. La commande sed

Ce filtre est un Ã©diteur non interactif qui copie les fichiers d'entrÃ©e sur la sortie standard aprÃ¨s leur avoir appliquÃ© un certain nombre de commandes.

sed [-n] 'commandes_sed' fichiers...

sed [-n] -f fichier_commandes fichiers...

Syntaxe des commandes sed et principe de fonctionnement

[ adresse1 [,adresse2] ] action [ arguments ]

Les crochets indiquent un aspect facultatif et nâ€™apparaissent pas dans les commandes. Tous ces Ã©lÃ©ments ne sont sÃ©parÃ©s par aucun espace. En lâ€™absence dâ€™adresses de sÃ©lection, lâ€™action a lieu sur toutes les lignes des fichiers dâ€™entrÃ©e. Lâ€™action par dÃ©faut est dâ€™afficher la ligne sur la sortie standard.

Une adresse peut Ãªtre, entre autres :

Quelques actions usuelles

d	Ne pas afficher la ligne
p	Afficher la ligne ( sâ€™utilise souvent avec l'option -n )
q	Abandonner le traitement
s/expr1/expr2/	Remplacer la premiÃ¨re expression par la seconde,une seule fois par ligne
s/expr1/expr2/g	Remplacer la premiÃ¨re expression par la seconde, plusieurs fois par ligne si nÃ©cessaire
s/expr1//	Supprimer l'expression
s/expr1/...&.../	Remplacer la premiÃ¨re expression par elle-mÃªme plus Â«quelque choseÂ» ( La notation & signifie : Â«reprendre la premiÃ¨re expressionÂ» )
=	Afficher le numÃ©ro de ligne

etc...

Quelques exemples

sed 's/monsieur/madame/g' fichier	Remplacer une chaÃ®ne par une autre plusieurs fois par ligne
sed 's/^/ /' fichier	DÃ©caler le dÃ©but de chaque ligne par des espaces
sed '/./s/^/ /' fichier	Idem uniquement sur les lignes non vides
sed -n '/expression/!p' fichier	Afficher les lignes ne contenant pas lâ€™expression ( Le ! indique la nÃ©gation de lâ€™expression )
sed -n '20,30p' fichier	Afficher les lignes de numÃ©ro 20 Ã 30
sed '1,10d' fichier	Ne pas afficher les 10 premiÃ¨res lignes
sed -n '/./p' fichier	Afficher uniquement les lignes non vides
sed '/^$/d' fichier	MÃªme traitement
sed '/expression/q' fichier	Afficher jusquâ€™Ã une expression donnÃ©e
sed -n '/expression/=' fichier	Afficher les numÃ©ros des lignes contenant une expression donnÃ©e
sed 's/toto/bonjour &/g' fichier	Remplacer la chaÃ®ne Â«totoÂ» par Â«bonjour totoÂ»,

J. La commande awk

Cet utilitaire awk tire son nom de ceux de ses concepteurs. ( Alfred AHO , Peter WEINBERGER , Brian KERNIGHAN )

C'est un outil trÃ¨s adaptÃ© pour rÃ©aliser des tÃ¢ches de manipulation de donnÃ©es sans avoir Ã les programmer dans un langage classique comme le C. En effet, beaucoup de choses sont implicitement rÃ©solues. ( les entrÃ©es, la gestion des Â«champsÂ», la gestion mÃ©moire, les dÃ©clarations, les initialisations ... )

Syntaxe et principe de fonctionnement

awk 'liste-de-commandes' fichiers...

awk -f fichier_commandes fichiers...

Le Â«motifÂ» sert dâ€™expression de sÃ©lection des lignes pour y appliquer lâ€™action associÃ©e. Si le motif est absent, toutes les lignes sont concernÃ©es par lâ€™action. Lâ€™action par dÃ©faut consiste Ã afficher la ligne.

Chaque ligne d'entrÃ©e est automatiquement divisÃ©e en Â«champsÂ». Les diffÃ©rents champs sont nommÃ©s respectivement : $1 $2 $3 ... $NF

NF reprÃ©sente le nombre de champs de la ligne en cours de traitement. Le sÃ©parateur de champs peut Ãªtre positionnÃ© Ã un caractÃ¨re particulier.

1) On utilise comme premiÃ¨re commande : BEGIN { FS = "caractÃ¨re" }

2) A l'appel de Â«awkÂ», on utilise l'option -FcaractÃ¨re

$0 La ligne entiÃ¨re

etc...

Les motifs

Les programmes peuvent souvent se rÃ©sumer Ã une suite de motifs puisque l'action par dÃ©faut est l'impression des lignes sÃ©lectionnÃ©es.

Quelques motifs possibles

$3 < 10

$3 < $2 + 10 && $4 == "dupont"

/dupont/

/^[0-9]/

NR == 10 , NR == 15

- Le motif BEGIN

- Le motif END

Les actions

Une action est une suite d'instructions.

Instructions disponibles

Quelques exemples

awk ' $3 > 1000 { print $1 , $2 , $3 } ' fichier	Pour toutes les lignes oÃ¹ le troisiÃ¨me champ est supÃ©rieur Ã mille, on affiche la valeur des trois premiers champs
awk ' { print NR , $0 } ' fichier	NumÃ©roter les lignes dâ€™un fichier
awk ' { printf "%4d %s\n" , NR , $0 } ' fichier	MÃªme traitement avec formatage
awk â€˜ $3 > 1000 { val++ } END { print val }	Afficher le nombre de lignes oÃ¹ le â€˜ fichier troisiÃ¨me champ est supÃ©rieur Ã 1000
awk â€˜ $3 > max { max = $3 ; maxnom = $2 } END { print max , maxnom }	Afficher la valeur maximum â€˜ fichier du troisiÃ¨me champ ainsi que celle du deuxiÃ¨me champ associÃ©
awk â€˜ { noms = noms $2 " " } END { print noms }	Afficher la concatÃ©nation â€˜ fichier de tous les deuxiÃ¨mes champs ( Lâ€™espace est lâ€™opÃ©rateur de concatÃ©nation )
awk â€˜ BEGIN { printf "Calcul du maximum et de la moyenne\n" } { somme += $3 } $3 > max { max = $3 } END { printf "Maximum = %10.2f Moyenne = %10.2f \n" , max , somme / NR } â€˜ fichier

Bienvenue sur le site admin-sys

Filtres

X. Commandes et filtres

A. Introduction

B. les commandes head et tail

C. La commandes wc

D. La commande find

E. la commande sort

F. la commande cut

G. la commande grep

H. La commande tr

I. La commande sed

J. La commande awk

Commentaires Forum fermé

Rechercher

sur le web

Navigation

Articles de la rubrique

Statistiques

Dernière mise à jour

Publication

Visites

Top Articles

Les plus populaires

Au hasard

head -N fic	affiche les N premiÃ¨res lignes de fic.
tail -N fic	affiche les N derniÃ¨res lignes de fic.
tail +N fic	affiche de la ligne N Ã la fin de fic.

grep	Recherche d'expressions littÃ©rales et/ou rÃ©guliÃ¨res
egrep	Accepte des expressions plus riches que Â«grepÂ»
fgrep	Ne traite que des expressions littÃ©rales mais est plus compact et performant

-d	Supprimer les caractÃ¨res apparaissant dans Â«chaine1Â»
-s	Les caractÃ¨res consÃ©cutifs identiques sont rÃ©duits Ã un seul exemplaire
-c	NÃ©gation -> Les caractÃ¨res n'apparaissant pas dans Â«chaine1Â»

tr "[a-z]" "[A-Z]" < fichier	Transformer les minuscules en MAJUSCULES.
tr -sc "[A-Z][a-z]" "[\012]" < fichier*	Les caractÃ¨res non alphabÃ©tiques sont transformÃ©s en un saut de ligne. Les sauts de ligne consÃ©cutifs sont Ã©liminÃ©s. On obtient un mot alphabÃ©tique par ligne.
tr -d "abcd" < fichier	Les caractÃ¨res a , b , c et d sont supprimÃ©s.