Cut (Unix): differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Ianezz (discussione | contributi)
m Uso: da elenco a definizioni
Luigi923 (discussione | contributi)
 
(30 versioni intermedie di 18 utenti non mostrate)
Riga 1:
{{Titolo minuscolo}}
'''cut''' (dalla [[lingua inglese]] ''cut'', ''taglia'') è un comando dei [[Sistema operativo|sistemi operativi]] [[Unix]] e [[Unix-like]], e più in generale dei sistemi [[POSIX]]<ref>{{cita web
|url=httphttps://www.opengroup.org/onlinepubs/000095399/utilities/cut.html
|titolo=cut
|accesso=14-06- giugno 2008
|operasito=The Open Group Base Specifications Issue 6 IEEE Std 1003.1, 2004 Edition
|lingua=en
}}</ref>, che legge uno o più [[file di testo]] (o lo ''[[standard input]]'') estraendo da ogni linea delle sezioni, definite in termini di [[byte]] oppure caratteri oppure [[Campo (informatica)|campi]], le quali sono poi mostrate sullo ''[[standard output]]''. È un tipo di [[Filtro (Unix)|filtro]].
 
== UsoSintassi ==
La sintassi generale di ''cut'' prevede le tre forme che seguono:
cut -b ''lista'' [-n] [--] [''file1'' [''file2'' ..] ]
cut -c ''lista'' [--] [''file1'' [''file2'' ..] ]
cut -f ''lista'' [-d ''carattere''] [-s] [--] [''file1'' [''file2'' ..] ]
 
I parametri facoltativi ''file'' indicano i nomi dei file di testo da cui estrarre le informazioni. Se non sono specificati, i dati sono letti dallo ''standard input''. Uno dei parametri può essere un trattino ("<ttcode>-</ttcode>") per indicare di leggere in quel punto lo ''standard input''.
 
Il doppio trattino <code>--</code> (facoltativo) indica che i parametri successivi non sono da considerarsi opzioni.
 
Tra le opzioni principali vi sono:
;<ttcode>-b ''lista''</ttcode>: Estrae dalla linea i byte i cui indici sono specificati dal parametro ''lista''.
;<ttcode>-c ''lista''</ttcode>: Estrae dalla linea i caratteri i cui indici sono specificati dal parametro ''lista''.
;<ttcode>-f ''lista''</ttcode>: Estrae dalla linea i campi i cui indici sono specificati dal parametro ''lista''.
;<ttcode>-d ''carattere''</ttcode>: Se si estraggono campi tramite l'opzione <ttcode>-f</ttcode>, indica il carattere da usare come separatore tra i campi. Il carattere predefinito è il [[carattere di controllo]] ''tab''.
;<ttcode>-n</ttcode>: Se si estraggono byte tramite l'opzione <ttcode>-b</ttcode> e la codifica del testo in uso richiede più byte per carattere, assicura che le sequenze di byte che rappresentano il primo e/o l'ultimo carattere di una sezione siano estratte per intero.
;<ttcode>-s</ttcode>: Se si estraggono campi tramite l'opzione <ttcode>-f</ttcode>, indica di escludere le linee che non contengono il carattere separatore (il comportamento predefinito di ''cut'' prevede di riproporre in output tali linee senza modifiche).
 
Il parametro ''lista'' delle opzioni <ttcode>-b</ttcode>, <ttcode>-c</ttcode> e <ttcode>-f</ttcode> è un elenco di uno o più indici e/o intervalli di indici, separato da virgole ("<ttcode>,</ttcode>") o da spazi ("<ttcode>&nbsp;</ttcode>"), il quale seleziona all'interno delle linee di dati le sezioni da estrarre. Ciascun elemento dell'elenco può essere:
* un ''indice'' numerico, a partire da 1, che indica il byte, carattere o campo da selezionare;
* un ''intervallo'' di indici nella forma <ttcode>''min''-''max''</ttcode> (ad esempio "<ttcode>3-5</ttcode>") che seleziona i byte, caratteri o campi compresi tra gli indici ''min'' e ''max'';
* un ''intervallo'' di indici nella forma <ttcode>''min''-</ttcode> (ad esempio "<ttcode>3-</ttcode>") che seleziona i byte, caratteri o campi a partire dall'indice ''min'' fino al termine della linea;
* un ''intervallo'' di indici nella forma <ttcode>-''max''</ttcode> (ad esempio "<ttcode>-5</ttcode>") che seleziona i byte, caratteri o campi a partire dall'inizio della linea fino all'indice ''max'';
 
L'ordine degli elementi nella lista non è rilevante, e nemmeno lo sono eventuali ripetizioni o intersezioni, in quanto le sezioni sono sempre presentate nell'ordine in cui appaiono nelle linee di dati originarie e senza ripetizioni.
 
== Esempi ==
Estrae il primo ed il terzosesto campo dal file <ttcode>/etc/passwd</ttcode>, che usa il carattere <code>:</code> come separatore di campo:
cut -f 1,6 -d : /etc/passwd
 
 
Estrae i primi dieci caratteri da ogni linea che giunge dallo ''standard input'':
cut -c -10
 
Estrae i byte che vanno dal quinto al decimo, il sedicesimo e dal ventesimo in poi di ogni linea del file <ttcode>prova.txt</ttcode>:
 
cut -b 5-10,16,20- prova.txt
Estrae i byte che vanno dal quinto al decimo, il sedicesimo e dal ventesimo in poi di ogni linea del file <tt>prova.txt</tt>:
cut -b 5-10,16,20- prova.txt
 
== Alternative ==
Le capacità di estrazione di ''cut'' sono alquanto ridotte, il che limita il suo utilizzo ai casi più semplici; esso infatti:
* non permette di riordinare e/o ripetere le sezioni estratte;<ref name="multipass">
Ciò si può ottenere effettuando più passaggi sugli stessi file di input, per produrre file temporanei da unire poi con i comandi [[Join (Unix)|join]] e [[Paste (Unixinformatica)|paste]].</ref>
* non permette di estrarre solo parte dei dati delle sezioni indicate;<ref name="multipass"/>
* non permette di specificare come separatore dei campi una ''sequenza'' di spazi (non è ad esempio adatto a estrarre dati dall'output del comando [[Ls (Unix)|ls]]).
 
Se ciò fosse necessario, si può ricorrere a degli ''[[script]]'' nel [[Awk|linguaggio AWK]] o all'uso del comando [[sed (Unix)|sed]], che offrono maggiori possibilità in tal senso.
 
== Note ==
Riga 58:
== Voci correlate ==
* [[Awk]]
* [[Joinjoin (Unix)]]
* [[Pastepaste (Unixinformatica)]]
 
== Collegamenti esterni ==
* {{cita web
|url=httphttps://www.gnu.org/software/coreutils/manual/html_node/cut-invocation.html
|titolo=cut: Print selected parts of lines
|accesso=14-06- giugno 2008
|operasito=GNU Coreutils manual
|lingua=en
}}
 
{{Comandi Unix}}
{{Portale|informatica}}
 
[[Categoria:SoftwareComandi di sistemaUnix]]
[[Categoria:Comandi Unix/LinuxCoreutils]]
 
[[en:Cut (Unix)]]
[[eo:Cut]]
[[hu:Kútfalva]]
[[ja:Cut]]
[[nl:Cut]]
[[no:Cut]]
[[pt:Cut]]
[[ro:Cut, Alba]]
[[ru:Cut]]
[[sv:Lista över golftermer#Cut]]
[[vo:Cut]]