Cut (Unix): differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
DarkApBot (discussione | contributi)
m Bot: Aggiungo: vo:Cut
Ianezz (discussione | contributi)
completamente rivisto, con diverse precisazioni ed esempi
Riga 1:
{{Titolo minuscolo}}
'''cut''' è un programmacomando perdei [[Sistema operativo|sistemi operativi]] [[Unix]] o sistemie [[Unix-like]], e più in generale dei sistemi [[POSIX]], che stampalegge alcuneuno sezionio più [[file di testo]] (o lo ''[[standard input]]'') estraendo da ogni linea delle sezioni, definite in termini di un[[byte]] fileoppure caratteri oppure campi, le quali sono poi mostrate sullo ''[[standard output]]''. È un tipo di [[filtroFiltro (Unix)|filtro]]. La sua sintassi è:
<tt>cut [opzioni] [file]</tt>
 
== Uso ==
Il file su cui operare la selezione può essere fornito anche attraverso lo [[standard input]].
La sintassi generale di ''cut'' prevede le tre forme che seguono:
cut -b ''lista'' [-n] [''file1'' [''file2'' ..] ]
cut -c ''lista'' [''file1'' [''file2'' ..] ]
cut -f ''lista'' [-d ''carattere''] [-s] [''file1'' [''file2'' ..] ]
 
I parametri facoltativi ''file'' indicano i nomi dei file di testo da cui estrarre le informazioni. Se non sono specificati, i dati sono letti dallo ''standard input''. Uno dei parametri può essere un trattino ("<tt>-</tt>") per indicare di leggere in quel punto lo ''standard input''.
==Opzioni principali==
===Definizioni===
Negli esempi seguenti si userà la seguente notazione:
 
Tra le opzioni principali vi sono:
*Una ''lista'' è indicata da uno o più ''intervalli'' separati da virgole (',');
* <tt>-b ''lista''</tt> – Estrae dalla linea i byte i cui indici sono specificati dal parametro ''lista''.
* <tt>-c ''lista''</tt> – Estrae dalla linea i caratteri i cui indici sono specificati dal parametro ''lista''.
* <tt>-f ''lista''</tt> – Estrae dalla linea i campi i cui indici sono specificati dal parametro ''lista''.
* <tt>-d ''carattere''</tt> – Se si estraggono campi tramite l'opzione <tt>-f</tt>, indica il carattere da usare come separatore tra i campi. Il carattere predefinito è il [[carattere di controllo]] ''tab''.
* <tt>-n</tt> – Se si estraggono byte tramite l'opzione <tt>-b</tt> e la codifica del testo in uso richiede più byte per carattere, assicura che le sequenze di byte che rappresentano il primo e/o l'ultimo carattere di una sezione siano estratte per intero.
* <tt>-s</tt> – Se si estraggono campi tramite l'opzione <tt>-f</tt>, indica di escludere le linee che non contengono il carattere separatore (il comportamento predefinito di ''cut'' prevede di riproporre in output tali linee senza modifiche).
 
Il parametro ''lista'' delle opzioni <tt>-b</tt>, <tt>-c</tt> e <tt>-f</tt> è un elenco di uno o più indici e/o intervalli di indici, separato da virgole ("<tt>,</tt>") o da spazi ("<tt>&nbsp;</tt>"), il quale seleziona all'interno delle linee di dati le sezioni da estrarre. Ciascun elemento dell'elenco può essere:
*Un ''intervallo'' è indicato da due numeri separati da un trattino ('-'); ad esempio sono intervalli "1-3", "4-42" e "1-6". È possibile usare intervalli incompleti nel modo seguente:
* un ''indice'' numerico, a partire da 1, che indica il byte, carattere o campo da selezionare;
**"-N", che corrisponde all'intervallo "1-N";
* un ''intervallo'' di indici nella forma <tt>''min''-''max''</tt> (ad esempio "<tt>3-5</tt>") che seleziona i byte, caratteri o campi compresi tra gli indici ''min'' e ''max'';
**"N-", che corrisponde all'intervallo che va da "N" fino alla fine della linea o all'inizio del prossimo intervallo.
* un ''intervallo'' di indici nella forma <tt>''min''-</tt> (ad esempio "<tt>3-</tt>") che seleziona i byte, caratteri o campi a partire dall'indice ''min'' fino al termine della linea;
* un ''intervallo'' di indici nella forma <tt>-''max''</tt> (ad esempio "<tt>-5</tt>") che seleziona i byte, caratteri o campi a partire dall'inizio della linea fino all'indice ''max'';
 
L'ordine degli elementi nella lista non è rilevante, e nemmeno lo sono eventuali ripetizioni o intersezioni, in quanto le sezioni sono sempre presentate nell'ordine in cui appaiono nelle linee di dati originarie e senza ripetizioni.
È possibile ripetere e sovrapporre gli elementi di una lista, che possono essere indicati in qualsiasi ordine.
 
===Opzioni principali=Esempi ==
Estrae il primo ed il terzo campo dal file <tt>/etc/passwd</tt>:
cut -f 1,6 -d : /etc/passwd
 
*-b <lista> Stampa solo i [[byte]] la cui posizione è compresa negli intervalli indicati in <lista>
 
Estrae i primi dieci caratteri da ogni linea che giunge dallo ''standard input'':
*-c <lista> Stampa solo i caratteri la cui posizione è compresa negli intervalli indicati in <lista>. Questa opzione potrebbe potrebbe produrre un'[[output]] diverso rispetto all'opzione "-b" in caso di testo con caratteri multi-byte
cut -c -10
 
*-d <carattere> Indica il separatore dei campi per l'opzione "-f"
 
Estrae i byte che vanno dal quinto al decimo, il sedicesimo e dal ventesimo in poi di ogni linea del file <tt>prova.txt</tt>:
*-f <lista> Stampa solo i campi indicati in <lista>. Il separatore di [[Default (informatica)|default]] è il carattere di tabulazione
cut -b 5-10,16,20- prova.txt
 
== Alternative ==
Le capacità di estrazione di ''cut'' sono alquanto ridotte, il che limita il suo utilizzo ai casi più semplici; esso infatti:
* non permette di riordinare e/o ripetere le sezioni estratte;<ref name="multipass">
Ciò si può ottenere effettuando più passaggi sugli stessi file di input, per produrre file temporanei da unire poi con i comandi [[Join (Unix)|join]] e [[Paste (Unix)|paste]]</ref>
* non permette di estrarre solo parte dei dati delle sezioni indicate;<ref name="multipass"/>
* non permette di specificare come separatore dei campi una ''sequenza'' di spazi (non è ad esempio adatto a estrarre dati dall'output del comando [[Ls (Unix)|ls]]).
 
Se ciò fosse necessario, si può ricorrere a degli ''[[script]]'' nel [[Awk|linguaggio AWK]], che offrono maggiori possibilità in tal senso.
 
== Note ==
<references />
 
== Voci correlate ==
* [[Awk]]
* [[Join (Unix)]]
* [[Paste (Unix)]]
 
== Collegamenti esterni ==
* {{cita web
|url=http://www.opengroup.org/onlinepubs/000095399/utilities/cut.html
|titolo=cut
|accesso=14-06-2008
|opera=The Open Group Base Specifications Issue 6 IEEE Std 1003.1, 2004 Edition
|lingua=en
}}
* {{cita web
|url=http://www.gnu.org/software/coreutils/manual/html_node/cut-invocation.html
|titolo=cut: Print selected parts of lines
|accesso=14-06-2008
|opera=GNU Coreutils manual
|lingua=en
}}
 
{{Portale|informatica}}
 
[[Categoria:Software di sistema]]
[[Categoria:Comandi Unix/Linux]]
 
[[en:Cut (Unix)]]