Pipeline (software)

insieme di componenti software collegati tra loro in cascata

In informatica, il concetto di pipeline (in inglese, tubatura -composta da più elementi collegati-, condotto) viene utilizzato indicare un insieme di componenti software tra loro collegati a cascata in modo che il risultato prodotto da uno degli elementi sia l'ingresso di quello immediatamente successivo. Le pipeline più semplici prevedono una semplice linea di componenti, mentre quelle più complesse possono prevedere "biforcazioni" (muxers -elementi con più ingressi- o demuxers -elementi con più uscite-). Una pipeline inizia con uno o più elementi source (che non hanno ingressi, ma solo uscite), i cui dati fluiscono attraverso tutti gli altri elementi intermedi (muxers, demuxers, filtri -che manipolano questo flusso di dati- e convertitori -che modificano il formato del flusso di dati-) fino agli elementi sink (che non hanno uscite ma solo ingressi).

L'accezione più comune della parola pipeline indica un comando di shell complesso, in cui un programma source genera un flusso di dati testuali che si propagano attraverso le pipe ("|") tramite una sequenza di filtri, fino ai sink (che spesso sono file, o il terminale). Questi programmi sono collegati tra loro tramite l'operatore pipe, che in una riga di comando significa che lo standard output del programma a sinistra dell'operatore è passato allo standard input del programma alla sua destra.

A livello utente si incontra nell'uso della shell, dove è spesso conveniente riutilizzare i dati uscenti di un programma come input di un altro, ad esempio per applicare dei filtri o per visualizzare e manipolare i risultati in un programma interattivo.

In molti sistemi, come i discendenti del Microsoft DOS e di Unix, l'operazione via shell è gestita interponendo una barra verticale ("|") fra le invocazioni dei due programmi.

Pipeline in ambienti Unix

Esempi

Nei seguenti esempi di riga di comando lo standard output del un programma a sinistra dell'operatore per la pipe è passato allo standard input del programma alla sua destra.

 cut -d : -f 1 /etc/passwd | grep foo

trova tutti gli utenti in /etc/passwd che hanno la stringa "foo" all'interno del loro nome. Il comando cut prende il primo campo di ciascuna linea dal file /etc/passwd e la pipe passa l'output a grep, che cerca le linee contenenti "foo" e le stampa su standard output.

Un altro esempio di pipeline, che visualizza sulla console i numeri da 1 a 13:

while : ; do echo ; done | head -n 13 | nl -ba

Spesso i filtri costituiscono gli elementi successivi al primo in una pipeline.

Inizio della pipeline

Programmi che vengono spesso utilizzati per creare il flusso di dati da inviare ad una pipeline:

  • find (individua i file con certe caratteristiche)
  • cat (legge un file o un dispositivo)
  • tail -f (legge le righe che vengono aggiunte ad un file)

Fine della pipeline

Una pipeline termina stampando il risultato sul terminale, redirigendolo su un file, con un pager come more o less, che permettono di leggere un file o un flusso di dati una pagina alla volta, o anche con xargs, che trasforma un flusso di dati in argomenti sulla riga di comando

Voci correlate