Spettrogramma
Uno spettrogramma è la rappresentazione grafica dell'intensità di un suono in funzione del tempo e della frequenza o, in altre parole, è la rappresentazione grafica della funzione reale i delle variabili reali t ed f: i(t,f).
Formati degli spettrogrammi
Benché sia evidentemente possibile rappresentare la funzione i(t,f) come una superficie (su un diagramma cartesiano con assi t, f ed i), di solito per gli spettrogrammi si usa un'altra rappresentazione grafica, nella quale:
- sull'asse delle ascisse è riportato il tempo in scala lineare:
- sull'asse delle ordinate è riportata la frequenza in scala lineare o logaritmica;
- a ciascun punto di data ascissa e data ordinata è assegnata una tonalità di grigio, o un colore, rappresentante l'intensità del suono in un dato istante di tempo e a una data frequenza; la relazione fra l'intensità del suono e la scala di grigi o di colori può essere lineare o logaritmica.
Lo spettrogramma della figura 1, che rappresenta la parola italiana "mano" pronunciata da una voce maschile, ha questo formato "a colori": in particolare i colori vanno dal blu scuro, per le basse intensità, al giallo, per le alte intensità.
Lo spettrogramma della stessa parola "mano", stavolta però nel formato "in scala di grigi", è riportato nella figura 2: in particolare maggiore è l'intensità del suono, più chiara è la tonalità di grigio. In questa figura, sotto lo spettrogramma è riportata anche la "forma d'onda" della parola "mano". Questa doppia rappresentazione, di uso frequente, permette un rapido confronto fra la forma d'onda e le sue componenti spettrali.
Uno dei campi di applicazione più importanti degli spettrogrammi è l'analisi della voce umana.
Come esempio si consideri la figura 3, in cui compaiono le forme d'onda e gli spettrogrammi dei suoni vocalici "a" ed "i" pronunciati da soli, cioè non all'interno di una parola o frase.
Si può facilmente notare non solo quanto gli spettrogrammi dei due suoni vocalici siano diversi fra loro, ma anche quanto lo spettrogramma della "a" sia simile a una parte dello spettrogramma della parola "mano" riportato in figura 1: in effetti la parola "mano" contiene il suono vocalico "a".
Se poi si considera la figura 4, in cui compare la forma d'onda e lo spettrogramma della parola spagnola "manta" pronunciata da un madrelingua spagnolo, anche qui si può notare quanto l'inizio "ma" della parola "manta" sia simile all'inizio "ma" della parola "mano" della figura 1, che pure è pronunciata da un madrelingua italiano.
Più in generale, mentre non è possibile, a partire dalla forma d'onda di una parola, individuarne i foni (cioè i suoni di base che la costituiscono), l'operazione è invece possibile con uno spettrogramma, tant'è vero che, con un po' di esperienza, si può essere in grado di decifrarlo, cioè di risalire dallo spettrogramma alla parola che esso rappresenta.
Generazione di uno spettrogramma
Uno spettrogramma si ottiene di solito suddividendo l'intervallo di tempo totale (cioè quello relativo all'intera forma d'onda da analizzare) in sottointervalli uguali (detti finestre temporali) di durata da 5 a 10 ms (per gli spettrogrammi riportati nelle figure sono state usate finestre di circa 9,7 ms) e calcolando la trasformata di Fourier della parte di forma d'onda contenuta in ciascuna finestra (solitamente si usa la trasformata veloce di Fourier, o FFT), che fornisce l'intensità del suono in funzione della frequenza. Le trasformate di Fourier relative alle diverse finestre temporali vengono poi assemblate a formare lo spettrogramma.
Altri progetti
- Wikimedia Commons contiene immagini o altri file su spettrogramma