Format string attack

classe di vulnerabilità scoperte nel 1999

Le format string attack (vulnerabilità di formato della stringa) sono una classe di vulnerabilità scoperte nel 1999.

Introduzione

Il tipo di attacco Format String è una classe di vulnerabilità scoperte nel 1999, presenti prevalentemente in linguaggi di programmazione imperativi come il C. Un Format String Attack è formato da tre componenti fondamentali:

  • Format Function: in ANSI C è una funzione che converte una variabile di tipo primitivo, in una stringa user-friendly cioè leggibile dall’uomo.
   printf: per stampare su stdout
   fprintf: per stampare la format string su file
   sprintf: per stampare una stringa dentro un buffer
   snprintf: per stampare esattamente 'n' caratteri della stringa in ingresso nella seconda
  • Format String: è l’argomento della format function ed è una stringa ASCII che contiene sia testo che parametri di formato.
   printf(“The magic number is %d\n”, 3);
  • Format String Parameter definiscono il tipo di conversione da effettuare in relazione alla variabile presente nella format string.
   “%s”: per stampare una stringa
   “%d”: per stampare degli interi
   “%c”: per stampare dei caratteri
   “%x”: per stampare caratteri esadecimali

Funzionamento dello stack

Lo stack è un'area di memoria in cui vengono salvate le variabili locali e i parametri passati alla funzione. La sua gesitone è di tipo LIFO e cresce verso indirizzi bassi. Eseguendo questo semplice codice, ad esempio:

#include <stdio.h>
    
void main(int argc , char* argv){
   int A=3, B=5;
   printf("Valore var. A: %d - Indirizzo var. A: %x\n", A, &A);
   printf("Valore var. B: %d - Indirizzo var. B: %x\n", B, &B);
}

il programma stamperà:

Valore var. A: 3 - Indirizzo var. A: 7fdc
Valore var. B: 5 - Indirizzo var. B: 7fd8

se invece la printf() riceve come parametro una stringa "maligna" (senza controllarne le caratteristiche) il risultato sarebbe proprio un attacco di tipo format string.

Attacchi possibili

Crash del programma

Un modo molto semplice per mandare in crash un programma è passando alla funzione printf() una stringa formattata in questo modo:

printf("%s%s%s%s%s%s%s%s%s%s%s");

Ogni "%s" cerca di visualizzare il contenuto di un buffer di caratteri (una stringa) dall'indirizzo iniziale presente sullo stack fino al carattere terminatore ("0"). Inserendo quindi molti “%s", la funzione sposterà il puntatore in avanti fino ad aree di memoria non mappate nel frame dell'applicazione, così facendo cercherà di leggere da "indirizzi illegali", causando l'errore “segmentation fault” che manda in crash il programma.

Leggere lo stack

Utilizzando sempre la printf(), è possibile leggere parte del contenuto dello stack, usando una format string di questo tipo:

printf( "%08x-%08x-%08x-%08x-%08x\n");

l'output potrebbe essere il seguente:

4306ea40-43074920-0062de90-70706970-02000002

Questo perché essendo il numero degli argomenti della printf() variabili, questa utilizza la format string per sapere quanti gliene sono stati passati. In questo caso quindi crede (erroneamente) che siano cinque parametri, e andrà quindi a stampare i prossimi cinque indirizzi sullo stack, pensando siamo i parametri richiesti.

Il parametro di formato "%08x" è costituito dai seguenti componenti: x (converti i carratteri in esadecimale), 8 (mostra otto caratteri), 0 (riempi di zeri i caratteri nulli, se presenti).

Leggere memoria in ogni locazione di memoria

E’ possibile anche leggere aree di memoria diverse dallo stack. Dobbiamo però creare una format function che visualizza il contenuto della memoria all’indirizzo che gli forniamo.

Ci servirà quindi l’indirizzo da cui andare a leggere ed il giusto parametro di formato per leggerlo. Il parametro di formato che useremo sarà: "%s" che visualizzerà il contenuto dell’area di memoria in formato stringa ASCII (da un indirizzo memorizzato sullo stack).

La nostra format function mantiene all’interno dello stack il puntatore alla locazione di memoria del parametro di formato. Se fossimo in grado di far puntare quel puntatore all’area di memoria che ci interessa, potremmo dare quell’indirizzo al formato parametro "%s" così che, invocando la printf(), questa leggerà la memoria da quell’indirizzo fino a che non trova un carattere terminatore ‘0’

Utilizzando ad esempio la seguenti stringa di formato:

   ("AAA0AAA1_%08x.%08x.%08x.%08x.%08x");

la sequenza di "%08x" incrementa il puntatore interno della format function verso il top dello stack. Dopo alcuni di questi incrementi, lo stack pointer punterà esattamente alla nostra format string. Se scegliamo il numero giusto di ‘%08x’ potremmo visualizzare la memoria da un qualsiasi indirizzo mettendo alla fine delle stringa un format parametro ‘%s’

Bisogna quindi sostituire la parte iniziale della format string con un vero indirizzo. Vogliamo leggere aree di memoria vicino a questo indirizzo ‘0x08480110’:

La codifica dell’indirizzo scelto in una stringa a 32 bit "\x10\x01\x48\x08" dove il carattere ‘\x10’ inserito in una stringa dice al compilatore di mettere un caratere esadecimale di valore 0x10 nella posizione corrente. Senza \x il valore ASCII che verrebbe salvato nella stringa sarebbe ‘1’ e ‘0’ i cui rispettivi valori ASCII sono ‘49’ e ‘48’

  printf ("\x10\x01\x48\x08_%08x.%08x.%08x.%08x.%08x|%s|");

Quindi la seguente invocazione andrà a leggere memoria dall’indirizzo che gli abbiamo fornito finchè non raggiunge un NULL byte. Incrementando l’indirizzo di memoria dinamicamente possiamo mappare l’intera memoria di processo



Se si passa a una funzione che stampa una stringa a schermo (un esempio classico è la funzione printf del linguaggio C) una stringa che in realtà contiene una serie di parametri di specifica dell'input (tipicamente si usano identificatori di formato %s e %x per esaminare il contenuto della memoria e %n per sovrascrivere parti della memoria, in particolare dello stack) si permette l'avvio di un attacco di tipo stack overflow e return to libc. Per proteggersi da questo attacco, quando si vuole stampare una stringa s usando la printf() o una qualsiasi funzione C che accetti un numero illimitato di identificatori di formato, bisogna scrivere la funzione

Text exampleText exampleprintf("%s",s)

e non scrivere

printf(s)

in quanto in questo modo l'input dell'utente non viene validato. La stringa StringPointer potrebbe contenere una serie di identificatori di formato. Questo tipo di attacco, comunque, diventa sempre più difficile grazie alla diffusione di una maggiore consapevolezza della necessità di gestire i rischi associati alla programmazione e alla conseguente diffusione di tecniche di programmazione sicura.

Voci correlate

Collegamenti esterni

  Portale Sicurezza informatica: accedi alle voci di Wikipedia che trattano di Sicurezza informatica