Quicksort: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica |
fix typo: articolo sbagliato |
||
(225 versioni intermedie di oltre 100 utenti non mostrate) | |||
Riga 1:
{{Controlcopy|Parti della voce (almeno l'inizio) sembrano copiate pari pari dal testo di Sedgewick|informatica|gennaio 2011}}
{{Algoritmo
| classe = [[Algoritmo di ordinamento]]
| immagine = Sorting quicksort anim.gif
| didascalia = Quicksort in esecuzione su una lista di numeri. La linea blu è il valore del [[Pivot (matematica)|pivot]].
| struttura dati = Variabile
| tempo = <math>O(n^2)</math>
| tempo medio = <math>\Theta(n\log_2 n)</math> confronti
| tempo migliore = <math>\Omega(n\log_2 n)</math>
| spazio = Dipende dalle implementazioni
| ottimale = Spesso
}}
'''Quicksort''' è un [[algoritmo di ordinamento]] [[Algoritmo ricorsivo|ricorsivo]] [[Algoritmo in loco|in place]] non [[Algoritmo di ordinamento#Stabilit.C3.A0 di un algoritmo|stabile]]. E come l'algoritmo di ordinamento [[Merge sort|Mergesort]] basa il suo funzionamento sul paradigma del "''Divide et Impera''<ref>{{Cita web|lingua=it|url=https://www.freecodecamp.org/italian/news/gli-algoritmi-divide-et-impera/|titolo=Gli algoritmi Divide et Impera|sito=freeCodeCamp.org|data=21 luglio 2022|accesso=29 gennaio 2025}}</ref>"; ovvero sulla scomposizione del problema in più sottoproblemi di taglia minore<ref name="geeksforgeeks.org">{{Cita web|lingua=en|url=https://www.geeksforgeeks.org/quick-sort-algorithm/|titolo=Quick Sort|sito=GeeksforGeeks|data=7 gennaio 2014|accesso=29 gennaio 2025}}</ref>.
In generale la logica dell'algoritmo può essere riassunta in questo modo<ref name="geeksforgeeks.org"/>:
# '''Scelta del pivot:'''
#* Seleziona un elemento dell'array chiamato '''pivot'''. Può essere scelto in vari modi (es: il primo elemento, l'ultimo, un elemento casuale, o la mediana).
# '''Partizionamento della lista:'''
#* Si divide l'array in due parti:
#** Elementi minori o uguali al pivot (solitamente a sinistra del pivot)
#** Elementi maggiori del pivot (solitamente a destra del pivot)
#* Alla fine di questa fase, il pivot sarà nella sua posizione corretta nella lista.
# '''Ricorsione sui sotto-array:'''
#* Applicazione del Quicksort alla parte sinistra (elementi minori o uguali al pivot) e alla parte destra (elementi maggiori).
#* Continua fino a che i sotto-array contengono un solo elemento o sono vuoti (caso base).
Il Quicksort, termine che tradotto letteralmente in italiano significa "ordinamento rapido", è l'[[algoritmo di ordinamento]] che ha, nel caso medio, prestazioni migliori tra quelli basati su confronto. È stato ideato da [[Tony Hoare|Charles Antony Richard Hoare]] nel [[1961]].
== Storia ==
L'algoritmo quicksort fu ideato nel 1959 da [[Tony Hoare]] durante un viaggio nell'URSS, durante una sua visita alla [[Moscow State University]]. In quel periodo, Hoare lavorava a un progetto di [[traduzione automatica]] per il [[National Physical Laboratory, UK|National Physical Laboratory]]. Durante il processo di traduzione si rese necessario ordinare le parole russe prima di consultare il dizionario Russo-Inglese che era registrato su un [[nastro magnetico]] e ordinato alfabeticamente.<ref>{{Cita pubblicazione|cognome=Shustek|nome=L.|titolo=Interview: An interview with C.A.R. Hoare|doi=10.1145/1467247.1467261|rivista=[[Communications of the ACM|Comm. ACM]]|volume=52|numero=3|pp=38-41|anno=2009}}</ref> Dopo aver capito che l'uso dell'[[insertion sort]] sarebbe stato troppo lento, concepì una nuova idea di algoritmo - il Quicksort. Scrisse il programma con [[Autocode]] relativa alla partizione ma non riuscì a gestire la parte relativa ai segmenti non ordinati. Tornato in Inghilterra, gli fu chiesto per lavoro di scrivere il codice di uno [[Shell sort]] - l'algoritmo di ordinamento più efficiente all'epoca. Hoare dichiarò al suo capo che conosceva un algoritmo più efficiente; il capo fece una scommessa, di sei pence, e perse. In seguito, Hoare venne a conoscenza del linguaggio [[ALGOL]] e della sua abilità di gestire la ricorsione; grazie ad esso, pubblicò il codice completo nella maggiore rivista scientifica di informatica del periodo, ''[[Communications of the ACM|Communications of the Association for Computing Machinery]]''.<ref>{{Cita web|url=http://anothercasualcoder.blogspot.com/2015/03/my-quickshort-interview-with-sir-tony.html|titolo=My Quickshort interview with Sir Tony Hoare, the inventor of Quicksort|data=15 marzo 2015|accesso=|editore=Marcelo M De Barros|cognome=|nome=}}</ref>
== Algoritmo di
L'idea base può esprimersi agevolmente in termini ricorsivi. Ad ogni stadio si effettua un ordinamento parziale di una sequenza di oggetti da ordinare. Assunto un elemento come [[Pivot (matematica)|perno]] dello stadio, si confrontano con esso gli altri elementi e si posizionano alla sua sinistra i minori e a destra i maggiori, senza tener conto del loro ordine. Dopo questo stadio si ha che il ''perno'' è nella sua posizione definitiva.
Successivamente si organizzano nuovi stadi simili nei quali si procede all'ordinamento parziale delle sottosequenze di elementi rimasti non ordinati, fino al loro esaurimento.
Lo [[pseudocodice]] per il Quicksort è:
<syntaxhighlight lang="pseudo">
k ← Pivot(array, primo, ultimo)
Quicksort(array, primo, k-1)
Quicksort(array, k+1, ultimo)
Pivot(array, primo, ultimo)
x ← array[primo]
k ← primo
for i ← primo to ultimo do
if array[i] < x then
k ← k + 1
Scambia array[i] ↔ array[k]
array[primo] ← array[k]
array[k] ← x
return k
</syntaxhighlight>
O, in alternativa:
Procedure Quicksort(A)
Input A, vettore a<sub>1</sub>, a<sub>2</sub>, a<sub>3</sub> .. a<sub>n</sub>
begin
if n
else
begin
scegli
calcola il vettore A1 dagli elementi a<sub>i</sub> di A tali che i
calcola il vettore A2 dagli elementi a<sub>j</sub> di A tali che j
A1
A2
return A1
end
== Specifica dell'algoritmo ==
[[
Si vuole fornire una versione più dettagliata dell'algoritmo che specifichi la struttura dati utilizzata e il processo di partizione. L'obiettivo è quello di implementare la procedura mediante un procedimento che calcoli la sequenza ordinata attraverso scambi diretti tra i valori delle sue componenti, senza usare vettori aggiuntivi per mantenere risultati parziali della computazione. In questo modo lo spazio di memoria utilizzato è essenzialmente ridotto alle celle necessarie per mantenere il vettore di ingresso e per implementare la ricorsione.
Si rappresenta la sequenza di input mediante il vettore <math> A = (A[1],A[2],...A[n]) \,\, n \geq 1</math> componenti. Per ogni coppia di
# <math>A[l]</math> assume il valore <math>\alpha </math>
# <math>A_{p,l-1}</math> contiene i valori minori o uguali ad <math>\alpha </math> originariamente
#
Rianalizzando l'algoritmo del quicksort prima esposto si comprende che la funzione <code>Partition(A, p, q)</code> è il fulcro delle operazioni. Nella versione qui presentata l'elemento pivot è fissato a <math>A[p]</math>; questo non è limitativo poiché il chiamante può scegliere un pivot diverso e posizionarlo in <math>A[p]</math> prima di chiamare la funzione. <code>Partition</code> quindi effettua una scansione degli elementi dalla sinistra saltando quelli più piccoli del pivot e dalla destra saltando quelli più grandi; quindi scambia gli elementi che arrestano le scansioni e ricomincia. La scansione partita da destra si ferma su elementi minori o uguali al pivot (e quindi è bloccata dall'elemento pivot stesso), mentre quella partita da sinistra si interrompe quando arriva a un elemento maggiore del pivot. I puntatori utilizzati per la scansione quindi si possono incrociare, e quando l'incrocio è avvenuto la funzione ha completato il suo lavoro.
Function Partition(A, p, q)
begin
i ← p
j ← q
while i ≤ j do
begin
while A[j] > A[p] do j ← j - 1
while i ≤ j and A[i] ≤ A[p] do i ← i + 1
begin
end
Scambia(A[p], A[j])
return
end
== Analisi delle prestazioni ==
=== Caso peggiore ===
Denotiamo con <math>T_w(n)</math> il massimo numero di confronti tra elementi del vettore di ingresso eseguiti dall'algoritmo su input <math>A</math> di lunghezza <math>n</math>. È evidente che i vettori <math>A_1</math>e <math>A_2</math> della partizione possono essere calcolati mediante <math>n-1</math> confronti (dato che un elemento viene scelto come [[Pivot (matematica)|pivot]]). Inoltre la dimensione di <math>A_1</math>e <math>A_2</math> è data rispettivamente da <math>k</math> e <math>n-k-1</math>, per qualche <math> k \in [0,1,...,n-1]</math>. Questo implica che per ogni
<math> n \geq 1 </math>:
<math display="block"> T_w(n) = n - 1 + max_{(0\leq k \leq n-1)}{T_w(k) + T_w(n-k-1)}</math>
mentre per <math> n = 0 </math>:<math display="block"> T_w(0) = 0</math>
Questa è l'equazione di ricorrenza per l'algoritmo in questione.
Si vuole ora determinare il <math>T_w(0)</math> esatto. Nel caso pratico questo valore sarà utile per capire il comportamento dell'algoritmo nel caso in cui si sceglie l'elemento massimo o minimo per il partizionamento. Infatti poiché <math display="inline"> max_{(0\leq k \leq n-1)}[T_w(k) + T_w(n-k-1)]\geq T_w(n-1) </math> abbiamo che <math> T_w(n) \geq n - 1 + T_w(n -1) </math> e quindi per ogni <math> n \in N </math> otteniamo:
<math display="block"> T_w(n) = \sum_{0}^{n-1} k = \frac {n (n -1) } {2} </math>In questo modo abbiamo ottenuto che l'algoritmo nel caso peggiore ha un costo quadratico. Il caso peggiore si verifica quando lo sbilanciamento è totale, cioè quando l'algoritmo di partizionamento restituisce una partizione di lunghezza ''n-1'' e una di lunghezza 0; in questo caso il tempo di esecuzione è Θ(<math>n^2</math>).
Se vogliamo evitare che la scelta del partizionamento ci conduca ad un tempo quadratico, è sufficiente scegliere come pivot l'elemento mediano della sequenza, per esempio tramite l'algoritmo [[Quickselect|QuickSelect]]. Questo consente di trovarci sempre ad avere due sequenze di <math>\lfloor n/2 \rfloor </math> elementi, ottenendo quindi un tempo asintotico pari a <math display="inline">O(n \log_2 n)</math> nel caso peggiore. Ad un'analisi più accurata, tuttavia, si verifica che la costante moltiplicativa è circa 24 (e non 1.39, come nel caso migliore). Per accorgersene è sufficiente scegliere il pivot seguendo questi passi:
# Costruire <math>n/5</math> quintuple: l'ultimo sottoarray può non essere una quintupla, ma un insieme più piccolo;
# Per ogni quintupla calcolare il mediano, effettuando in totale, <math>7n/5</math> confronti, perché il mediano di 5 elementi può essere calcolato con al più 7 confronti;
# Ricavare un campione, ottenuto come mediano dei mediani delle quintuple;
# Partiziona intorno al pivot: <math>(n-1)</math> confronti;
# Prosegui ricorsivamente: <math display="inline">T(\frac{7}{10}n)</math> (perché la chiamata viene effettuata un insieme con cardinalità pari, al più <math display="inline">\tfrac{7}{10} n + 3</math>).
L'equazione di ricorrenza diventa:
<math>T(n)
che ha soluzione <math>O(n)</math>, in particolare <math>T(n)
=== Caso medio ===
Per lo studio nel caso medio si valuta il numero medio di confronti tra elementi del vettore di ingresso eseguiti dall'algoritmo, determinando di conseguenza l'ordine di grandezza del tempo medio di calcolo necessario per eseguire la procedura.
La complessità dell'algoritmo in questo caso è <math>O (n \log_2 (n))</math>, precisamente <math display="inline">1.39\ n \log_2(n)</math>.
=== Caso migliore ===
Il caso migliore si verifica quando l'algoritmo di partizionamento determina due sottoproblemi perfettamente bilanciati, entrambi di dimensione ''n/2''; in questo caso il tempo di esecuzione è <math display="inline">O(n \log_2(n))</math>.
== Tipi di partizionamento ==
Esistono delle varianti del quicksort che si basano sulla differente scelta dell'elemento pivot all'interno della serie di dati da ordinare.
* '''Non casuale (non random)''': in questa versione si sceglie come pivot l'elemento in ultima posizione evitando in questo modo il calcolo della scelta dei numeri casuali. Il caso pessimo è rappresentato da un vettore ordinato al contrario. Anche qualora venga scelto un altro elemento come pivot (ad es. il primo o quello di mezzo) si può trovare un caso pessimo.
* '''Metodo della mediana''': Il metodo della mediana di 3 è un tipico approccio che consente di migliorare i partizionamenti dell'array, evitando partizioni troppo sbilanciate, e consiste nell'effettuare il partizionamento scegliendo opportunamente il ''pivot'' nel sottoarray: in particolare si sceglie come ''pivot'' la [[mediana (statistica)|mediana]] di un insieme di tre elementi selezionati a caso dal sottoarray. Anche in questo caso tuttavia esiste un caso pessimo ed ha complessità quadratica.
*'''Casuale (random)''': Questa è la prima versione pubblicata del quicksort che si basa sulla scelta casuale dell'elemento pivot. Questo non permette di stabilire a tavolino quale sia il caso peggiore, che tuttavia si verificherà con probabilità <math display="inline">O((1/n)^{\log n})</math>.
Come già menzionato in precedenza, tutte queste versioni si ottengono aggiungendo uno scambio prima della chiamata a <code>Partition</code>, per esempio:
scegli a caso un intero k tra p e q
Scambia (A[p], A[k])
Partition (A, p, q)
=== Chiavi duplicate ===
Se nello stesso vettore esistono degli elementi ripetuti, è possibile sistemarli nella prima scansione che viene effettuata tramite la versione di Bentley - Mc Illroy del 1993.
Questa versione prevede che, durante il processo di scansione (fase di partizionamento dell'algoritmo), gli elementi uguali al pivot vengano spostati immediatamente a fianco del pivot (a sinistra se provengono dalla parte sinistra, a destra se provengono dalla parte destra). In questo modo si avranno tre partizioni, una con gli elementi minori del pivot, una con gli elementi uguali e una con gli elementi maggiori del pivot.
La complessità dell'algoritmo non viene modificata.
== Dimensione dello stack ==
L'[[algoritmo]] utilizza la ricorsione, che in casi di anomalie potrebbe portare a problemi di
Per effettuare lo studio della dimensione dello stack si effettua la valutazione dello spazio di memoria necessario alla procedura del quicksort. Oltre alle n celle necessarie per contenere il vettore dei valori di ingresso, occorre utilizzare una certa quantità di spazio per mantenere la pila che implementa la ricorsione. Nel caso peggiore <code>Quicksort(1,n)</code> utilizza uno spazio <math>O(n)</math> per mantenere la pila. Se infatti viene estratto l'elemento maggiore del campione, la pila deve conservare i parametri relativi a un massimo di <math>n
=== Quicksort iterativo ===
Riga 123 ⟶ 173:
Il primo passaggio da fare per passare dalla strategia ricorsiva a quella iterativa è quello di inserire il più grande dei due sottofile da ordinare nello stack assicurando che ogni sottofile presente nello stack non sia più grande della metà di quello che gli sta sotto, quindi lo stack non dovrà contenere più di un numero logaritmico di oggetti. Questa dimensione massima dello stack si verifica quando il partizionamento è effettuato sempre al centro del file. Per file casuali l'occupazione di stack è verosimilmente piccola.
La versione di base del quicksort potrà essere
Procedure Quicksort(A, p, q)
Input A vettore di elementi
begin
if
begin
if p < (l - 1) then Quicksort(A,p, l - 1)
if (l + 1) < q then Quicksort(A, l + 1, q)
end
else
begin
if (l + 1) < q then Quicksort(A, l + 1,q)
if p < (l - 1) then Quicksort(A,p, l - 1)
end
end
A questo punto è possibile operare la trasformazione e passare nella versione iterativa. Si osserva innanzitutto che in questo caso il criterio di gestione della pila può essere semplificato sfruttando il fatto che le due chiamate ricorsive sono le ultime istruzioni della procedura. Si può quindi definire una versione iterativa nella quale la pila serve per mantenere l'elenco delle chiamate che devono ancora essere eseguite e non sono state neppure iniziate. In altre parole nell'esecuzione della procedura la prima chiamata ricorsiva viene attivata dopo aver accantonato in testa alla pila i parametri necessari per eseguire la seconda. Quest'ultima sarà attivata una volta completata la precedente, quando i suoi parametri si trovano di nuovo in testa alla pila. In particolare non si ha bisogno di mantenere nella pila il record di attivazione della procedura (che qualsiasi [[linguaggio di programmazione]] fa ogni qual volta viene chiamata una procedura).
L'algoritmo così ottenuto è descritto dalla seguente procedura:
Input: un vettore A con i dati da ordinare
begin
p
q
S
repeat
while (q
begin
sia A<sub>p1,q1</sub> il vettore max(A<sub>p,q</sub>)
sia A<sub>p2,q2</sub> il vettore min(A<sub>p,q</sub>)
S
p
q
end
until (S
end
Si può dimostrare che la procedura è corretta. Infatti al termine dell'esecuzione di ogni ciclo repeat-until le parti del vettore di ingresso non ancora ordinate sono contenute nella pila S oppure in
=== Valutazione altezza massima dello stack ===
Si osserva innanzitutto che il vettore <math>A_{p,q}</math> sul quale la macchina sta lavorando non è mai maggiore del vettore che si trova in testa alla pila S. Inoltre, ad ogni incremento di S la dimensione <math>A_{p,q}</math>, viene ridotta almeno della metà. Quindi durante la computazione la pila può contenere al più <math> log_2(n)</math> elementi dove <math>n</math> è la dimensione dell'input.
=== Quicksort misto ricorsivo-iterativo ===
Come descritto per il Quicksort iterativo, anche per questa strategia il primo passo è quello di modificare la procedura ricorsiva considerando il fatto che la seconda chiamata alla funzione
Si riporta una efficiente implementazione in [[linguaggio C|C]] della strategia descritta. Il codice può essere compilato per ordinare stringhe, numeri interi, etc.
<syntaxhighlight lang="c">
/********** QuickSort(): sorts the vector 'list[]' **********/
Riga 207 ⟶ 255:
while (1)
{
while (
while (
if (l>r) break;
Riga 235 ⟶ 283:
}
}
</syntaxhighlight>
== Stringhe e vettori ==
{{...| informatica}}
== Selezione ==
{{...| informatica}}
==
<references/>
== Bibliografia ==
* Hoare, C. A. R. (1961): ''Partition: Algorithm 63'', ''Quicksort: Algorithm 64'', and ''Find: Algorithm 65.'', Comm. ACM 4, pp.
* Sedgewick, Robert (1978): ''Implementing quicksort programs'', Communications of the ACM, 21(10) pp.
* Musser, David (1997): ''Introspective Sorting and Selection Algorithms'', Software Practice and Experience vol 27, number 8, pp.
* LaMarca, A.; Ladner, R. E. (1997): ''The Influence of Caches on the Performance of Sorting'', Proceedings of the Eighth Annual ACM-SIAM Symposium on Discrete Algorithms, pp.
== Voci correlate ==
* [[qsort]] - Funzione di ordinamento presente nella [[libreria standard del C]], che tipicamente implementa l'algoritmo di ordinamento quicksort.
== Altri progetti ==
{{interprogetto|b_oggetto=implementazioni|b_preposizione=del|preposizione=sul}}
== Collegamenti esterni ==
* {{Collegamenti esterni}}
* {{FOLDOC}}
* {{cita web|http://pages.stern.nyu.edu/~panos/java/Quicksort/|Interactive quicksort}}
* {{cita web | 1 = http://fiehnlab.ucdavis.edu/staff/wohlgemuth/java/quicksort | 2 = Multidimensional quicksort in Java | accesso = 26 dicembre 2005 | urlarchivio = https://web.archive.org/web/20051124012106/http://fiehnlab.ucdavis.edu/staff/wohlgemuth/java/quicksort | dataarchivio = 24 novembre 2005 | urlmorto = sì }}
{{Ordinamento}}
{{portale|informatica}}
[[Categoria:Algoritmi di ordinamento]]
|