Benchmark (informatica): differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
m →Dibattiti: |date ----> |data |
Aggiornamento della voce |
||
Riga 1:
Con il termine '''benchmark''' si intende un insieme di [[collaudo del software|test]] (collaudo o prova) del [[software]] volti a fornire una misura delle prestazioni di un [[computer]] per quanto riguarda diverse operazioni. Vi è in realtà una seconda definizione, relativa ai test di particolari software: in questo caso il benchmark è la determinazione della capacità di detto software di svolgere più o meno velocemente, precisamente o accuratamente, un particolare compito per cui è stato progettato.
Riga 18 ⟶ 17:
Nel 2014 Intel chiude una class action decennale, ripagando alcuni degli utenti che fra novembre 2000 e giugno 2002 comprarono un Pentium 4 di prima generazione (Willamette) invece che un AMD Athlon, in quanto i test benchmark restituivano valori migliori per il Pentium 4, in quanto i test si basavano su operazioni in cui i Pentium andavano meglio, evitando quelle in cui gli Athlon avrebbero primeggiato. Alla fine il punteggio era calcolato correttamente, ma non era necessariamente veritiero.<ref>AMD aveva ragione: i benchmark favorirono i Pentium 4: http://www.tomshw.it/cont/news/amd-aveva-ragione-i-benchmark-favorirono-i-pentium-4/60336/1.html {{Webarchive|url=https://web.archive.org/web/20141228042705/http://www.tomshw.it/cont/news/amd-aveva-ragione-i-benchmark-favorirono-i-pentium-4/60336/1.html |data=28 dicembre 2014 }}</ref>
== Principi di benchmarking ==
Ci sono sette caratteristiche fondamentali per i benchmark<ref>{{cite conference|first1=Wei|last1=Dai|first2=Daniel|last2=Berleant|title=Benchmarking Contemporary Deep Learning Hardware and Frameworks: a Survey of Qualitative Metrics|date=December 12–14, 2019|___location=Los Angeles, CA, USA|book-title=2019 IEEE First International Conference on Cognitive Machine Intelligence (CogMI)|publisher=IEEE|doi=10.1109/CogMI48466.2019.00029|pages=148–155|url=https://dberleant.github.io/papers/BenchmarkingContemporaryDeepLearningHardwareAndFrameworks.pdf}}</ref>. Queste proprietà chiave sono:
# Rilevanza: i benchmark dovrebbero misurare caratteristiche relativamente vitali.
# Rappresentatività: le metriche delle prestazioni di riferimento dovrebbero essere ampiamente accettate dall'industria e dal mondo accademico.
# Equità: tutti i sistemi dovrebbero essere paragonati in modo equo.
# Ripetibilità: è possibile verificare i risultati del benchmark.
# Rapporto costo-efficacia: i test di benchmark sono economici.
# Scalabilità: i test di benchmark dovrebbero funzionare su sistemi che possiedono una gamma di risorse da bassa ad alta.
# Trasparenza: le metriche di benchmark dovrebbero essere facili da capire.
== Tipi di benchmark ==
# Programma reale
#* software di elaborazione testi
#* software strumento di CAD
#* software applicativo dell'utente (es .: MIS)
# Component Benchmark / Microbenchmark
#* La routine principale consiste in una parte di codice relativamente piccola e specifica.
#* misurare le prestazioni dei componenti di base di un computer<ref>{{cite journal|url=http://www.da.isy.liu.se/pubs/ehliar/ehliar-ssocc2004.pdf|title=Benchmarking network processors|first1=Andreas|last1=Ehliar|first2=Dake|last2=Liu}}</ref>
#* può essere utilizzato per il rilevamento automatico dei parametri hardware del computer come il numero di registri, la dimensione della cache, la latenza della memoria, ecc.
# Kernel
#* contiene codici chiave
#* normalmente astratto dal programma reale
#* kernel popolare: Livermore loop
#* benchmark linpack (contiene una subroutine di algebra lineare di base scritta in linguaggio FORTRAN)
#* i risultati sono rappresentati in Mflop / s.
# Benchmark sintetico
#* Procedura per la programmazione di benchmark sintetici:
#** acquisire statistiche di tutti i tipi di operazioni da molti programmi applicativi
#** ottenere proporzione di ciascuna operazione
#** scrivere il programma in base alla proporzione di cui sopra
#* I tipi di benchmark sintetici sono:
#** Cote
#** Dhrystone
#* Questi sono stati i primi benchmark per computer standard del settore generici. Non ottengono necessariamente punteggi più alti sui moderni computer in pipeline.
# Benchmark I/O
# Benchmark di database
#* misurare il [[throughput]] e i tempi di risposta dei sistemi di gestione dei database (DBMS)
# Benchmark paralleli
#* utilizzato su macchine con più core e / o processori, o sistemi costituiti da più macchine
== Benchmark comuni ==
=== Standard di settore (verificato e verificabile) ===
* Business Applications Performance Corporation (BAPCo)
* Embedded Microprocessor Benchmark Consortium (EEMBC)
* Linked Data Benchmark Council (LDBC)
** Semantic Publishing Benchmark (SPB) : un benchmark LDBC ispirato all'industria dei media / editoria per testare le prestazioni dei motori RDF<ref>{{cite web|url=http://ldbcouncil.org/benchmarks/spb|title=LDBC Semantic Publishing Benchmark|author=LDBC|work=LDBC SPB|publisher=[[LDBC]]|access-date=2018-07-02}}</ref>
** Social Network Benchmark (SNB) : un benchmark LDBC per testare le prestazioni dei motori RDF costituito da tre benchmark distinti (Interactive Workload, Business Intelligence Workload, Graph Analytics Workload) su un set di dati comune<ref>{{cite web|url=http://ldbcouncil.org/benchmarks/snb|title=LDBC Social Network Benchmark|author=LDBC|work=LDBC SNB|publisher=[[LDBC]]|access-date=2018-07-02}}</ref>
* Standard Performance Evaluation Corporation (SPEC), in particolare SPECint e SPECfp
* Transaction Processing Performance Council (TPC): benchmark DBMS
** TPC-A : misura le prestazioni in ambienti di database ad alta intensità di aggiornamento tipici delle applicazioni di elaborazione delle transazioni in linea (OLTP)<ref>{{cite web|url=http://www.tpc.org/tpca/default.asp|title=TPC-A|author=Transaction Processing Performance Council|publisher=[[Transaction Processing Performance Council]]|access-date=2018-07-02}}</ref>
** TPC-C : un benchmark di elaborazione delle transazioni in linea (OLTP)<ref>{{cite web|url=http://www.tpc.org/tpcc/default.asp|title=TPC-C|author=Transaction Processing Performance Council|publisher=[[Transaction Processing Performance Council]]|access-date=2018-07-02}}</ref>
** TPC-H : un benchmark di supporto decisionale<ref>{{cite web|url=http://www.tpc.org/tpch/default.asp|title=TPC-H|author=Transaction Processing Performance Council|publisher=[[Transaction Processing Performance Council]]|access-date=2018-07-02}}</ref>
=== Benchmark open source ===
* Benchmark multiutente AIM : composto da un elenco di test che possono essere combinati per creare un "mix di carico" che simuli una funzione specifica del computer su qualsiasi sistema operativo di tipo UNIX.
* Bonnie ++ - benchmark del file system e del disco rigido
* BRL-CAD - suite di benchmark indipendente dall'architettura multipiattaforma basata su prestazioni di ray tracing multithread; baseline contro un VAX-11/780; e utilizzato dal 1984 per valutare le prestazioni relative della CPU, le differenze del compilatore, i livelli di ottimizzazione, la coerenza, le differenze di architettura e le differenze del sistema operativo.
* Collective Knowledge (Conoscenza collettiva) : framework personalizzabile e multipiattaforma per il crowdsourcing di benchmark e ottimizzazione dei carichi di lavoro degli utenti (come il deep learning) su hardware fornito da volontari
* Coremark : benchmark di elaborazione integrata
* Data Storage Benchmark - una continuazione RDF del LDBC Social Network Benchmark, dal progetto Hobbit<ref>{{cite web|url=https://github.com/hobbit-project/DataStorageBenchmark|title=Data Storage Benchmark|date=2017-07-28|access-date=2018-07-02}}</ref>
* DEISA Benchmark Suite - benchmark di applicazioni scientifiche HPC
* Dhrystone : prestazioni aritmetiche di interi, spesso riportate in DMIPS (Dhrystone milioni di istruzioni al secondo)
* DiskSpd : strumento da riga di comando per il benchmarking dello storage che genera una varietà di richieste su file , partizioni o dispositivi di archiviazione del computer
* Embench™: benchmark portatili e open source, per il benchmarking di sistemi profondamente integrati; presuppongono la presenza di nessun sistema operativo, supporto minimo per le librerie C e, in particolare, nessun flusso di output. Embench è un progetto della Free and Open Source Silicon Foundation .
* Faceted Browsing Benchmark (Benchmark di navigazione sfaccettata): sistemi di benchmark che supportano la navigazione attraverso i dati collegati tramite transizioni iterative eseguite da un utente intelligente, dal progetto Hobbit <ref>{{cite web|url=https://github.com/hobbit-project/faceted-benchmark|title=Faceted Browsing Benchmark|date=2017-07-27|access-date=2018-07-02}}</ref>
* Fhourstones : un benchmark intero
* HINT : progettato per misurare le prestazioni complessive della CPU e della memoria
* Iometer - Strumento di misurazione e caratterizzazione del sottosistema I / O per sistemi singoli e cluster.
* IOzone - Benchmark del filesystem
* Kubestone - Operatore di benchmarking per Kubernetes e OpenShift
* Benchmark LINPACK - tradizionalmente utilizzati per misurare i FLOPS
* Livermore loop
* Benchmark paralleli NAS
* NBench - suite di benchmark sintetici che misura prestazioni aritmetiche di interi
* PAL : un punto di riferimento per i motori fisici in tempo reale
* PerfKitBenchmarker : una serie di benchmark per misurare e confrontare le offerte cloud.
* Phoronix Test Suite - suite di benchmarking multipiattaforma open source per Linux, OpenSolaris, FreeBSD, OSX e Windows. Include una serie di altri benchmark per semplificare l'esecuzione.
* POV-Ray - rendering 3D
* Tak (funzione) : un semplice benchmark utilizzato per testare le prestazioni di ricorsione
* Benchmark TATP - Benchmark elaborazione transazioni di applicazioni di telecomunicazione
* TPoX - Un benchmark di elaborazione delle transazioni XML per i database XML
* VUP (VAX unit of performance) - chiamato anche VAX MIPS
* Whetstone : prestazioni aritmetiche in virgola mobile, spesso riportate in milioni di istruzioni Whetstone al secondo (MWIPS)
=== Benchmark di Microsoft Windows ===
* BAPCo : MobileMark, SYSmark, WebMark
* CrystalDiskMark
* Futuremark : 3DMark , PCMark
* PiFast
* SuperPrime
* Super PI
* Cote
* Windows System Assessment Tool, incluso con [[Windows Vista]] e versioni successive, che fornisce un indice ai consumatori per valutare facilmente i propri sistemi
* Worldbench (fuori produzione)
== Note ==
|