Testo puro
In informatica, con il termine testo puro (anche detto: testo semplice, solo testo, testo normale) ci si riferisce a quei dati (byte) che rappresentano un testo costituito solamente da lettere, numeri, segni di punteggiatura, spazi, altri simboli stampabili, ed anche alcuni caratteri di controllo come tabulatore, inizio riga e ritorno a capo. Tali dati non rappresentano immagini, o qualunque altro tipologia di contenuto multimediale, ed in particolare non rappresentano l'aspetto grafico del carattere (font).
Il testo puro è una tipologia di contenuto, mentre un file di testo puro è la tipologia di contenitore che contiene «testo puro».
Leggere e/o modificare
Affinché un essere umano possa leggere e/o modificare un «testo puro» è necessario che un software, tramite un font, lo visualizzi su un video. Tali software sono di varia natura:
- tramite un editor di testo possiamo leggere e modificare un file di testo puro;
- da riga di comando possiamo visualizzare il contenuto di un file di testo puro lanciando il comando cat, oppure il comando type;
Formattazione e complessità
Quando un «testo puro» presenta caratteri, diversi da lettere e numeri, utilizzati in un modo che risulta insolito per un essere umano è molto probabile che sia un testo formattato scritto in un qualche linguaggio di markup. Per esempio nel linguaggio con cui è scritta questa pagina il testo preceduto e seguito da tre singoli apici '''
ha il significato di testo in grassetto.
A seconda della complessità del linguaggio di markup il «testo puro» in cui esso è scritto potrebbe risultare più o meno comprensibile per un essere umano. Esistono linguaggi di markup leggeri che sono estremamente semplici da comprendere. In altri casi (SGML, XHTML, DocBook, ...) la complessità è così alta che una persona deve prima studiare il linguaggio di markup per essere in grado di comprendere il significato del relativo «testo formattato».
Per "nascondere" la complessità del linguaggio di markup alcuni editor di testo puro si sono evoluti affinché mostrino il «testo formattato» come se fosse «testo puro»; quando si modifica tale testo (che sembra puro) l'editor si preoccupa di gestire la complessità del Linguaggio di markup aggiungendo o togliendo i relativi caratteri di markup dal "sottostante" «testo formattato».
Quando si visualizzano dei dati, presupponendo che essi rappresentino «testo puro», ma in realtà si visualizzano simboli senza senso, allora è molto probabile che si tratti di dati binari che in prima battuta non rappresentano del «testo puro». Potrebbe trattarsi di: immagini, contenuto multimediale di varia natura, testo cifrato, testo compresso, e simili.