Caratteristiche statistiche di una lingua
Frequenze della Lingua Italiana
...

È detto da tutti che l'italiano é una lingua musicale; infatti analizzando un testo e calcolando la frequenza delle varie lettere , si può notare che le vocali E , A , O sono le lettere più frequenti, senza che esista una preponderanza netta di una di queste sulle altre, e la loro percentuale, che in media raggiunge il 46,4%, é tra le più alte tra le varie lingue esaminate (es. latino, francese , inglese , tedesco).

Seguono le consonanti L , N , R , S , T .

Tra i bigrammi più frequenti troviamo Q-U sempre seguiti da vocale. La lettera H é spesso preceduta dalla lettera C o G per formare i trigrammi CHE , CHI , GHE , GHI . Nella lingua italiana sono quasi assenti le lettere J , K , Y , X ,W salvo nei nomi di persone o località straniere.

Il seguente grafico mostra la frequenza delle varie lettere del primo capitolo del celebre romanzo di Alessandro Manzoni, "I Promessi Sposi":

Dello stesso testo è disponibile anche la tabella dei bigrammi.

Come abbiamo realizzato questo grafico.


Pagina a cura di Monica Enzo, Elena Michieli del
Ginnasio-Liceo "M.Foscarini" di Venezia
Scrivete via E-Mail.
Sito Web della scuola.
Crittografia - prima pagina.
Analisi statistica delle lingue
Storia della Crittografia.
Glossario
Autori
Fonti
L.Sacco - Manuale di Crittografia ...