Lingue

Frequenze della lingua inglese


Una delle lingue analizzate è l'inglese.
Questo programma ci permette di calcolare la frequenza di ciascuna lettera in un testo di questa lingua. Sono stati scelti testi anche in italiano , in francese e in tedesco.

Anche per questa lingua, la lettera E è la più frequente, ma essa ha una frequenza di poco superiore a quella della lettera T, che immediatamente la segue. Seguono poi le vocali (in ordine) O,A,I, e le consonanti N,R,S,H, che non hanno frequenze molto diverse l'una dall'altra. Le lettere più frequenti formano la successione mnemonica: ETOANIRSH.

I seguenti bigrammi sono tra i più frequenti:

TH, HE, AN, ER, ON, RE, IN, ED, ND, AT, OF, OR, HA, EN, NT, EA, TO, TI, ST, IT, ecc.,

con frequenze percentuali che variano tra 35 e 10 per mille lettere di un testo normale.

Le lettere J, V, Z sono sempre seguite da vocali.

L' inglese ha alcune caratteristiche specifiche: il bigramma TH (3.4%) ed i raddoppiamenti della E e della O (circa 0.2%); altre doppie sono S, L, N, D e più rare M, F, G, P: a queste si possono aggiungere quelle che provengono dalle coppie finale-iniziale di parole consecutive, come EE, MM, TT, RR, WW.

Il seguente grafico illustra la frequenza delle lettere presenti nel primo capitolo del "Frankenstein" di Mary Shelley:

Come abbiamo realizzato questo grafico


Pagina a cura di Alexandra M. Liguori, Annalisa Vianello del
Ginnasio-Liceo "M.Foscarini" di Venezia
Scrivete via E-Mail.
Sito Web della scuola.
Crittografia - prima pagina.
Analisi statistica delle lingue
Storia della Crittografia.
Glossario
Autori
Fonti
L.Sacco - Manuale di Crittografia ...