Lingue | |||
---|---|---|---|
Frequenze della lingua inglese |
Una delle lingue analizzate è l'inglese.
Questo programma ci permette di calcolare la frequenza di ciascuna lettera in un testo di questa lingua. Sono stati scelti testi anche in italiano , in francese e in tedesco.
Anche per questa lingua, la lettera E è la più frequente, ma essa ha una frequenza di poco superiore a quella della lettera T, che immediatamente la segue. Seguono poi le vocali (in ordine) O,A,I, e le consonanti N,R,S,H, che non hanno frequenze molto diverse l'una dall'altra. Le lettere più frequenti formano la successione mnemonica: ETOANIRSH.
I seguenti bigrammi sono tra i più frequenti:
TH, HE, AN, ER, ON, RE, IN, ED, ND, AT, OF, OR, HA, EN, NT, EA, TO, TI, ST, IT, ecc.,
con frequenze percentuali che variano tra 35 e 10 per mille lettere di un testo normale.
Le lettere J, V, Z sono sempre seguite da vocali.
L' inglese ha alcune caratteristiche specifiche: il bigramma TH (3.4%) ed i raddoppiamenti della E e della O (circa 0.2%); altre doppie sono S, L, N, D e più rare M, F, G, P: a queste si possono aggiungere quelle che provengono dalle coppie finale-iniziale di parole consecutive, come EE, MM, TT, RR, WW.
Il seguente grafico illustra la frequenza delle lettere presenti nel primo capitolo del "Frankenstein" di Mary Shelley:Come abbiamo realizzato questo grafico