I primi problemi per il crittanalista che si trova davanti a un testo cifrato, sono:
In quale lingua è scritto il testo chiaro?
Quale metodo di cifratura è stato usato, p.es. monoalfabetico o polialfabetico, trasposizione?
Sono stati definiti alcuni indicatori statistici utili a questo scopo:
Numero di presenze: è il numero p di lettere diverse che compaiono nel testo cifrato; ovviamente è sempre minore o uguale al numero A di lettere dell'alfabeto usato (26 per l'internazionale, 32 per il russo ...).
Media frequenza quadratica: altro parametro statistico che misura l'uniformità della distribuzione delle varie lettere. Utile a distinguere un monoalfabetico da un polialfabetico
Kappa o indice di coincidenza: confronta due testi della stessa lunghezza e conta le coincidenze e cioè le lettere uguali alla stessa posizione.