Le procédé de codage d'un message le plus simple est de remplacer chaque lettre par une autre ou
par un symbole (codage par substitution, chiffre de César, ...).
L'analyse des fréquences consiste à examiner la fréquence des lettres employées dans un message
chiffré ; en français la lettre e est la plus utilisée, puis le s, puis le a ...
tandis que le w apparait le moins souvent.
Ainsi, en examinant la fréquence d'apparition des lettres dans un message codé, il est possible de
faire des hypothèses sur le texte clair, à condition que l'algorithme de chiffrement conserve la
répartition des fréquences, ce qui est le cas pour des substitutions mono-alphabétiques et
poly-alphabétiques. Deuxième condition : il faut que le message à décoder soit suffisament long. En
effet, un texte trop court ne reflète pas obligatoirement la répartition générale des fréquences des
lettres. Par exemple le texte : "Une zone du zoo au Zimbabwe est remplit de zèbres et de zébus"
donnerait une analyse complètement erronée.
De plus, si la clé est de la même longueur que le message, il ne pourra y avoir des répétitions de
lettres et l'analyse fréquentielle sera impossible.
Les tableaux et graphiques ci-dessous ont été créés en utilisant le script de cette page sur des textes en français de 636.663 caractères (soit 480.490 lettres, après suppression des espaces et de la ponctuation) composés de textes de :
|
|
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z |
e | a | s | i | n | t | r | u | l | o | d | c | m | p | v | q | g | f | b | h | j | x | z | y | k | w |
Dernière modification de cette page le 15 novembre 2012 à 13:37
Sauf mention contraire, le contenu de cette page est sous licence Creative Commons Paternité et Conditions de partage à l'identique
Page générée en 62.962 millisecondes | Votre adresse IP : 3.22.241.228 | Me contacter