Analyse des fréquences

Accès membres : identifiez-vous ! Dernière remise à jour du site : le Mar. 11 Novembre 2014 à 14:51:19

Accueil > Codage et cryptage > Analyse des fréquences

Le procédé de codage d'un message le plus simple est de remplacer chaque lettre par une autre ou par un symbole (codage par substitution, chiffre de César, ...).
L'analyse des fréquences consiste à examiner la fréquence des lettres employées dans un message chiffré ; en français la lettre e est la plus utilisée, puis le s, puis le a ... tandis que le w apparait le moins souvent.
Ainsi, en examinant la fréquence d'apparition des lettres dans un message codé, il est possible de faire des hypothèses sur le texte clair, à condition que l'algorithme de chiffrement conserve la répartition des fréquences, ce qui est le cas pour des substitutions mono-alphabétiques et poly-alphabétiques. Deuxième condition : il faut que le message à décoder soit suffisament long. En effet, un texte trop court ne reflète pas obligatoirement la répartition générale des fréquences des lettres. Par exemple le texte : "Une zone du zoo au Zimbabwe est remplit de zèbres et de zébus" donnerait une analyse complètement erronée.
De plus, si la clé est de la même longueur que le message, il ne pourra y avoir des répétitions de lettres et l'analyse fréquentielle sera impossible.

Analyse des fréquences en français

Les tableaux et graphiques ci-dessous ont été créés en utilisant le script de cette page sur des textes en français de 636.663 caractères (soit 480.490 lettres, après suppression des espaces et de la ponctuation) composés de textes de :

- Honoré de BALZAC : La paix du ménage (61.261 lettres) ;
- Arthur BERNEDE : L'homme au masque de fer (259.001 lettres) ;
- Arthur Conan DOYLE : Contes de terreur (160.228 lettres).

Fréquences d'apparition des lettres

Lettre	Fréquence
a	8,81 %
b	0,90 %
c	3,20 %
d	3,61 %
e	17,10 %
f	0,99 %
g	1,01 %
h	0,87 %
i	7,45 %
j	0,77 %
k	0,02 %
l	5,40 %
m	3,15 %

Lettre	Fréquence
n	7,00 %
o	5,19 %
p	2,61 %
q	1,24 %
r	6,84 %
s	7,70 %
t	6,85 %
u	6,50 %
v	1,94 %
w	0,01 %
x	0,36 %
y	0,24 %
z	0,25 %

Histogramme par ordre alphabétique

Histogramme par ordre décroissant des fréquences

Script d'analyse des fréquences

Dernière modification de cette page le 15 novembre 2012 à 13:37
Sauf mention contraire, le contenu de cette page est sous licence Creative Commons Paternité et Conditions de partage à l'identique
Page générée en 38.723 millisecondes | Votre adresse IP : 10.2.27.159 via 216.73.216.117 | Me contacter

WebAnalytics solution by

Impossible de se connecter : Access denied for user 'wxfrantz'@'172.20.245.55' (using password: YES)