MRGS

Mouvement pour la Revalorisation du G au Scrabble


Introduction

Le but de cette page est de vous convaincre de soutenir le dur combat de la lettre G pour être enfin estimée à sa juste valeur. Pour cela j'ai fait quelques statistiques sur un ensemble de textes littéraires français. Bonne lecture.

Textes


Auteur
Oeuvre
Année
Lettres
Mots
Longueur moyenne des mots
Honoré de Balzac
Le Colonel Chabert

107891
24312
4.438
Friedrich Engels
Le Rôle du travail dans la transformation du singe en homme

34418
7410
4.645
Gustave Flaubert
Bouvard et Pécuchet

429660
93196
4.610
Victor Hugo
Bug-Jargal

250882
57526
4.361
Mme de Lafayette
La Princesse de Clèves

264413
64105
4.125
Guy de Maupassant
Une Vie

343651
77368
4.429
Henri Poincaré
La Science et l'hypothèse

306856
66201
4.635
François Rabelais
Gargantua

208831
44971
4.644
Georges Sand
François le champi

206977
51986
3.981
Voltaire
Lettres philosophiques

189153
43952
4.304
Emile Zola
L'Argent

688407
154644
4.452
TOTAL
-
-
3 238 683
735 268
4.405
Emile Littré
(Dictionnaire)

690366
78428
8.803

Statistiques

Faites sur l'ensemble des textes. Les résultats sont ramenés sur 10000 lettres.
Le tableau donne la répartition des lettres dans les mots de différentes longueur (colonnes). La dernière colonne totalise chaque ligne, ie donne le nombre d'occurrences de chacune des lettres (sur 10000 lettres).
La dernière ligne totalise chaque colonne, ie donne le nombre de lettres apparaissant dans les mots selon leur longueur.
Exemples :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

A
49
93
43
79
118
114
106
81
62
40
23
15
7
4
1

835
B


3
13
12
14
16
14
8
6
4
2
1
1


96
C
8
18
12
27
47
43
44
42
30
21
12
9
4
2
1

320
D
29
111
31
40
22
33
29
23
21
11
7
3
2
1
1

363
E

306
171
162
207
208
190
166
128
83
50
30
14
8
4
1
1728
F


8
14
21
16
16
12
9
6
3
2
1



107
G


1
5
14
19
14
12
12
6
4
2
1
1


92
H

2
1
5
13
16
15
15
8
5
3
2
1



86
I

55
68
71
97
87
87
85
65
47
32
18
10
6
2
1
731
J
5
18

5
7
8
3
4
1
0
0





53
K
















1
L
39
148
63
76
45
45
44
41
28
19
13
8
4
2
1

577
M
6
9
17
32
54
42
34
30
25
18
11
8
4
2
1

294
N
15
92
52
68
63
76
79
72
68
50
30
20
10
6
2
1
705
O

22
36
95
77
70
70
63
38
29
19
11
5
3
1

540
P

1
31
47
29
36
37
34
24
17
10
5
2
1


275
Q

25
53
2
6
8
10
9
4
4
3
1




127
R

1
29
66
87
115
106
96
61
42
24
13
6
4
2

654
S
14
36
154
121
76
96
82
72
54
35
24
13
7
4
2

790
T
2
61
43
74
118
91
84
73
65
44
28
17
9
5
2
1
719
U

94
121
109
54
64
70
58
31
20
12
6
2
1
1

644
V

2
5
36
32
29
26
15
10
7
3
2
1



168
W
















1
X


7
12
3
3
5
4
3
3
1





41
Y
7
1
2
4
5
4
4
3
1
1
1





33
Z


1
4
4
4
3
2
1







19

176
546
318
292
242
207
168
128
84
52
29
16
7
4
1
0






Conséquences

E A S I T N R U L O D C M P V Q F B G H J X Y Z K W

 C'est l'alphabet français ordonné par ordre décroissant de fréquences dans les textes précédents. On peut estimer que cet ordre reste à peu près valable  dans la langue française courante. (Les statistiques séparés pour chacun des textes montrent que les fréquences varient très peu et que l'ordre est identique à quelques permutations entre lettres de fréquences voisines près.)

 La connaissance de cet ordre a des applications industrielles incroyables : jouer efficacement au pendu, faire une bonne fois pour toutes un codage de Huffman pour les textes français et faire un jeu de Scrabble .

 En effet regardons un instant les liens entre l'ordre précédent, les valeurs des lettres au Scrabbles et leur répartition :

Lettre
E
A
S
I
T
N
R
U
L
O
D
C
M
P
V
Q
F
B
G
H
J
X
Y
Z
K
W
Points
1
1
1
1
1
1
1
1
1
1
2
3
2
3
4
8
4
3
2
4
8
10
10
10
10
10
Nombre
15
9
6
8
6
6
6
6
5
6
3
2
3
2
2
1
2
2
2
2
1
1
1
1
1
1

Observations :
  • Les statistiques détaillées texte par texte montrent que I n'apparaît plus que S que dans La Princesse de Clèves.
  • Le Q est bien payé ! Peut-être parce qu'il est difficilement utilisable sans U (les statistiques le comptent essentiellement dans les mots de 2 ou 3 lettres)
  • Mais surtout : le G est SCANDALEUSEMENT sous-estimé !
Objections :
  • "Oui, mais bon, jouer au Scrabble c'est pas jouer à Balzac..." . En effet la question de la pertinence de textes littéraires comme étalon-scrabble n'est pas évidente. Ce n'est pas uniquement le dernier roman lu qui permet de trouver un mot face à ses 7 lettres.
  • La facilité à relier une lettre compte aussi (par exemple le S s'utilise facilement pour mettre au pluriel...) : si quelqu'un a le courage de faire des recherches non plus sur les lettres prises séparement mais sur leurs apparitions dans les syllabes (magnifique sujet de thèse)...
  • Réussir à placer une lettre ne dépend pas seulement de sa fréquence dans la langue mais aussi du nombre de mots distincts dans lesquels elle apparaît : le Q est très fréquent (que, quoi etc.) mais dans un ensemble de mots assez restreint. Pour information, l'ordre obtenu avec le dictionnaire Le Littré est  est ERIATNOLSUCMPDGHBFVQYXJZKW. Le Q est bien rejeté en arrière tandis que le G y gagne... Il est à noter que l'édition originale du jeu (en anglois donc) s'est faite sur la base d'un exemplaire du NEW-YORK TIMES. Pour le jeu français je n'en sais rien : éclairez moi !
  • "On s'en fiche : on pourrait aussi bien mettre sept X et un seul E, ça serait injouable mais il y aurait toujours des gens pour apprendre les 7012 mots de la langue française qui contiennent X...et puis de toutes façons j'aime pas le Scrabble." -> Désolé de vous avoir embêté alors.

Si malgré ces quelques objections vous restez, à mon instar, convaincus que la lettre G est victime d'une affreuse conspiration visant à la discréditer auprès du public,
adhérez
au MRGS ( Mouvement pour la Revalorisation du G au Scrabble ) , association reconnue d'inutilité publique. Pour seulement 0 (vous pourrez même en déduire 50% de vos impôts !) vous recevrez une jolie carte de membre ( enfin dès que je l'aurai faite) et vous aurez la satisfaction de contribuer à la défense des opprimés.