Les nombres en toutes lettres : Explication de l'algorithme

Des chiffres vers les lettres

La traduction des chiffres en lettres se compose de trois phases : la décomposition arithmétique, la simplification et la verbalisation. La décomposition arithmétique permet de retrouver l'expression sous-entendue. Cette expression n'est pas utilisée telle quelle, elle doit d'abord suivre une simplification en grande partie due à l'usage. Une fois cette simplification effectuée, il n'y a plus qu'à l'expression arithmétique traduire en lettres. Pour cela on oublie les symboles «+», «*», «(» et «)» et on traduit mot à mot en ajoutant quelques liaisons syntaxiques.

La décomposition arithmétique

La décomposition en une expression arithmétique et sujet à variations mais suit toujours le même principe. Il s'agit de faire une division euclidienne par un nombre pivot puis de recommencer la décomposition sur le quotient et le reste avec un nombre pivot plus petit. Les nombres pivots sont (à part 20) des puissances de dix : dans l'ordre 10⁹, 10⁶, 10³, 100, 20 et 10. Remarquons que l'usage du 20 comme pivot (pour quatre-vingts par exemple) diffère suivant les pays. Je suppose, sans aucune certitude, que cette décomposition en vingtaines est due à l'ancienne façon de compter la monnaie quand 1 franc valait 20 sous. Si quelqu'un possède des informations précises permettant d'infirmer ou confirmer cette hypothèse, elles m'intéressent beaucoup.

La décomposition arithmétique
dec(n)	--> si 10⁹<=n	dec(n/10⁹) * 10⁹ + dec(n%10⁹)
dec(n)	--> si 10⁶<=n	dec(n/10⁶) * 10⁶ + dec(n%10⁶)
dec(n)	--> si 10³<=n	dec(n/10³) * 10³ + dec(n%10³)
dec(n)	--> si 100<=n	dec(n/100) * 100 + dec(n%100)
dec(n)	--> en Belgique : si 80<=n<90 ou en France : si 60<=n<100	dec(n/20) * 20 + dec(n%20)
dec(n)	--> en Suisse : si 10<n<100 en Belgique : si 10<n<80 ou 90<=n<100 en France : si 10<=n<60	dec(n/10) * 10 + dec(n%10)
dec(n)	-->	n

Avant de continuer, voici quelques explications sur cette définition. Ce tableau représente la définition récursive de la fonction dec. Les lignes sont à lire de haut en bas, chacune représente une règle de calcul de cette fonction. Le première règle dont la condition de garde est vérifiée doit être appliquée. Par exemple la première règle peut se paraphraser comme « si n est supérieur à 10⁹ alors, la valeur de la fonction est l'expression arithmétique composée par le produit de dec(n/10⁹) par 10⁹ plus dec(n%10⁹) ».

Regardons pas à pas l'exécution de cette fonction sur un exemple. Les nombres en gras indiquent là où il y a un calcul à effectuer.

Nombre départ : 200532
Décomposition en milliers : 200*10³+532
Décomposition en centaines : (2*100+0)*10³+5*100+ 32
Décomposition en dizaines : (2*100+0)*10³+5*100+3*10+2
Fin du calcul : (2*100+0)*10³+5*100+3*10+2

On remarquera que le résultat de toutes les expressions arithmétiques affichées est toujours 200532.

La simplification

Une fois cette décomposition faite, on simplifie l'expression. Cette simplification comprend une simplification mathématique évidente (on supprime les additions de zéro) et d'autres simplifications de nature plus linguistique guidées par l'usage

La simplification
appels récursifs
simpl(n*m)	-->	simpl^*(simpl(n),simpl(m))
simpl(n+m)	-->	simpl⁺(simpl(n),simpl(m))
simpl(n)	-->	n
simplifications additives
simpl⁺(n,0)	-->	n
simpl⁺(10,1)	-->	11
simpl⁺(10,2)	-->	12
simpl⁺(10,3)	-->	13
simpl⁺(10,4)	-->	14
simpl⁺(10,5)	-->	15
simpl⁺(10,6)	-->	16
simpl⁺(n,m)	-->	n+m
simplifications multiplicatives
simpl^*(1,10)	-->	10
simpl^*(2,10)	-->	20
simpl^*(3,10)	-->	30
simpl^*(4,10)	-->	40
simpl^*(5,10)	-->	50
simpl^*(6,10)	-->	60
simpl^*(7,10)	-->	70
simpl^*(8,10)	-->	80
simpl^*(9,10)	-->	90
simpl^*(3,20)	-->	60
simpl^*(1,100)	-->	100
simpl^*(1,10³)	-->	10³
simpl^*(n,m)	-->	n*m

Remarquons, que nous avons ici défini ici trois fonctions simpl, simpl⁺ et simpl^*. Seule la première va être appelée par la suite. Les deux autres ne sont que des fonctions auxiliaires.

Notre exemple :

Avant la simplification : (2*100+0)*10³+5*100+3*10+2
Après la simplification : (2*100)*10³+5*100+30+2

La verbalisation

Une fois cette expression simplifié il n'y plus qu'à la traduire mot à mot. Une difficulté à résoudre est le choix des liaisons syntaxiques « -et- », « et », « - » ou simplement un espace. Une seconde est l'accord du pluriel.

Les liaisons syntaxiques
les liaisons additives
lien⁺(4*20,1)	-->	-
lien⁺(60,11)	-->	-et-
lien⁺(n,1)	--> si n<100	-et-
lien⁺(n,m)	--> si n<100	-
lien⁺(n,m)	-->	(espace)
liaisons multiplicatives
lien^*(4,20)	-->	-
lien^*(n,m)	-->	(espace)

Ces fonctions décrivent le choix des liaisons syntaxiques. Il ne s'agit que de l'usage le plus courant, d'autres existent. En Afrique francophone, par exemple, la liaison en « -et- » est plus utilisée. on entendra par facilement « quarante-et-trois » ou « cinquante-et-quatre ».

Le lexique
avec accord possible
lex^p(20)	-->	vingts
lex^p(100)	-->	cents
lex^p(10⁶)	-->	millions
lex^p(10⁹)	-->	milliards
lex^p(i)	-->	lex^s(i)
sans accord possible
lex^s(0)	-->	zéro
lex^s(1)	-->	un
lex^s(2)	-->	deux
lex^s(3)	-->	trois
lex^s(4)	-->	quatre
lex^s(5)	-->	cinq
lex^s(6)	-->	six
lex^s(7)	-->	sept
lex^s(8)	-->	huit
lex^s(9)	-->	neuf
lex^s(10)	-->	dix
lex^s(11)	-->	onze
lex^s(12)	-->	douze
lex^s(13)	-->	treize
lex^s(14)	-->	quatorze
lex^s(15)	-->	quinze
lex^s(16)	-->	seize
lex^s(20)	-->	vingt
lex^s(30)	-->	trente
lex^s(40)	-->	quarante
lex^s(50)	-->	cinquante
lex^s(60)	-->	soixante
lex^s(70)	-->	septante
lex^s(80)	-->	huitante
lex^s(90)	-->	nonante
lex^s(100)	-->	cent
lex^s(10³)	-->	mille
lex^s(10⁶)	-->	million
lex^s(10⁹)	-->	milliard

Tous les mots de ce lexique ne sont pas utilisés dans tous les pays francophones. Le terme « huitante », par exemple, n'est utilisé qu'en Suisse. Il est cependant possible de se servir exactement de la même fonction quelque soit le pays. Il se trouve simplement qu'en France, la valeur 80 ne sera jamais utilisée à ce moment : elle aura été décomposé en 4*20 au cours de la phase précédente.

La traduction finale
avec accord possible
verb^p(n+m)	-->	verb^s(n)^lien⁺(n,m)^verb^p(m)
verb^p(n*m)	--> si n>1	verb^s(n)^lien^*(n,m)^lex^p(m)
verb^p(n*m)	-->	verb^s(n)^lien^*(n,m)^lex^s(m)
verb^p(i)	-->	lex^s(i)
sans accord possible
verb^s(n+m)	-->	verb^s(n)^lien⁺(n,m)^verb^s(m)
verb^s(n*m)	-->	verb^s(n)^lien^*(n,m)^verb^s(m)
verb^s(i)	-->	lex^s(i)
remarque
le symbole ^ représente la concaténation de deux chaînes de caractères.

Ces deux fonctions représente la phase finale de la traduction. Celle-ci est rendu un peu complexe par la règle sur l'accord en nombre. Ainsi on écrira « deux cents » avec un s mais « deux cent trois » sans s.

Ceci clôt la traduction des nombres de chiffres en lettres. Pour traduire un nombre n, il suffit de composer les trois fonctions ce qui s'écrit verb o simpl o dec (n) ou verb (simpl (dec (n))). Maintenant, passons à la traduction inverse.

Les nombres en toutes lettres : Explication des algorithmes

Introduction

Des chiffres vers les lettres

La décomposition arithmétique

La simplification

La verbalisation

Des lettres vers les chiffres