Reddit – askscience – Quelle langue a le plus de mots?

De la FAQ /r/linguistique:

Quelle langue a le plus de mots?

Il est populaire de dire que l’anglais a le plus de mots basés sur le simple comptage du nombre de lemmes du dictionnaire. Les linguistes ont tendance à éviter de répondre à cette question car ce qui constitue un « mot » est difficile à cerner, et toute définition précise d’un mot exclurait probablement injustement d’autres langues. Un mot en anglais est un concept très facile à saisir car l’anglais est une langue isolante qui préfère fortement les mots discrets aux morphèmes. Attends, qu’est-ce que ça veut dire ? Je vais t’expliquer.

Considérez le nom anglais dog. Il a un nombre très limité de morphèmes inflectionnels qui peuvent modifier le sens du mot. Un < s > apposé à la fin peut devenir un marqueur pluriel de chiens. Le mot chien a donc deux formes. (Nous n’envisageons pas de morphèmes libres et archaïques pour l’instant). C’est un si faible nombre de changements morphologiques que la plupart des anglophones ne remarqueront même pas. Un degré de variation aussi faible dans chaque mot signifie que l’anglais est une langue isolante, comme le chinois mandarin, et que le concept d’un mot est très simple.

Les langues du monde sont rarement aussi isolantes. La plupart des langues incluent plus de possibilités morphologiques, et les linguistes les appellent langues agglutinantes. L’espagnol est légèrement agglutinant: les suffixes peuvent distinguer le sexe d’un chien (perro contre perra), la taille (mujer « femme », mujercita « petite femme, mujerona « grande femme »), l’incident (cabeza « tête », (el) cabezazo « coup de tête, en-tête (au football) »), ainsi que prendre des sens idiomatiques (soltera « bachelorette » mais solterona « célibataire »).

À l’extrémité extrême de l’agglutination se trouvent des langues polysynthétiques capables de fusionner des sommes extraordinaires de morphèmes sur un seul nom racine. La polysynthèse peut faire dire à un seul mot ce qui prendrait en anglais une phrase entière de mots (voir Les Esquimaux ont-ils 40 mots pour la neige?). Il est donc compréhensible que les langues polysynthétiques comme le Yupik aient moins de noms racines qu’une langue isolante comme l’anglais. Cela ne signifie pas que Yupik est estropié ou incapable d’exprimer toute la gamme de la communication humaine. Ce qui doit être reconsidéré, c’est la définition d’un mot.

Edit 2: et une discussion supplémentaire ici en commençant par le commentaire de /u/kosmotron:

Mais… les longs mots composés allemands ne sont pas significativement différents de l’anglais; la différence entre les deux langues est presque purement orthographique. « Capitaine de la Danube steamer shipping association » est une construction anglaise parfaitement possible, et il passe les mêmes tests de mot que Donaudampfschifffahrtsgesellschaftskapitän. Les deux sont des noms composés.

L’anglais est également incohérent orthographiquement à cet égard. Comparez des mots comme « comptable » et « dompteur de lions » — linguistiquement, ces constructions sont exactement du même type. Dans un cas, il n’y a pas d’espace écrit et dans l’autre, il y a un espace. Purement orthographique.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.