Les mesures et les indicateurs

Est-il raisonnable de définir et conduire des politiques linguistiques dans l'espace numérique sans détenir des indications amples, fiables et précises sur la situation de la langue et son évolution?

Très paradoxalement, le monde des réseaux qui est né et s’est développé au sein de l’université a pendant longtemps abandonné la mesure de la place des langues à des entreprises de marketing répondant à des logiques distinctes de celle de la publication scientifique (et donc peu soucieuses de documenter leurs méthodes).

Il en a résulté un désordre et une confusion sur l’état des langues dans l’Internet qui a pu faire le lit de la désinformation. Ainsi, alors que le nombre de locuteurs de langue anglaise qui utilise le réseau a pu passé de plus de 80%, l’année de la naissance du Web, a environ 35% aujourd’hui, les chiffres qui circulent dans les médias sur le pourcentage de pages Web en anglais continuent, contre toute évidence, à se situer de manière stable entre 70 et 80% !

Il est urgent que l’académie reprenne son rôle dans cette affaire (ainsi que les institutions gouvernementales nationales et internationales) et les signes sont clairs que cette évolution est en cours, enfin ! Pour s’en rendre compte, il faut consulter les présentations en ligne de la réunion organisée par l’UNESCO (avec l’ACALAN et l’AIF) à Bamako sur le multilinguisme dans le cyberespace.

En attendant que cette évolution porte ses fruits (des indicateurs fiables, documentés et mis à jour à la vitesse de l’évolution du média), obtenir une perspective sur la situation et les tendances est extrêmement difficile.

Les données sur la proportion des internautes dans chaque langue

Global Reach fournit avec une grande régularité des chiffres qui reposent, certes, sur des sources multiples et non cohérentes sur le plan méthodologique, mais au moins elles sont connues (Figure 1). Les chiffres ne sont pas d’une totale fiabilité mais ils ont le mérite d’exister et d’être maintenu à jour avec fréquence; si on leur accorde une confiance relative (plus ou moins 20% d’erreur), ils permettent d’obtenir une perspective raisonnable de l’évolution de la population d’internautes en termes de langue.

Données relatives aux langues sur le Web

Pour la place des langues sur le Web, il y a un certain nombre d’approches qui cohabitent :

  • L’une consiste à extrapoler les chiffres des moteurs de recherche par langue.
  • Une autre consiste à créer un échantillon de quelques milliers de sites Web par le jeu du hasard sur les adresses IP (Wikipedia, 2005d), à appliquer les moteurs de reconnaissance des langues sur cet ensemble de site et à en généraliser les résultats.
  • Il existe une ample catégorie où des chiffres sont avancés et aucune méthode n'est révélée.
  • Enfin la dernière catégorie regroupe quelque rares méthodes qui sont documentées comme l'approche très originale des chercheurs de Xerox en 2001 (Grefenstette & Nioche, 2001).

Parmi celles-ci, l'approche que FUNREDES et l'Union Latine ont utilisée dans la Figure 2.

Retour en haut de la page