Upload
gilbertine-lefranc
View
102
Download
0
Embed Size (px)
Citation preview
Colloque Vox Internet II - Paris, 26-27 mars 2010 1
Présence des langues dans le cyberespace
Daniel Prado
Directeur DTIL - Union latine
[email protected]://dtil.unilat.org
Colloque Vox Internet II - Paris, 26-27 mars 2010 2
Rappel des faits connus sur la diversité linguistique (DL)
• La moitié des langues risquent de disparaître.
• 96 % des langues parlées par 4 % des habitants de la planète.
• 70 % des langues parlées dans 20 pays, pour la plupart, les plus démunis.
Sources : CIRAL, Crystal, Unesco
Colloque Vox Internet II - Paris, 26-27 mars 2010 3
Rappel des faits connus
• 98 % des langues ne couvriraient que des besoins affectifs et locaux.
• < 150 langues disposent de la protection d’une entité publique.
• Entre 10 % et 33 % (les sources diffèrent) des langues seraient écrites.
Sources : CIRAL, Crystal, Unesco
Colloque Vox Internet II - Paris, 26-27 mars 2010 4
• Plus de 60 % des pays de la planète ont pour langue officielle l’anglais (~22 %), le français (~15 %) l’espagnol (~10 %), l’arabe (~10 %), le russe ou le portugais.
• 6 langues (DE, EN, ES, FR, JA et RU) produiraient les 2/3 des titres du monde, dont l’anglais, 28 %.
• 30 langues publient annuellement au moins 1 000 titres.
Sources : CIRAL, Calvet
Rappel des faits connus
Colloque Vox Internet II - Paris, 26-27 mars 2010 5
Diversité linguistique et cyberespace
Colloque Vox Internet II - Paris, 26-27 mars 2010 6
Diversité linguistique par région
Europe
Asie de l'Est (CN, JP, KR, TW )
Reste de l'Asie
Afrique/Moyen Orient
Océanie
Amérique latineAmérique du Nord
Source : Ethnologue
Colloque Vox Internet II - Paris, 26-27 mars 2010 7
Nombre d’internautes par région
Amérique latine
Europe
Amérique du Nord
Asie de l'Est (CN, JP, KR, TW )
Reste de l'Asie
Afrique / Moyen-Orient
Océanie
Source : Internet World Stats 2009
Colloque Vox Internet II - Paris, 26-27 mars 2010 8
Comparaison répartition internautes/diversité linguistique
Asie
de l'E
st
Europ
e
Amér
ique
du Nor
d
Amér
ique
latin
e
Océan
ie
Reste
de
l'Asi
e
Afriqu
e / M
oyen
-Orie
nt
Internautes
Diversité linguistique
Colloque Vox Internet II - Paris, 26-27 mars 2010 9
Quelques données anecdotiques…
mais non moins éclairantes • En 2005, l’islandais (240 000 locuteurs) était reconnu par
Google, mais pas le kiswahili (30 millions de locuteurs) ou le hindi (300 millions de locuteurs).
• Aujourd’hui, le hindi est reconnu, mais aucune langue africaine, américaine ou océanienne ne l’est, sur un ensemble de < 50 langues. Son interface est disponible en 120 langues
• Nombre de langues dans Wikipédia : moins de 300
Colloque Vox Internet II - Paris, 26-27 mars 2010 10
Langues des internautes
Source : Internet World Stats 2009
Colloque Vox Internet II - Paris, 26-27 mars 2010 11
0 %
100 %
95 96 97 98 99 00 01 02 03 04 05 06 07 08 09
Présence de l’anglais dans le Web
Colloque Vox Internet II - Paris, 26-27 mars 2010 12
Les langues romanes dans la Toile
•Tableau évolution 1998-2007
Source: FUNREDES-Union latine
Colloque Vox Internet II - Paris, 26-27 mars 2010 13
• Autres langues très présentes selon d’autres études : chinois, japonais, suédois, arabe, etc.
• Attention aux interprétations :*Nombre d’utilisateurs ≠ Nombre de pages ;
• Il existe d’autres méthodes, mais basées sur des techniques de sondages (peu représentatifs) ou d’algorithmes linguistiques de moteurs de recherche (peu fiables).
D’autres études…
Colloque Vox Internet II - Paris, 26-27 mars 2010 14
http://dtil.unilat.org/public/12_annees_langues_internet.pdf
0
1
2
3
4
5
6
7
8
1998 2000 2001 2002 2003 2004 2005 2007
ESPAGNOL
FRANÇAIS
PORTUGAIS
ITALIEN
ROUMAIN
ALLEMAND
CATALAN
Évolution langues romanes (et allemand) entre 1998-2007 — Web
Colloque Vox Internet II - Paris, 26-27 mars 2010 15
Production et productivité par région
Pays
Production en
espagnolProductivi
té Pays
Production en
françaisProductivi
té
Espagne 55,79 % 2,63
Europe francophone 75,13 % 1,09
Argentine 9,40 % 0,64
Amérique francophone 22,20 % 1,06
Autres 34,81 % 0,54 Autres 2,67 % 0,84Production = % de pages produites dans la langue
Productivité = Production / % internautes parlant cette langue
Colloque Vox Internet II - Paris, 26-27 mars 2010 16
Recul des langues moins répandues ?• En 2003, seuls 3,22 % des 1374 sites africains étudiés, la langue de
communication était une langue africaine [Diki-Kidiri, 2003]
• Selon le Language Observatory Project (Japon) :
2006 2008
Langues asiatiques moins répandues (sans chinois, japonais ni coréen)
52,5 % 41 %
Recul en faveur de l’anglais, chinois, russe, japonais et coréen
Langues africaines 2,5 % 1,2 %
Recul en faveur de l’anglais, français, portugais et arabe
La tendance à favoriser les langues dominantes semble reprendre
Colloque Vox Internet II - Paris, 26-27 mars 2010 17
Langues de « prestige » et « spirale des langues »
« Lorsque les locuteurs d’une langue de moindre diffusion utilisent la langue, “de prestige” à > 50 % du
temps, il y a de fortes chances que la génération suivante l’emploie à 100 % du temps » (Dixon)
« Moindre valeur, moindre usage ; moindre usage, moindre valeur » (Leáñez Aristimuño)
Colloque Vox Internet II - Paris, 26-27 mars 2010 18
Équipement des langues
• Langues « équipées » :– couvrent tous les secteurs importants pour la majorité de
ses locuteurs.
• Langues facilement « équipables » :– plusieurs secteurs majeurs couverts, mais il reste encore
de nombreuses lacunes ;– population, moyens matériels disponibles et valorisation
de la langue permettent de combler ses lacunes.
• Langues difficilement « équipables » :– ne couvrent qu’une faible partie des secteurs nécessaires ;– faible population et/ou faibles moyens et/ou faible
valorisation de la langue.
Leáñez Aristimuño
Colloque Vox Internet II - Paris, 26-27 mars 2010 19
• Grosso modo, les 30 premières langues reconnues par Google en 2005 étaient les grandes productrices de littérature traditionnelle et ont une présence visible dans la connaissance.
• Après une progression des langues moins diffusées, on constate un tassement et une régression sur le Web.
• Les grandes langues de communication connaissent également une situation similaire, mais moins grave, car elles paraissent être prédatrices vis-à-vis des premières.
• La tendance plus « commerciale » du Web constaté ces dernières années pourrait expliquer ces deux derniers phénomènes.
• La productivité de pages Web des langues « équipées » paraît être liée aux conditions socioéconomiques des locuteurs et non pas aux langues elles-mêmes.
Quelques constatations
Colloque Vox Internet II - Paris, 26-27 mars 2010 20
• Le cyberespace n’est-il pas que le reflet de la présence des langues dans la connaissance et dans le commerce ?
• Les langues moins équipées souffrent-elles d’un manque de prestige dans le Web par le fait de ne pas être vecteurs de commerce ?
• La régression constatée des langues équipées est-elle due à la même situation vis-à-vis de l’anglais ou est-elle provoquée par les nouvelles tendances des moteurs de recherche ?
• Pour les langues équipées, est-ce l’alphabétisation numérique qui produit des internautes producteurs au Nord et consommateurs au Sud ?
Quelques questions
Colloque Vox Internet II - Paris, 26-27 mars 2010 21
• Comment une langue dite « orale » peut-elle emprunter les voies du cyberespace ?
• Comment éviter la spirale des langues ?
• L’Internet confère-t-il « du prestige » à une langue ?
• …et tant d’autres questions…
Quelques questions
Colloque Vox Internet II - Paris, 26-27 mars 2010 22
Comment assurer la présence d’une langue dans le
cyberespace ?Marcel Diki-Kidiri
Publication en français, anglais, russe, espagnol et portugais
(UNESCO-Union latine)
http://unesdoc.unesco.org/images/0014/001497/149786f.pdf
Colloque Vox Internet II - Paris, 26-27 mars 2010 23
Élaboration de ressources linguistiques • Sélection de textes, transcription phonétique, analyse et
notation de phonèmes et de tons, élaboration d’une orthographe, ouvrage de référence (« grammaire »)
• Développement terminologique Élaboration de ressources informatiques
• Systèmes d’écriture et orthographes • Jeux et polices de caractères, codage des caractères • Localisation des logiciels
Élaboration de contenus culturels • Textes, son, images• Voies d’accès au cyberespace (sites-blogs, messagerie,
messagers, téléphonie, vidéos, etc.)Développer la communauté des utilisateurs (actions tant socioculturelles que politiques)
Cet ouvrage a ouvert la voie…
Comment assurer… ?M. Diki-Kidiri
Colloque Vox Internet II - Paris, 26-27 mars 2010 24
Colloque Vox Internet II - Paris, 26-27 mars 2010 25
Maaya - 2007-2009
Coalition dynamique pour la diversité linguistique au sein du Forum sur la gouvernance de l’Internet (IGF) (Rio — 2007 et Hyderâbâd – 2008)
Sous-modération du point Diversité linguistique de la ligne C8 du plan d’action du SMSI
Congrès mondial sur la traduction spécialisée (La Havane – décembre 2008)
Forum international sur le multilinguisme (Bamako - janvier 2009)
Colloque Langues et cyberespace (Barcelone – juin 2009)
Colloque Vox Internet II - Paris, 26-27 mars 2010 26
Le réseau Maaya propose, entre autres, ces objectifs :(après le Forum de Bamako et en accord avec la Coalition dynamique pour la diversité
linguistique, s’appuyant sur la ligne C8 du SMSI)
- Création de conditions pour l’usage des langues locales dans la gestion locale
- Recensement des ressources techniques et humaines de toutes les langues parlées
- Recensement des langues non outillées convenablement
- Sensibilisation aux enjeux de l'inclusion numérique
- Utilisation éthique de l'information en matière linguistique
- Participation universelle dans les décisions sur la gouvernance des TIC
- Site centralisateur d'outils linguistiques libres et gratuits
- …
Colloque Vox Internet II - Paris, 26-27 mars 2010 27
- Sommet mondial du multilinguisme — En préparation avec l’UNESCO
- « Manuel didactique sur les enjeux des langues dans le cyberespace »
• Parrainé par l’UNESCO et demandes en cours auprès de l’UIT et l’ONU• 30 articles en coopération et sur la base d’un cahier des charges• Une trentaine d’auteurs de 25 pays différents• En PDF, papier, cédérom et produits dérivés• Anglais-français en simultané• Très probablement d’autres langues onusiennes• Invitation à sa traduction pour d’autres langues
- Système de veille sur le comportement des langues dans le cyberespace - Demande en cours
Et notamment :
Colloque Vox Internet II - Paris, 26-27 mars 2010 28
Présence des langues dans le cyberespace
Daniel Prado
Directeur DTIL - Union latine
[email protected]://dtil.unilat.org