28
Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine [email protected] http://dtil.unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine [email protected]

Embed Size (px)

Citation preview

Page 1: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 1

Présence des langues dans le cyberespace

Daniel Prado

Directeur DTIL - Union latine

[email protected]://dtil.unilat.org

Page 2: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 2

Rappel des faits connus sur la diversité linguistique (DL)

• La moitié des langues risquent de disparaître.

• 96 % des langues parlées par 4 % des habitants de la planète.

• 70 % des langues parlées dans 20 pays, pour la plupart, les plus démunis.

Sources : CIRAL, Crystal, Unesco

Page 3: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 3

Rappel des faits connus

• 98 % des langues ne couvriraient que des besoins affectifs et locaux.

• < 150 langues disposent de la protection d’une entité publique.

• Entre 10 % et 33 % (les sources diffèrent) des langues seraient écrites.

Sources : CIRAL, Crystal, Unesco

Page 4: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 4

• Plus de 60 % des pays de la planète ont pour langue officielle l’anglais (~22 %), le français (~15 %) l’espagnol (~10 %), l’arabe (~10 %), le russe ou le portugais.

• 6 langues (DE, EN, ES, FR, JA et RU) produiraient les 2/3 des titres du monde, dont l’anglais, 28 %.

• 30 langues publient annuellement au moins 1 000 titres.

Sources : CIRAL, Calvet

Rappel des faits connus

Page 5: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 5

Diversité linguistique et cyberespace

Page 6: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 6

Diversité linguistique par région

Europe

Asie de l'Est (CN, JP, KR, TW )

Reste de l'Asie

Afrique/Moyen Orient

Océanie

Amérique latineAmérique du Nord

Source : Ethnologue

Page 7: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 7

Nombre d’internautes par région

Amérique latine

Europe

Amérique du Nord

Asie de l'Est (CN, JP, KR, TW )

Reste de l'Asie

Afrique / Moyen-Orient

Océanie

Source : Internet World Stats 2009

Page 8: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 8

Comparaison répartition internautes/diversité linguistique

Asie

de l'E

st

Europ

e

Amér

ique

du Nor

d

Amér

ique

latin

e

Océan

ie

Reste

de

l'Asi

e

Afriqu

e / M

oyen

-Orie

nt

Internautes

Diversité linguistique

Page 9: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 9

Quelques données anecdotiques…

mais non moins éclairantes • En 2005, l’islandais (240 000 locuteurs) était reconnu par

Google, mais pas le kiswahili (30 millions de locuteurs) ou le hindi (300 millions de locuteurs).

• Aujourd’hui, le hindi est reconnu, mais aucune langue africaine, américaine ou océanienne ne l’est, sur un ensemble de < 50 langues. Son interface est disponible en 120 langues

• Nombre de langues dans Wikipédia : moins de 300

Page 10: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 10

Langues des internautes

Source : Internet World Stats 2009

Page 11: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 11

0 %

100 %

95 96 97 98 99 00 01 02 03 04 05 06 07 08 09

Présence de l’anglais dans le Web

Page 12: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 12

Les langues romanes dans la Toile

•Tableau évolution 1998-2007

Source: FUNREDES-Union latine

Page 13: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 13

• Autres langues très présentes selon d’autres études : chinois, japonais, suédois, arabe, etc.

• Attention aux interprétations :*Nombre d’utilisateurs ≠ Nombre de pages ;

• Il existe d’autres méthodes, mais basées sur des techniques de sondages (peu représentatifs) ou d’algorithmes linguistiques de moteurs de recherche (peu fiables).

D’autres études…

Page 14: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 14

http://dtil.unilat.org/public/12_annees_langues_internet.pdf

0

1

2

3

4

5

6

7

8

1998 2000 2001 2002 2003 2004 2005  2007 

ESPAGNOL

FRANÇAIS

PORTUGAIS

ITALIEN

ROUMAIN

ALLEMAND

CATALAN

Évolution langues romanes (et allemand) entre 1998-2007 — Web

Page 15: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 15

Production et productivité par région

Pays

Production en

espagnolProductivi

té Pays

Production en

françaisProductivi

Espagne 55,79 % 2,63

Europe francophone 75,13 % 1,09

Argentine 9,40 % 0,64

Amérique francophone 22,20 % 1,06

Autres 34,81 % 0,54 Autres 2,67 % 0,84Production = % de pages produites dans la langue

Productivité = Production / % internautes parlant cette langue

Page 16: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 16

Recul des langues moins répandues ?• En 2003, seuls 3,22 % des 1374 sites africains étudiés, la langue de

communication était une langue africaine [Diki-Kidiri, 2003]

• Selon le Language Observatory Project (Japon) :

2006 2008

Langues asiatiques moins répandues (sans chinois, japonais ni coréen)

52,5 % 41 %

Recul en faveur de l’anglais, chinois, russe, japonais et coréen

Langues africaines 2,5 % 1,2 %

Recul en faveur de l’anglais, français, portugais et arabe

La tendance à favoriser les langues dominantes semble reprendre

Page 17: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 17

Langues de « prestige » et « spirale des langues »

« Lorsque les locuteurs d’une langue de moindre diffusion utilisent la langue, “de prestige” à > 50 % du

temps, il y a de fortes chances que la génération suivante l’emploie à 100 % du temps » (Dixon)

« Moindre valeur, moindre usage ; moindre usage, moindre valeur » (Leáñez Aristimuño)

Page 18: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 18

Équipement des langues

• Langues « équipées » :– couvrent tous les secteurs importants pour la majorité de

ses locuteurs.

• Langues facilement « équipables » :– plusieurs secteurs majeurs couverts, mais il reste encore

de nombreuses lacunes ;– population, moyens matériels disponibles et valorisation

de la langue permettent de combler ses lacunes.

• Langues difficilement « équipables » :– ne couvrent qu’une faible partie des secteurs nécessaires ;– faible population et/ou faibles moyens et/ou faible

valorisation de la langue.

Leáñez Aristimuño

Page 19: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 19

• Grosso modo, les 30 premières langues reconnues par Google en 2005 étaient les grandes productrices de littérature traditionnelle et ont une présence visible dans la connaissance.

• Après une progression des langues moins diffusées, on constate un tassement et une régression sur le Web.

• Les grandes langues de communication connaissent également une situation similaire, mais moins grave, car elles paraissent être prédatrices vis-à-vis des premières.

• La tendance plus « commerciale » du Web constaté ces dernières années pourrait expliquer ces deux derniers phénomènes.

• La productivité de pages Web des langues « équipées » paraît être liée aux conditions socioéconomiques des locuteurs et non pas aux langues elles-mêmes.

Quelques constatations

Page 20: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 20

• Le cyberespace n’est-il pas que le reflet de la présence des langues dans la connaissance et dans le commerce ?

• Les langues moins équipées souffrent-elles d’un manque de prestige dans le Web par le fait de ne pas être vecteurs de commerce ?

• La régression constatée des langues équipées est-elle due à la même situation vis-à-vis de l’anglais ou est-elle provoquée par les nouvelles tendances des moteurs de recherche ?

• Pour les langues équipées, est-ce l’alphabétisation numérique qui produit des internautes producteurs au Nord et consommateurs au Sud ?

Quelques questions

Page 21: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 21

• Comment une langue dite « orale » peut-elle emprunter les voies du cyberespace ?

• Comment éviter la spirale des langues ?

• L’Internet confère-t-il « du prestige » à une langue ?

• …et tant d’autres questions…

Quelques questions

Page 22: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 22

Comment assurer la présence d’une langue dans le

cyberespace ?Marcel Diki-Kidiri

Publication en français, anglais, russe, espagnol et portugais

(UNESCO-Union latine)

http://unesdoc.unesco.org/images/0014/001497/149786f.pdf

Page 23: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 23

Élaboration de ressources linguistiques • Sélection de textes, transcription phonétique, analyse et

notation de phonèmes et de tons, élaboration d’une orthographe, ouvrage de référence (« grammaire »)

• Développement terminologique Élaboration de ressources informatiques

• Systèmes d’écriture et orthographes • Jeux et polices de caractères, codage des caractères • Localisation des logiciels

Élaboration de contenus culturels • Textes, son, images• Voies d’accès au cyberespace (sites-blogs, messagerie,

messagers, téléphonie, vidéos, etc.)Développer la communauté des utilisateurs (actions tant socioculturelles que politiques)

Cet ouvrage a ouvert la voie…

Comment assurer… ?M. Diki-Kidiri

Page 24: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 24

Page 25: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 25

Maaya - 2007-2009

Coalition dynamique pour la diversité linguistique au sein du Forum sur la gouvernance de l’Internet (IGF) (Rio — 2007 et Hyderâbâd – 2008)

Sous-modération du point Diversité linguistique de la ligne C8 du plan d’action du SMSI

Congrès mondial sur la traduction spécialisée (La Havane – décembre 2008)

Forum international sur le multilinguisme (Bamako - janvier 2009)

Colloque Langues et cyberespace (Barcelone – juin 2009)

Page 26: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 26

Le réseau Maaya propose, entre autres, ces objectifs :(après le Forum de Bamako et en accord avec la Coalition dynamique pour la diversité

linguistique, s’appuyant sur la ligne C8 du SMSI)

- Création de conditions pour l’usage des langues locales dans la gestion locale

- Recensement des ressources techniques et humaines de toutes les langues parlées

- Recensement des langues non outillées convenablement

- Sensibilisation aux enjeux de l'inclusion numérique

- Utilisation éthique de l'information en matière linguistique

- Participation universelle dans les décisions sur la gouvernance des TIC

- Site centralisateur d'outils linguistiques libres et gratuits

- …

Page 27: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 27

- Sommet mondial du multilinguisme — En préparation avec l’UNESCO

- « Manuel didactique sur les enjeux des langues dans le cyberespace »

• Parrainé par l’UNESCO et demandes en cours auprès de l’UIT et l’ONU• 30 articles en coopération et sur la base d’un cahier des charges• Une trentaine d’auteurs de 25 pays différents• En PDF, papier, cédérom et produits dérivés• Anglais-français en simultané• Très probablement d’autres langues onusiennes• Invitation à sa traduction pour d’autres langues

- Système de veille sur le comportement des langues dans le cyberespace - Demande en cours

Et notamment :

Page 28: Colloque Vox Internet II - Paris, 26-27 mars 2010 1 Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org

Colloque Vox Internet II - Paris, 26-27 mars 2010 28

Présence des langues dans le cyberespace

Daniel Prado

Directeur DTIL - Union latine

[email protected]://dtil.unilat.org