Module:Langue/Data

De Wikirouge
Aller à la navigation Aller à la recherche


Ce module est une base de données de langues destinée à être chargé par mw.loadData.

1 Avertissements

Attention à la syntaxe lors de la modification de ces données : cette page est utilisée par un programme informatique qui n'accepte pas qu'une virgule soit absente. Seules possibilités :

  • les données saisies peuvent être entourées de guillemets doubles (") ou simples (') — mais pas de guillemets français («  »)
  • des espaces peuvent être ajoutées pour améliorer la lisibilité.

Avant d'ajouter une langue, vérifier qu'elle n'est pas déjà liée à un autre code dans la liste.

Pour rechercher le code approprié :

  • obtenir le nom de la langue en anglais (par exemple grâce au lien interlangue sur l'article de la langue) ;
  • rechercher celui-ci dans la liste complète des codes IETF du registre tenu à jour par l'IANA ;
  • si la langue ne possède pas de code IETF, elle ne doit pas figurer dans cette base.

2 Structure du fichier

Pour chaque code IETF, il y a une ligne de ce type :

<code IETF> = { "<nom de la langue en français>", "<autre nom>" },

Si le code IETF contient des tirets, il faut l'entourer de guillemet et de crochets. Il peut y avoir plusieurs autres noms ou aucun, chacun entre guillemet et séparé par des virgules. Ces noms seront utilisés par le modèle {{code langue}} pour retrouver un code à partir du nom de la langue, ils doivent donc être uniques.

Exemples :

  • français, code IETF « fr »
    fr = {"français"},
  • finnois, code IETF « fi »
    fi = { "finnois", "finlandais", "finnish" },
  • monténégrin, code IETF « sr-ME »
    ["sr-me"] = {"monténégrin"},

Cette syntaxe est complétée par des options, séparées par une virgule :

  • Si la page Wikipédia à propos de cette langue ne porte pas le nom de la langue, on ajoute une donnée « page = "<page wikipédia de cette langue>" »
  • Si la langue s'écrit de droite à gauche, on ajoute une donnée « rtl = true » (rtl pour right to left, pas de guillemets autour de true)
  • Si la langue est une langue des signes, on ajoute une donnée « signe = true » (pas de guillemets autour de true)
  • Si le code n'est pas un code IETF valide, mais qu'il est ajouté pour éviter les erreurs de saisie, on ajoute « invalide = "<code valide>" », ce qui permet la catégorisation des pages utilisant ce code.

Exemples :

  • corse
    co = {"corse", page = "Corse (langue)"},
  • arabe, qui s'écrit de droite à gauche
    ar = {"arabe", rtl = true},
  • japonais, IETF « ja » mais souvent écrit avec le code ISO 3166-1 du Japon « JP »
    ja = {"japonais"},
    jp = {"japonais", invalide = "ja"},
    

La liste est triée par ordre alphabétique des codes IETF.

3 Utilisation dans un module Lua

Ce module exporte pour chaque nom de langue, indexé par son nom en français ou son code IETF en minuscule, une table avec les élément suivants :

  • code : code IETF de la langue ;
  • nom : nom complet, en français, de cette langue ;
  • page : nom de la page Wikipédia de cette langue, uniquement si celle-ci est différente du nom, nil dans les autres cas ;
  • rtl : booléen égal à true si cette langue s'écrit de droite à gauche (right to left), nil dans les autres cas ;
  • signe : booléen égal à true si cette langue est une langue des signes, nil dans les autres cas ;
  • invalide : booléen égal à true si ce code n'est pas un code IETF valide, nil dans les autres cas.



local data = { 
-- -------------------------------------------------------------------- -- 
--   liste des caractéristiques des langues triées par leur code IETF   --
-- -------------------------------------------------------------------- --

-- a
aa  = { "afar", page = "Afar (langue)" },
ab  = { "abkhaze" },
abe = { "abénaqui" },
ace = { "aceh", page = "Aceh (langue)" },
ach = { "acholi", page = "Acholi (langue)" },
acm = { "arabe mésopotamien" },
acy = { "arabe chypriote maronite" },
ads = { "langue des signes d'Adamorobe", "langue des signes d'adamorobe", signe = true },
ady = { "adyguéen", page = "Adyguéen (langue)" },
ae  = { "avestique", rtl = true },
aeb = { "arabe tunisien", rtl = true },
aed = { "langue des signes argentine", signe = true },
aen = { "langue des signes arménienne", signe = true },
af  = { "afrikaans" },
afg = { "langue des signes afghane", signe = true },
aha = { "ahanta" },
aib = { "aïnou", page = "Aïnou (langue ouïghoure)" },
ain = { "aïnou", page = "Aïnou (langue du Japon)" },
ak  = { "akan", page = "Akan (langue)" },
akk = { "akkadien", "assyrien" }, -- note : ce code est aussi utilisé pour l'assyrien, qui représente l'un des rameaux linguistiques de l'akkadien
ale = { "aléoute" },
alg = { "langues algonquiennes" },
aln = { "guègue" },
alq = { "algonquin" },
als = { "tosque" },    -- note : le code de l'alémanique est gsw (mais als.wikipedia est en alémanique)
alt = { "altaï", page = "Altaï (langue)" },
am  = { "amharique" },
an  = { "aragonais" },
ang = { "anglo-saxon", page = "Vieil anglais" },
ann = { "obolo" },
ar  = { "arabe", rtl = true },
arb = { "arabe standard moderne", rtl = true },
arc = { "araméen", rtl = true },
arh = { "arhuaco", "ika", page = "Arhuaco (langue)" },
arn = { "mapudungun", "mapuche" },
arq = { "arabe algérien", rtl = true },
ary = { "arabe dialectal marocain", "arabe marocain", "ma", page = "Arabe marocain", rtl = true },
arz = { "arabe égyptien", rtl = true },
as  = { "assamais" },
asb = { "assiniboine", page = "Assiniboine (langue)" },
ase = { "langue des signes américaine", signe = true },
asf = { "langue des signes australienne", signe = true },
asp = { "langue des signes algérienne", signe = true },
asq = { "langue des signes autrichienne", signe = true },
ast = { "asturien" },
asw = { "langues des signes aborigènes australiennes", signe = true },
atj = { "atikamekw", page = "Atikamekw (langue)" },
ats = { "atsina", page = "Atsina (langue)" },
auq = { "anus", "korur", page = "Anus (langue)" },
aus = { "langues aborigènes d'Australie", "australien", "langues aborigènes d'australie" },
av  = { "avar" },
avk = { "kotava" },
ay  = { "aymara", page = "Aymara (langue)" },
ayl = { "arabe libyen", rtl = true },
az  = { "azéri" },
-- b
ba  = { "bachkir" },
bal = { "baloutche", "baloutchi" },
ban = { "balinais", page = "Balinais (langue)" },
bar = { "bavarois" },
bba = { "bariba", "baatonum", "batonu", page = "Bariba (langue)" },
bbj = { "ghomala’", "ghomálá'", "ghomálá", "ghomala'", "ghomala", "ghomálá’" },
bci = { "baoulé", page = "Baoulé (langue)" },
bcl = { "bicolano central" },
bde = { "bade", page = "Bade (langue)" },
be  = { "biélorusse" },
["be-tarask"] = { "biélorusse (tarashkevitsa)", "biélorusse tarashkevitsa", "taraskievica", "tarashkevitsa", "taraškievica", "be-x-old", page = "Taraškievica" },
bej = { "bedja", page = "Beja (langue)" },
beq = { "beembe", page = "Beembe (langue de la République du Congo)" },
ber = { "berbère", "tamazight", page = "Langues berbères" },
bfi = { "langue des signes britannique", signe = true },
bfk = { "langue des signes de Ban Khor", "langue des signes de ban khor", signe = true },
bg  = { "bulgare" },
bgc = { "haryanvi", "haryani", "bangaru" },
bh  = { "bihari" },
bho = { "bhodjpouri" },
bi  = { "bichelamar" },
bjn = { "banjar", page = "Banjar (langue)" },
bm  = { "bambara" },
bmi = { "barma", "baguirmi", "bagirmi", page = "Barma (langue)" },
bn  = { "bengali" },
bnc = { "bontok", "finallig" },
bo  = { "tibétain" },
bog = { "langue des signes malienne", signe = true },
bol = { "bole" },
bpy = { "bishnupriya manipuri" },
bqc = { "boko", page = "Boko (langue mandée)" },
bqn = { "langue des signes bulgare", signe = true },
bqy = { "langue des signes de Bengkala", "langue des signes de bengkala", signe = true },
br  = { "breton" },
brh = { "brahoui" },
brx = { "bodo" },
bs  = { "bosnien", "bosniaque" },
bsk = { "bourouchaski" },
bua = { "bouriate" },
bud = { "ntcham" },
bug = { "bouguinais", "bugis" },
buw = { "pove", page = "Pove (langue)" },
bvl = { "langue des signes bolivienne", signe = true },
bxm = { "bouriate de Mongolie", "bouriate de mongolie", page = "bouriate" },
bxr = { "bouriate de Russie", "bouriate de russie", page = "bouriate" },
bxu = { "bouriate de Chine", "bouriate de chine", page = "bouriate" },
bzd = { "bribri" },
bzs = { "langue des signes brésilienne", signe = true },
-- c
ca  = { "catalan" },
cad = { "caddo", page = "Caddo (langue)" },
cak = { "cakchiquel", page = "Cakchiquel (langue)" },
cal = { "carolinien" },
car = { "kali'na", "galibi", page = "Kali'na (langue)" },
cax = { "chiquitano", "besiro", "bésɨro" },
cay = { "cayuga", page = "Cayuga (langue)" },
cbg = { "chimila", "ette taara" },
cbk = { "chavacano" },
["cbk-zam"] = { "chavacano de Zamboanga", "chavacano de zamboanga", page = "Chavacano", invalide = "cbk" }, -- cbk-zam.Wikipédia cbk=cebuano, zam=miahuatlán zapotec
cdo = { "mindong" },
cds = { "langue des signes tchadienne", signe = true },
ce  = { "tchétchène" },
ceb = { "cebuano" },
cel = { "celte", page = "Langues celtiques" },
ch  = { "chamorro" },
chk = { "chuuk", page = "Chuuk (langue)" },
cho = { "choctaw", page = "Choctaw (langue)" },
chp = { "chipewyan", page = "Chipewyan (langue)" },
chr = { "tchérokî", "chérokî", "cherokee", page = "Cherokee (langue)" },
chy = { "cheyenne", page = "Cheyenne (langue)" },
cia = { "cia-cia" },
cim = { "cimbre" },
cjp = { "cabécar" },
ckb = { "sorani", rtl = true },
ckt = { "tchouktche" },
cmi = { "emberá chamí" },
cmn = { "mandarin", "mandarin standard", "chinois standard", page = "Mandarin (langue)" },
cnu = { "chenoui", "chenoua" },
cnx = { "moyen cornique" },
co  = { "corse", page = "Corse (langue)" },
com = { "comanche", page = "Comanche (langue)" },
coo = { "comox", page = "Comox (langue)" },
cop = { "copte" },
cpf = { "créoles français" },
cr  = { "cri", page = "Cri (langue)" },
crh = { "tatar de Crimée", "tatar de crimée" },
crs = { "créole seychellois" },
cs  = { "tchèque", "czech" },
csb = { "cachoube" },
csc = { "langue des signes catalane", signe = true },
csd = { "langue des signes de Chiangmai", "langue des signes de chiangmai", signe = true },
cse = { "langue des signes tchèque", signe = true },
csf = { "langue des signes cubaine", signe = true },
csg = { "langue des signes chilienne", signe = true },
csl = { "langue des signes chinoise", signe = true },
csn = { "langue des signes colombienne", signe = true },
csq = { "langue des signes croate", signe = true },
csr = { "langue des signes costaricienne", signe = true },
ctg = { "chittagonien" },
ctu = { "ch'ol", "ch’ol", "chꞌol" },
cu  = { "slavon d'église", "langue liturgique slave", "vieux slave liturgique" },
cv  = { "tchouvache", "chv" },
cy  = { "gallois" },
cz  = { "tchèque", invalide = "cs" },
-- d
da  = { "danois", "danish" },
dbp = { "ɗuwai", "duwai" },
ddo = { "tsez", "dido" },
de  = { "allemand", "german" },
diq = { "dimli", page = "Zazaki" },
dlg = { "dolgane" },
dop = { "lukpa", "dompango", "lokpa" },
doq = { "langue des signes dominicaine", signe = true },
dos = { "dogosé" },
dsb = { "bas-sorabe" },
dse = { "langue des signes néerlandaise", signe = true },
dsl = { "langue des signes danoise", signe = true },
dta = { "daur", page = "Daur (langue)" },
dtp = { "dusun" },
dts = { "dogon tɔrɔsɔ", "dogon toroso" },
dty = { "dotyali" },
dua = { "douala", page = "Douala (langue)" },
dum = { "moyen néerlandais" },
dv  = { "maldivien", "divéhi", "divehi", "div", rtl = true },
dyi = { "djimini", page = "Djimini (langue)" },
dyo = { "diola-fogny" },
dyu = { "dioula", "diola-fogny", page = "Dioula (langue)" },
dz  = { "dzongkha" },
-- e
ecs = { "langue des signes équatorienne", signe = true },
ee  = { "ewe", page = "Ewe (langue)" },
egl = { "émilien", page = "Émilien (dialecte)" },
egy = { "égyptien ancien" },
ekk = { "estonien standard", page = "Estonien" },
ekp = { "ekpeye" },
el  = { "grec moderne" },
eml = { "émilien-romagnol", invalide="egl" },       -- eml.Wikipédia
emp = { "emberá darién" },
en  = { "anglais", "english" },
["en-GB"] = { "anglais britannique" },
["en-US"] = { "anglais américain" },
enm = { "moyen anglais" },
enn = { "egene", "engenni" },
eo  = { "espéranto" },
er  = { "europanto" },  -- code non standard
es  = { "espagnol", "castillan", "spanish" },
esl = { "langue des signes égyptienne", signe = true },
esn = { "langue des signes salvadorienne", signe = true },
eso = { "langue des signes estonienne", signe = true },
et  = { "estonien" },
eth = { "langue des signes éthiopienne", signe = true },
eto = { "eton", page = "Eton (langue bantoue)" },
ets = { "etsako", "afenmai", "yekhee" },
ett = { "étrusque" },
eu  = { "basque" },
evn = { "evenki" },
ext = { "estrémègne" },
-- f
fa  = { "persan", "farsi ", "parsi ", rtl = true },
fcs = { "langue des signes québécoise", signe = true },
ff  = { "peul" },
fi  = { "finnois", "finnish", "finlandais" },
fil = { "filipino" },
fj  = { "fidjien" },
fo  = { "féroïen", "féringien", "féroien" },
fon = { "fon-gbe", "fongbe" },
fr  = { "français", "française", "french", "francais" },
["fr-BE"] = { "français de Belgique" },
["fr-CH"] = { "français de Suisse" },
["fr-FR"] = { "français de France" },
["fr1835"] = { "françois (1600-1835)", "françois", page = "Réforme de l'orthographe française de 1835", invalide = "fr" }, -- code non standard
["fra-gal"] = { "gallo", "gal", invalide = "fr" },
frc = { "français cadien" },
frk = { "francique", "vieux bas francique", page = "Francique (langue morte)" },
frm = { "moyen français (1400-1600)", "moyen françois", "moyen français", page = "Moyen français" },
fro = { "ancien français (842-1400)", "ancien français", "ancien françois", page = "Ancien français" },
frp = { "francoprovençal", "arpitan", "franco-provençal" },
frr = { "frison septentrional" },
frs = { "frison oriental bas-allemand" },
fse = { "langue des signes finnoise", signe = true },
fsl = { "langue des signes française", signe = true },
fss = { "langue des signes finno-suédoise", signe = true },
fuc = { "pulaar" },
fud = { "futunien" },
fur = { "frioulan" },
fy  = { "frison occidental", "frison" },
-- g
ga  = { "irlandais", "gaélique irlandais" },
gag = { "gagaouze" },
gan = { "gan", "kan", page = "Gan (langue)" },
gcf = { "créole guadeloupéen" },
gcr = { "créole guyanais" },
gd  = { "gaélique écossais", "écossais" },
gds = { "langue des signes de Ghandruk", signe = true },
gem = { "langues germaniques" },
gev = { "geviya", page = "Geviya (langue)" },
gez = { "guèze" },
gil = { "gilbertin" },
gl  = { "galicien" },
glk = { "gilaki", rtl = true },
gmh = { "moyen haut-allemand" },
["gmh-hes"] = { "hessois", invalide = "de" },      -- code linguistlist, gmh=middle high german (ca. 1050-1500), hes=invalide
gmy = { "mycénien" },
gn  = { "guarani", page = "Guarani (langue)" },
goh = { "vieux haut-allemand" },
gos = { "groningois" },
got = { "gotique" },
gr  = { "grec", page = "Grec (langue)", invalide = "el" },
grc = { "grec ancien" },
grk = { "grec", page = "Grec (langue)" },
gse = { "langue des signes ghanéenne", signe = true },
gsg = { "langue des signes allemande", signe = true },
gsm = { "langue des signes guatémaltèque", signe = true },
gss = { "langue des signes grecque", signe = true },
gsw = { "alémanique" },
gu  = { "gujarati" },
gus = { "langue des signes guinéenne", signe = true },
gux = { "gulmancema", "gourma", "gourmantché" },
gv  = { "mannois", "manx", "manxois" },
-- h
ha  = { "haoussa" },
hab = { "langue des signes de Hanoï", "langue des signes de hanoi", signe = true },
haf = { "langue des signes de Haïphong", "langue des signes de haiphong", signe = true },
hak = { "hakka", page = "Hakka (langue)" },
haw = { "hawaïen", "hawaien" },
haz = { "hazara", page = "Hazara (dialecte)" },
hbo = { "hébreu biblique ", "hébreu médiéval", "hébreu mishnique", "hébreu ancien" },
hds = { "langue des signes hondurienne", signe = true },
he  = { "hébreu", "iw", rtl = true },
hei = { "heiltsuk" },
hess= { "hessois", invalide = "de" },   -- code non IETF ni ISO 639, code linguistlist gmh-hes
hi  = { "hindi" },
hif = { "hindi des Fidji" },
hil = { "hiligaïnon", "ilonggo", "hiligaynon" },
hit = { "hittite", page = "Hittite (langue)" },
hks = { "langue des signes de Hong Kong", signe = true },
hnd = { "hindko"},
ho  = { "hiri motou", "hiri motu" },
hop = { "hopi", page = "Hopi (langue)" },
hos = { "langue des signes de Ho Chi Min Ville", "langue des signes de ho chi min city", signe = true },
hps = { "langue des signes hawaïenne", "langue des signes hawaienne", signe = true },
hr  = { "croate", "croatian" },
hsb = { "haut-sorabe" },
hsh = { "langue des signes hongroise", signe = true },
hsl = { "langue des signes haoussa", signe = true },
ht  = { "créole haïtien", "créole haitien", "haitien", "haïtien" },
hu  = { "hongrois", "hungarian" },
hwc = { "créole hawaïen", "créole hawaien" },
hy  = { "arménien" },
hz  = { "héréro", page = "Héréro (langue)" },
-- i
ia  = { "interlingua", page = "Interlingua (IALA)" },
iby = { "ibani", page = "Kalabari (langue)" },
icl = { "langue des signes islandaise", signe = true },
id  = { "indonésien" },
ie  = { "interlingue" },
ig  = { "igbo" },
ii  = { "yi de Shichuan", page = "Yi (langue)" },
ijc = { "izon", page = "Izon (langue)" },
ijn = { "kalabari", page = "Kalabari (langue)" },
ijo = { "langues ijo", "langues ijaw", "ijaw" },
ik  = { "inupiak" },
iks = { "langue des signes inuit", signe = true },
ikw = { "ikwere", "ikwerre" },
ilo = { "ilocano" },
ine = { "indo-européen", "langues indo-européennes", page = "langues indo-européennes" },
inh = { "ingouche" },
inl = { "langue des signes indonésienne", signe = true },
ins = { "langue des signes indienne", signe = true },
io  = { "ido" },
["in"]  = { "indonésien", invalide = "id" },	-- in est un mot clé lua : ne pas retirer les crochets - guillemets
ira = { "iranien", page = "Langues iraniennes" },
iro = { "iroquois", page = "Langues iroquoiennes" },
is  = { "islandais" },
ise = { "langue des signes italienne", signe = true },
isg = { "langue des signes irlandaise", signe = true },
isr = { "langue des signes israélienne", signe = true },
it  = { "italien", "italian" },
iu  = { "inuktitut" },
-- j
ja  = { "japonais", "japanese" },
["ja-Latn"] = { "japonais retranscrit dans l’alphabet latin" }, -- avec n’importe quelle méthode de romanisation
["ja-Latn-alalc97"] = { "japonais retranscrit dans l’alphabet latin avec la méthode Hepburn modifiée", page = "Méthode Hepburn" },
["ja-Latn-hepburn"] = { "japonais retranscrit dans l’alphabet latin avec la méthode Hepburn traditionnelle", page = "Méthode Hepburn" },
jbo = { "lojban" },
jcs = { "langue des signes jamaïcaine rurale", "langue des signes jamaicaine rurale", signe = true },
jhs = { "langue des signes de Jhankot", signe = true },
jls = { "langue des signes jamaïcaine", "langue des signes jamaicaine", signe = true },
jos = { "langue des signes jordanienne", signe = true },
jp  = { "japonais", invalide = "ja" },
jqr = { "jaqaru" },
jsl = { "langue des signes japonaise", signe = true },
jus = { "langue des signes de Jumla", signe = true },
jv  = { "javanais" },
jw  = { "javanais", invalide = "jv" },
-- k
ka  = { "géorgien" },
kaa = { "karakalpak" },
kab = { "kabyle" },
kai = { "karekare" },
kbd = { "kabarde" },
kbp = { "kabiyè" },
kcy = { "korandjé", "kwarandzyey" },
ke  = { "koinè", page = "Koinè (grec)" },
kea = { "créole du Cap-Vert" },
kg  = { "kikongo" },
kgi = { "langue des signes de Selangor", signe = true },
khb = { "tai lü" },
khi = { "langues khoïsan", "langues khoï", "khoï", "khoïsan" },
khk = { "khalkha" },
khw = { "khowar", rtl = true },
ki  = { "kikuyu", page = "kikuyu (langue)" },
kj  = { "kuanyama", "kwanyama" },
kjj = { "khinalug", page = "khinalug (langue)" },
kk  = { "kazakh" },
kl  = { "groenlandais" },
km  = { "khmer" },
kmq = { "kwama", page = "kwama (langue)" },
kmr = { "kurmandji" },
kmw = { "komo", page = "komo (langue bantoue)" },
kn  = { "kannada" },
knf = { "mancagne", page = "mancagne (langue)" },
ko  = { "coréen", "korean" },
["ko-Latn"] = { "coréen retranscrit dans l’alphabet latin" }, -- avec n’importe quelle méthode de romanisation
kog = { "kogui" },
koi = { "komi-permiak" },
kok = { "konkani" },
koy = { "koyukon" },
kpe = { "kpèllé", page = "Kpèllé (langue)" },
kpo = { "ikposso", "kposso" },
kr  = { "kanouri", "kanuri", page = "Kanouri (langue)" },
krc = { "karatchaï-balkar" },
kri = { "krio", page = "Krio (langue)" },
krj = { "kinaray-a", "kinaray" },
krl = { "carélien" },
ks  = { "cachemiri" },
ksh = { "kölsch", "francique ripuaire", page = "Kölsch (langue)" },
ku  = { "kurde" },
kut = { "kutenai" },
kv  = { "komi", page = "Komi (langue)" },
kvk = { "langue des signes coréenne", signe = true },
kw  = { "cornique" },
kwk = { "kwak'wala", "kwak’wala", "kwakʼwala" },
ky  = { "kirghize", page = "Kirghize (langue)" },
kyf = { "kouya", page = "Bété (langue)" },
-- l
la  = { "latin", "lat" },
lad = { "judéo-espagnol", "ladino" },
lb  = { "luxembourgeois" },
lbe = { "lak" },
lbj = { "ladakhi" },
lbr = { "lohorung", page = "Lohorung (langue)" },
lbs = { "langue des signes libyenne", signe = true },
lez = { "lezguien", "lezghien", "lezgi", "lesghien", "lesguien" },
lfn = { "lingua franca nova" },
lg  = { "luganda", "ganda" },
li  = { "limbourgeois" },
lif = { "limbu", page = "Limbu (langue)" },
lij = { "ligure" },
lil = { "stʼatʼimcets", "lillooet", "st̓át̓imcets", "st'at'imcets" },
liv = { "live", "livonien", page = "Live (langue)" },
lkt = { "lakota", page = "Lakota (langue)" },
lld = { "ladin" },
lls = { "langue des signes lituanienne", signe = true },
lmo = { "lombard", page = "Lombard (langue)" },
ln  = { "lingala" },
lo  = { "lao", page = "Lao (langue)" },
lob = { "lobiri" },
log = { "logoti" },
loq = { "lobala" },
lou = { "créole louisianais" },
lsg = { "langue des signes lyonnaise", signe = true },
lsl = { "langue des signes lettone", signe = true },
lso = { "langue des signes laotienne", signe = true },
lsp = { "langue des signes panaméenne", signe = true },
lst = { "langue des signes trinidadienne", signe = true },
lsy = { "langue des signes mauricienne", signe = true },
lt  = { "lituanien" },
ltg = { "latgalien" },
lu  = { "luba-katanga", "luba-shaba", "kiluba" },
lua = { "tshiluba" },
luc = { "aringa" },
luo = { "luo (Kenya et Tanzanie)", page = "Luo (langue)" },
lv  = { "letton" },
lzh = { "chinois classique", "zh-classical" },
lzz = { "laze" },
-- m
mai = { "maïthili", "maithili", "mazatèque de jalapa", "mazatèque de jalapa de díaz" },
maj = { "mazatèque de Jalapa" },
man = { "mandingue", "maninka", "malinke", page = "Langues mandingues" },
map = { "langues austronésiennes" },
["map-bms"] = { "banyumasan", invalide = "jv" }, -- code non standard, map=austronesian languages, bms=bilma kanuri (langue nilo-saharienne)
maz = { "mazahua" },
mbp = { "damana" },
mca = { "maká", page = "Maká (langue mataguayo)" },
mcp = { "maka", page = "Maka (langue bantoue)" },
mdf = { "moksa", "mokṣa", "moksha", page = "Moksa (langue)" },
mdl = { "langue des signes maltaise", signe = true },
mdw = { "mbochi", "mbosi", "mboshi", "embɔ́si", page = "Mbochi (langue)" },
men = { "mendé", page = "Mendé (langue)" },
mew = { "maka", "maha", "maaka", "makaa", page = "Maka (langue tchadique)" },
mey = { "hassanya" },
mfe = { "créole mauricien", "mauricien" },
mfs = { "langue des signes mexicaine", signe = true },
mg  = { "malgache", "malagasy" },
mga = { "moyen irlandais" },
mh  = { "marshallais" },
mhr = { "mari oriental", "mari", "mari de l'est", page = "Mari (langue)" },
mi  = { "maori de Nouvelle-Zélande", "maori" },
mic = { "micmac" },
min = { "minangkabau", page = "Minangkabau (langue)" },
mis = { "langue qui n’a aucun code langue", page = "" },
mk  = { "macédonien" },
mkh = { "langues môn-khmer", "môn-khmer" },
ml  = { "malayalam" },
mls = { "masalit", "massalit" },
mlv = { "mwotlap" },
mn  = { "mongol" },
mnc = { "mandchou" },
mni = { "meitei", "meithei" },
mnw = { "môn", "mon", page = "Môn (langue)" },
mo  = { "moldave", invalide = "ro" },
moe = { "innu-aimun", "montagnais" },
moh = { "mohawk", "agnier", page = "mohawk (langue)" },
mot = { "barí", "bari", page = "barí (langue)" },
mov = { "mojave", page = "Mojave (langue)" },
mql = { "mbèlimè", "mbɛlimɛ", "mbelime" },
mqm = { "marquisien du Sud", page = "Marquisien" },
mr  = { "marathi", "marāthī", "marathe", "marâthî", page = "Marathi (langue)" },
mre = { "langue des signes de Martha's Vineyard", signe = true },
mrj = { "mari des montagnes", "mari occidental" },
mrn = { "cheke holo" },
mrq = { "marquisien du Nord", "marquisien", page = "Marquisien" },
ms  = { "malais", page = "Malais (langue)" },
msd = { "langue des signes maya yucatèque", signe = true },
msn = { "vurës" },
msr = { "langue des signes mongole", signe = true },
mt  = { "maltais" },
mua = { "moundang", page = "Moundang (langue)" },
mul = { "multilingue", page = "Multilinguisme" },
mus = { "creek", page = "Creek (langue)" },
mvf = { "mongol périphérique", page = "Mongol (langue de Chine)" },
mwl = { "mirandais" },
mwr = { "marwari" },
my  = { "birman", page = "Birman (langue)" },
myk = { "mamara" },
myn = { "langues mayas", "langue maya", "maya" },
myv = { "erzya" },
mzc = { "langue des signes malgache", signe = true },
mzg = { "langue des signes monastique", signe = true },
mzn = { "mazandarani", "tabari", rtl = true },
mzy = { "langue des signes mozambicaine", signe = true },
-- n
na  = { "nauruan" },
nah = { "nahuatl" },
nan = { "minnan", "zh-min-nan" },
nap = { "napolitain", "tarentin" },
naq = { "nama", "nama (namibie)", page = "Nama (Langue)" },
nb  = { "bokmål", "bokmal", "norvégien classique" },
nba = { "nyemba", "ngangela", page = "Nyemba (langue)" },
nbh = { "ngamo" },
nbs = { "langue des signes namibienne", signe = true },
nci = { "nahuatl classique", "aztèque", page = "Nahuatl" },
ncs = { "langue des signes nicaraguayenne", signe = true },
nd  = { "ndébélé du Nord", "ndébélé du zimbabwe", "sindebele", page = "Ndébélé du Zimbabwe" },
ndc = { "ndau" },
nds = { "bas allemand" },
["nds-NL"] = { "bas-saxon néerlandais" },
ne  = { "népalais" },
new = { "nepalbhasha" },
ng  = { "ndonga" },
ngi = { "ngizim", page = "Ngizim (langue)" },
nia = { "niha", "nias" },
niu = { "niuéen" },
nl  = { "néerlandais", "dutch" },
["nl-BE"] = { "néerlandais de Belgique", page = "Néerlandais" },
nn  = { "nynorsk" },
nnb = { "kinande", "konzo" },
no  = { "norvégien", "norwegian" },
non = { "vieux norrois", "norrois" },
nov = { "novial" },
nr  = { "ndébélé du Sud", "nrebele", "ndébélé du transvaal", page = "Ndébélé du Transvaal" },
nrf = { "jersiais" },
nrm = { "narum", "narom" },     -- le code pour le normand est fr (mais nrm.wikipedia est en normand)
nsi = { "langue des signes nigériane", signe = true },
nsl = { "langue des signes norvégienne", signe = true },
nso = { "sotho du Nord", "pedi", "sesotho sa leboa" },
nsp = { "langue des signes népalaise", signe = true },
nsr = { "langue des signes maritime", signe = true },
nuk = { "nuuchahnulth" },
num = { "niuafoʻou", page = "Niuafoʻou (langue)" },
nv  = { "navajo", "nav", page = "navajo (langue)" },
ny  = { "chichewa", "chinyanja" },
nzs = { "langue des signes néo-zélandaise", signe = true },
-- o
oar = { "araméen ancien", page = "Araméen" },
obt = { "vieux breton" },
oc  = { "occitan", "oci", "gascon", "provençal" },
oco = { "vieux cornique" },
odt = { "vieux néerlandais" },
ofr = { "francique oriental" },
ofs = { "vieux frison" },
ogc = { "ogba" },
oj  = { "ojibwé", page = "Ojibwé (langue)" },
okl = { "vieille langue des signes kentoise", signe = true },
okr = { "kirike", "okrika", page = "Kalabari (langue)" },
om  = { "oromo", page = "Oromo (langue)" },
["or"]  = { "oriya" },	-- or est un mot clé lua : ne pas retirer les crochets - guillemets
orh = { "oroqen", page = "Oroqen (langue)" },
["orv-olr"] = { "ruthène ancien", "ruthène", invalide = "rue" }, -- code linguist list, orv=old russian, olr=olrat (Vanuatu)
os  = { "ossète" },
osp = { "castillan ancien", "vieil espagnol" },
osx = { "vieux saxon", "vieux bas allemand" },
ota = { "turc ottoman", rtl = true },
otk = { "vieux-turc", "vieux turc", rtl = true },
otw = { "outaouais", page = "Outaouais (langue)" },
owl = { "vieux gallois" },
-- p
pa  = { "pendjabi", "panjābī", "penjābī", "penjabi", "panjabi" },
pag = { "pangasinan", page = "Pangasinan (langue)" },
pam = { "pampangan" },
pap = { "papiamento" },
pau = { "paluan" },
pcc = { "bouyei" },
pcd = { "picard" },
pdc = { "allemand de Pennsylvanie", "pennsilfaanisch" },
pfl = { "palatin", page = "Palatin (langue)" },
phn = { "phénicien" },
pi  = { "pali" },
pid = { "piaroa", page = "Piaroa (langue)" },
pih = { "norfolk", "norfuk", page = "Norfolk (langue)" },
pks = { "langue des signes pakistanaise", signe = true },
pl  = { "polonais", "polish" },
plg = { "pilagá", "pilaga", page = "Pilagá (langue)" },
pms = { "piémontais" },
pnb = { "pendjabi occidental", "penjabi occidental", "panjabi occidental", "penjābī occidental", "panjābī occidental", page = "Pendjabi", rtl = true },
pnt = { "grec pontique" },
pon = { "pohnpei" },
prg = { "vieux-prussien", "vieux prussien" },
prk = { "parauk" },
prl = { "langue des signes péruvienne", signe = true },
pro = { "ancien occitan" },
prs = { "dari" },
prz = { "langue des signes de Providencia", signe = true },
ps  = { "pachto", rtl = true },
psc = { "langue des signes perse", signe = true },
psd = { "langue des signes des Indiens des Plaines ", signe = true },
psg = { "langue des signes de Penang", signe = true },
psl = { "langue des signes portoricaine", signe = true },
pso = { "langue des signes polonaise", signe = true },
psp = { "langue des signes philippine", signe = true },
psr = { "langue des signes portugaise", signe = true },
pt  = { "portugais", "portuguese" },
pug = { "puguli" },
pui = { "puinave", page = "Puinave (langue)" },
puw = { "puluwat", page = "Puluwat (langue)" },
pys = { "langue des signes paraguayenne", signe = true },
-- q
qu  = { "quechua" },
quy = { "ayacucho quechua", page = "Quechua" },
quz = { "cusco quechua " },
qya = { "quenya" },
-- r
rad = { "rhade", page = "Rhade (langue)" },
raj = { "rajasthani" },
rap = { "rapanui", page = "Rapanui (langue)" },
rar = { "maori des îles Cook", "maori des iles cook" },
rcf = { "créole réunionnais" },
rde = { "allemand de la Ruhr" },   -- code non standard
rgl = { "romagnol" },
rhg = { "rohingya " },
rif = { "rifain" },
rm  = { "romanche", "rhéto-roman" },
rms = { "langue des signes roumaine", signe = true },
rmy = { "romani", "rom" },
rn  = { "kirundi", "run" },
ro  = { "roumain", "moldave" },
roa = { "langues romanes" },
["roa-tara"] = { "tarentin", invalide = "nap" },   -- code non standard, roa=langues romanes, tara= invalide
rsi = { "langue des signes rennellienne", "langue des signes de rennell", signe = true },
rsl = { "langue des signes russe", signe = true },
ru  = { "russe", "russian" },
rue = { "rusyn" },
ruo = { "istro-roumain", "valaque d’istrie", "istrien" },
rup = { "aroumain", "roa-rup" },
rw  = { "kinyarwanda" },
ry  = { "ruthène ancien", invalide = "rue" },    -- code non standard, voir orv-olr
ryu = { "okinawaïen" },
-- s
sa  = { "sanskrit" },
sah = { "iakoute" },
sc  = { "sarde" },
scn = { "sicilien" },
sco = { "scots" },
["sco-ulster"] = { "scots d'Ulster" },
sd  = { "sindhi" },
sdl = { "langue des signes saoudienne", signe = true },
se  = { "same du Nord" },
sem = { "langues sémitiques" },
ses = { "koyraboro senni", "koyraboro senni songhaï", "songhai de l'est", "koyraboro senni songhai", "koyra senni", "songhaï de l'est", "koroboro senni" },
sey = { "secoya", page = "Secoya (langue)" },
sfb = { "langue des signes de Belgique francophone", signe = true },
sfs = { "langue des signes sud-africaine", signe = true },
sg  = { "sango" },
sga = { "vieil irlandais" },
sgg = { "langue des signes suisse alémanique", page = "Langue des signes allemande", signe = true },
sgn = { "langue des signes", signe = true },
sgs = { "samogitien" },
sgx = { "langue des signes sierra-léonaise", signe = true },
sh  = { "serbo-croate" },
shi = { "chleuh", "tachelhit", "chelha" },
shk = { "shilluk", page = "Shilluk (langue)" },
shn = { "shan", page = "Shan (langue)" },
shy = { "chaoui" },
si  = { "cingalais" },
simple = { "anglais simple", "simple english", page = "Simplifications de l'anglais", invalide = "en" }, -- code non standard
sip = { "sikkimais" },
sjn = { "sindarin" },
sjo = { "xibe", page = "Xibe (langue)" },
sk  = { "slovaque" },
sl  = { "slovène" },
sla = { "langues slaves" },
slf = { "langue des signes suisse italienne", page = "Langue des signes italienne", signe = true },
slr = { "salar", page = "Salar (langue)" },
sls = { "langue des signes de Singapour", signe = true },
sm  = { "samoan" },
sma = { "same du Sud", page = "same du Sud" },
smg = { "simbali" },
smi = { "same", page = "Langues sames" },
smj = { "same de Lule" },
sn  = { "shona", page = "Shona (langue)" },
snk = { "soninké", page = "Soninké (langue)" },
so  = { "somali" },
sog = { "sogdien" },
sov = { "sonsorolais" },
spx = { "sud-picène", "picène du sud" },
srd  = { "sarde", invalide = "sc" },
sq  = { "albanais" },
sqk = { "langue des signes albanaise", signe = true },
sqs = { "langue des signes sri-lankaise", signe = true },
sr  = { "serbe" },
["sr-Cyrl"] = { "serbe cyrillique", page = "Alphabet cyrillique serbe" },
["sr-ME"] = { "monténégrin" },
srh = { "sariqoli" },
srn = { "sranan", "sranan tongo" },
srr = { "sérère", "seereer", page = "Sérère (langue)" },
ss  = { "swati" },
ssp = { "langue des signes espagnole", signe = true },
ssr = { "langue des signes suisse romande", page = "Langue des signes française", signe = true },
st  = { "sotho du Sud", "sot" },
stq = { "frison oriental" },
str = { "saanich", page = "Saanich (langue)" },
stw = { "satawal", page = "Satawal (langue)" },
su  = { "soundanais", "sondonésien" },
sus = { "soussou", "sosso", "soso", page = "Soussou (langue)" },
sux = { "sumérien" },
sv  = { "suédois", "swedish" },
svk = { "langue des signes slovaque", signe = true },
sw  = { "swahili" },
swl = { "langue des signes suédoise", signe = true },
sxu = { "haut-saxon" },
syc = { "syriaque classique", page = "Syriaque" },
syl = { "sylheti" },
syr = { "syriaque", rtl = true },
syy = { "langue des signes bédouine d'Al-Sayyid", signe = true },
szl = { "silésien", page = "silésien (langue slave)" },
-- t
ta  = { "tamoul" },
tao = { "yami" },
tbl = { "t'boli", "tboli", "tagabili" },
tbz = { "ditammari", "tammari" },
tcy = { "toulou", "tulu" },
te  = { "télougou" },
tet = { "tétoum" },
tfn = { "dena'in", "tanaina", page = "Dena'ina (langue)" },
tfr = { "teribe" },
tg  = { "tadjik" },
th  = { "thaï", "thai" },
ti  = { "tigrinya" },
tji = { "Tujia du Nord", page = "Tujia" },
tjs = { "Tujia du Sud", page = "Tujia" },
tk  = { "turkmène" },
tkl = { "tokelau", page = "Tokelau (langue)" },
tl  = { "tagalog" },
tlh = { "klingon", page = "Klingon (langue)" },
tli = { "tlingit" },
tmh = { "touareg", "tamacheq", page = "Touareg (langue)" },
tmr = { "judéo-araméen babylonien", rtl=true },
tn  = { "tswana" },
tnq = { "Taïno", "taïnos", page = "Taïno (langue)" },
to  = { "tonguien" },
tob = { "toba", "qom", page = "Toba (langue)" },
toj = { "tojolabal" },
tpi = { "tok pisin" },
tpn = { "tupinambá", "tupinamba", page = "Tupinambá (langue)" },
tr  = { "turc" },
trk = { "langues turques" },
ts  = { "tsonga", page = "Tsonga (langue)" },
tse = { "langue des signes tunisienne", signe = true },
tsg = { "tausug" },
tsm = { "langue des signes turque", signe = true },
tsq = { "langue des signes thaï", signe = true },
tss = { "langue des signes taïwanaise", signe = true },
tsu = { "tsou", page = "Tsou (langue)" },
tsy = { "langue des signes de Tebul", signe = true },
tsz = { "p'urhépecha", "tarasque", page = "P'urhépecha (langue)" },
tt  = { "tatar" },
tum = { "tumbuka", page = "Tumbuka (langue)" },
tun = { "tunica", page = "Tunica (langue)" },
tut = { "langues altaïques" },
tuw = { "langues toungouses" },
tvl = { "tuvaluan" },
tw  = { "twi" },
twm = { "monba", page = "Monba (langue)" },
txb = { "koutchéen", "tokharien b", "tokharien occidental" },
txg = { "tangoute" },
ty  = { "tahitien" },
tyv = { "touvain" },
tza = { "langue des signes tanzanienne", signe = true },
tzm = { "tamazight du Maroc central", "braber" },
tzo = { "tzotzil" },
-- u
udm = { "oudmourte" },
ug  = { "ouïghour", rtl = true },
uga = { "ougaritique" },
ugn = { "langue des signes ougandaise", signe = true },
ugy = { "langue des signes uruguayenne", signe = true },
uhn = { "damal" },
uk  = { "ukrainien" },
ukl = { "langue des signes ukrainienne", signe = true },
uks = { "langue des signes urubú-kaapor", "langue des signes urubu-kaapor", signe = true },
uli = { "ulithi", page = "Ulithi (langue)", signe = true },
und = { "langue indéterminée", page = "" },
ur  = { "ourdou", rtl = true },
uve = { "fagauvea" },
uz  = { "ouzbek" },
-- v
ve  = { "venda", page = "Venda (langue)" },
vec = { "vénitien" },
vep = { "vepse" },
vgt = { "langue des signes flamande", signe = true },
vi  = { "vietnamien" },
vls = { "flamand occidental" },
vo  = { "volapük" },
vro = { "võro", "fiu-vro" },
vsi = { "langue des signes moldave", signe = true },
vsl = { "langue des signes vénézuélienne", signe = true },
vsv = { "langue des signes valencienne", signe = true },
-- w
wa  = { "wallon" },
war = { "waray-waray" },
wen = { "sorabe" },
wlm = { "moyen gallois" },
wls = { "wallisien" },
wo  = { "wolof", page = "Wolof (langue)" },
woe = { "woléaïen" },
wuu = { "wu", page = "Wu (langue)" },
wwa = { "waama", page = "Waama (langue)" },
wya = { "wendat", "wyandot", page = "Wendat (langue)" },
-- x
xal = { "kalmouk" },
xbc = { "bactrien" },
xbm = { "moyen breton" },
xcb = { "cambrien" },
xcl = { "arménien classique", "krapar", "grabar", "arménien ancien" },
xcu = { "curonien" },
xh  = { "xhosa" },
xki = { "langue des signes kényane", signe = true },
xlu = { "louvite" },
xmf = { "mingrélien", "mégrélien" },
xml = { "langue des signes malaisienne", signe = true },
xmm = { "malais de Manado", "manadonais" },
xms = { "langue des signes morocaine", signe = true },
xno = { "anglo-normand", page = "Anglo-normand (langue)" },
xpr = { "parthe", page = "Parthe (langue)" },
xto = { "agnéen", "tokharien", "tokharien a" },
-- y
yag = { "yagan", "yámana", page = "Yagan (langue)" },
yak = { "sahaptin yakama", "yakima", "yakama", page = "Sahaptin" },
yap = { "yap", page = "Yap (langue)" },
yaz = { "lokaa", "yakö" },
ybe = { "yugur occidental" },
yds = { "langue des signes yiddish", signe = true }, -- obsolète, ne pas utiliser.
ygs = { "langue des signes yolngu", "langue des signes yolŋu", signe = true },
yhs = { "langue des signes yan-nhangu", "langue des signes yan-nhaŋu", signe = true },
yi  = { "yiddish", "ji", rtl = true },
yo  = { "yoruba" },
ypk = { "langues yupik" },
ysl = { "langue des signes yugoslave", signe = true },
yua = { "maya yucatèque" },
yue = { "cantonais", "zh-yue" },
["yue-jyutping"] = { "romanisation Jyutping du cantonais", page = "Jyutping" },
yuf = { "langues yumanes du Nord", "walapai", "yavapai", "havasupai", page = "Langues yumanes" },
-- z
za  = { "zhuang", page = "Zhuang (langue)" },
zaw = { "zapotèque de Mitla" },
zea = { "zélandais" },
zgh = { "tamazight standard du Maroc" },
zh  = { "chinois", "hui", "chinese", page = "langues chinoises" },
["zh-CN"] = { "chinois de Chine continentale", page = "langues chinoises" },
["zh-Hans"] = { "chinois simplifié", page = "Sinogramme simplifié" },
["zh-Hant"] = { "chinois traditionnel", page = "Sinogramme traditionnel" },
["zh-HK"] = { "chinois de Hong Kong", page = "langues chinoises" },
["zh-Latn"] = { "chinois retranscrit dans l’alphabet latin" }, -- avec n’importe quelle méthode de romanisation
["zh-Latn-pinyin"] = { "chinois retranscrit dans l’alphabet latin avec la méthode Pinyin", "pinyin", page = "Hanyu pinyin" },
["zh-Latn-wadegile"] = { "chinois retranscrit dans l’alphabet latin avec la méthode Wade-Giles", page = "Romanisation Wade-Giles" },
["zh-MO"] = { "chinois de Macao", page = "langues chinoises" },
["zh-SG"] = { "chinois de Singapour", page = "langues chinoises" },
["zh-TW"] = { "chinois de Taïwan", page = "langues chinoises" },
zib = { "langue des signes zimbabwéenne", signe = true },
zim = { "mesmé" },
zls = { "langues slaves méridionales" },
zsl = { "langue des signes zambienne", signe = true },
zsm = { "malaisien", page = "Malaisien (langue)" },
zu  = { "zoulou" },
zxx = { "no linguistic content, not applicable", page = "" },
zza = { "zazaki" },

}

-- code pour transformer la liste de code en table plus facilement utilisable par le module:Langue
local p = {}

for k, v in pairs( data ) do
	local clef = k:lower()
	p[ clef ] = v
	v.nom = v[ 1 ]
	
	-- ajout des codes
	if v.invalide then
		p[ clef ].code = v.invalide
	else
		p[ clef ].code = k
	end
	
	-- ajout des alias 
	local cible = data[ v.invalide ] or v
	for i = #v, 1, -1 do
		p[ mw.ustring.lower( v[ i ] ) ] = cible
		v[ i ] = nil
	end
	
end


-- -------------------------------------------------------------------------------- --
--   liste des étiquettes d'écritures (script subtag) s'écrivant de droite à gauche --
-- -------------------------------------------------------------------------------- --
p[ "rtl script" ] = {
	Arab = true,
	Armi = true,
	Avst = true,
	Cprt = true,
	Hebr = true,
	Khar = true,
	Lydi = true,
	Mand = true,
	Nkoo = true,
	Orkh = true,
	Phli = true,
	Phlp = true,
	Phlv = true,
	Phnx = true,
	Prti = true,
	Samr = true,
	Sarb = true,
	Syrc = true,
	Syre = true,
	Syrj = true,
	Syrn = true,
	Thaa = true,
}

return p