LES LANGUES ROMANES
On appelle langues romanes les langues qui continuent directement et d'une manière ininterrompue le latin parlé (ou latin populaire, latin vulgaire). On distingue en général onze groupes dans cette famille de langue se rattachant, par le latin, à la branche italique : le français, l'italien, l'espagnol, le portugais, le catalan, l'occitan, le franco-provençal, le rhétoroman, le roumain, le sarde et une langue aujourd'hui disparue, le dalmate. Cet ensemble linguistique porte le nom de Romania (nous l'emploierons ici indifféremment pour l'ensemble linguistique ou territorial).
I. ORIGINE ET FORMATION DES LANGUES ROMANES
La question qui se pose, lorsqu'on étudie l'origine et la formation des langues romanes, est la suivante : comment peut-on expliquer la diversité de ces langues à partir d'une langue unique, le latin ? Pour y répondre, nous examinons ci-après les trois facteurs qui ont joué un rôle déterminant dans la fragmentation linguistique de la Romania :
1. Le latin parlé, un et divers (voir l'article encadré langues latines).
Nous insisterons tout d'abord sur un fait essentiel : les langues romanes ne sont pas issues directement du latin littéraire, mais bien du latin parlé. Au Ier s. cohabitaient déjà dans l'Empire romain le latin littéraire (sermo urbanus) et le latin parlé (sermo rusticus), qu'un auteur comme Cicéron utilise dans ses écrits, étant entendu que le latin parlé n'est pas une forme décadente du latin littéraire. Le latin parlé n'était, en fait, pas aussi homogène qu'on a voulu le croire. Certes, le latin littéraire, celui de la cité (urbs), celui de Rome et du Latium, devient avec la colonisation la langue officielle, la langue de culture, celle de l'administration, des écoles, puis, plus tard, celle de la liturgie chrétienne, bref, la langue qui unifie les différents peuples occupant le territoire de l'Empire. Mais le latin parlé, un puisqu'il est celui du peuple, se diversifie avec les peuples (présence de régionalismes) et dans le peuple, selon les différentes couches sociales de la population (le latin parlé du paysan était différent de celui du militaire ; le patricien qui parlait devant le sénat utilisait un niveau de langue autre que dans son milieu familial). D'où le caractère hétérogène de ce latin vulgaire et le choix ultérieur des pays de langue romane pour tel ou tel niveau de langue. Prenons un exemple. Le latin « noble » se servait des mots ĕdĕre « manger » et pulcher « beau ; noble », un latin moins élevé utilisait à la place comĕdĕre « manger (avec la nuance de tout manger) ; dévorer » et formosus « beau, élégant, bien fait », à côté de mandūcare « mâcher ; manger » et de bellus « charmant, aimable ». Le français, l'italien, le catalan, le rhétoroman, le roumain, le dalmate ont hérité de mandūcare > manger (fr.), manicare (ancien ital.), mangiar (rhétorom.), menjar (catal.), mâncar (roum.), mancū̆r (dalm.) et de bellus > beau (fr.), bello (ital.), bell (catal.), bel (rhétorom.) ; l'espagnol et le portugais, en revanche, ont opté pour comĕdĕre > comer et pour formosus > hermoso (esp.), formoso (port.), ainsi que le roumain frumos. Quant à ĕdĕre, déjà menacé en latin littéraire, et à pulcher, ils ne connaissent pas de représentants dans les langues romanes. Wartburg fait remarquer, d'autre part, que le latin parlé, importé par les classes supérieures de la société, a moins tendance à évoluer que lorsque la latinisation a été accomplie par le petit peuple ou les paysans. Prenons comme exemple, le -s final, effacé, semble-t-il, en latin parlé, réhabilité en latin littéraire : il est tombé dans les pays occupés par des colons d'origine paysanne, d'où latin duos « deux » > roumain doi, italien due mais sarde duos, rhétoroman dus, français deux, occitan et espagnol dos, portugais dous. Un autre fait vient se greffer sur les deux précédents : l'espace roman a été latinisé à différentes époques plus ou moins profondément ; en Europe de l'Est, par exemple, le grec a fait obstruction à la poussée du latin qui restera dans ces régions une langue purement administrative, sauf en Illyrie et en Dacie (future Roumanie). Ces trois éléments concourent donc à la diversification du latin parlé dans la Romania, diversification qui s'intensifiera, bien sûr, après la chute de l'Empire romain.
2. L'action des différentes langues parlées avant la conquête romaine (langue de substrat) et après la conquête romaine (langue de superstrat)
a) Les substrats. On appelle langue de substrat une langue évincée par une autre et qui laisse des traces notables dans la langue qui s'est imposée.
Si historiquement, les peuples indigènes n'ont pas eu une grande importance, leur langue, en revanche, a laissé plus ou moins de traces dans le latin parlé. L'action de substrat contribue à accentuer les divergences entre le latin de la Gaule, celui de l'Espagne, etc. ; elle se fait sentir aussi bien au niveau phonétique, morphologique, syntaxique que lexical et sémantique. Certaines évolutions phonétiques communes à quelques pays de la Romania sont attribuées au substrat : osco-ombrien, au centre et au sud de l'Italie, de même qu'au nord-est de l'Espagne ; étrusque, dans les parlers toscans ; ligure, en Italie du Nord (Piémont, Lombardie, Émilie) et en Provence ; pré-indoeuropéen (basque, par exemple), au nord de l'Espagne et dans les Pyrénées ; ibérique et celtique, en Espagne et en Gascogne ; grec, sur le pourtour méditerranéen, des Alpes-Maritimes jusqu'en Andalousie ; dacique, en Roumanie. C'est toutefois le substrat gaulois qui a eu la plus forte influence dans la Romania. On lui attribue le passage de u (ou) à ü (u) qui a eu lieu en français mais aussi dans les parlers de l'Italie du Nord et dans certaines parties du Portugal comme, par exemple, latin murus « mur » > français mur (/m ü r/), rhétoroman mür, au contraire d'espagnol, italien muro (/m u ro/), [prononcés ou, comme en latin], etc. ; de même que celui de -ct- à -it-, comme, par exemple, latin factum > français fait. Ces changements phonétiques différencient, dans une large mesure, le français des autres langues romanes. On estime que quelques 180 mots gaulois sont passés en latin de la Gaule, puis en français, tels que gaul. °ande-banno > fr. auvent, drūto > dru, carrūca > charrue, etc. (voir l'article encadré Le gaulois).
Ces langues de substrat ne nous sont connues que par reconstruction à partir de quelques données onomastiques (noms de lieux et de personnes), quelques traces dans le lexique et quelques attestations sous forme d'inscription. Il est, dans ces conditions, difficile et périlleux de faire la part exacte des substrats dans la formation des langues « néo-latines ». Il ne faut cependant pas en nier l'existence.
b) Les superstrats. On entend par superstrat une langue qui est venue se superposer sur l'aire d'une autre langue, langue qui a été adoptée par les conquérants au détriment de la leur. Tel est le cas du slave pour le roumain, de l'arabe pour l'espagnol et des langues germaniques pour la majeure partie de la Romania. Le superstrat slave s'est particulièrement fait sentir sur la morphologie du roumain, qui lui doit quelques suffixes et préfixes très productifs ; le superstrat arabe se manifeste dans le lexique de l'espagnol : environ 4 000 mots, dont certains ont disparu aujourd'hui, sont entrés dans les langues ibériques. Le superstrat germanique a joué, quant à lui, un rôle prépondérant dans la Romania. À partir du IIIe s., les invasions germaniques modifient insensiblement le paysage roman. C'est vers le Ve s. toutefois que leurs effets furent perceptibles. Elles sont responsables, d'après Wartburg, de la scission de la Romania : isolement de la Romania de l'Est (Romania orientale avec l'Italie centrale et méridionale et la Roumanie) du reste de la Romania (Romania occidentale) — cette répartition n'étant valable qu'historiquement — ; on leur attribue également la séparation entre le galloroman et le rhétoroman, la poussée des Alamans confinant le latin dans les hautes vallées suisses des Grisons et de l'Engadine ; elles ont mis un frein aux relations de la Gaule et de l'Hispanie avec l'Italie. En interrompant les communications à l'intérieur de la Romania, elles ont favorisé le morcellement de l'espace linguistique. On trouvera des éléments germaniques dans les différentes parties de la Romania : ostrogothiques, en Italie, wisigothiques, dans le sud-ouest de la France et en Espagne ; longobardes, en Italie ; franciques, au nord de la France. C'est certainement sur le territoire de la Gaule que le superstrat germanique (francique) eut le plus d'incidence : il accentue et fixe la frontière linguistique entre la France du Nord et celle du Sud ; il scinde l'espace normanno-picard en deux zones. La longue période de bilinguisme roman/germanique contribue par ailleurs « à faire du français la langue romane la plus germanisée » (Camproux, op. cit., p. 59).
3. L'apport du christianisme et le rôle du clergé
Le christianisme, qui touche vers la fin du IIe s. l'ensemble de la Romania, introduit dans le latin des notions nouvelles, liées au dogme, à la théologie et à la morale chrétienne, notions qui s'étendent parfois au-delà du domaine religieux. L'exemple bien connu de parler est éloquent. Le latin littéraire possédait le verbe loqui, le latin familier, fabulari. Le latin chrétien dérive, à partir de parabola « parabole », le sens de « parole » et crée le verbe parabolare « parler ». Les langues romanes les plus conservatrices (espagnol, sarde, rhétoroman) choisissent fabulari (d'où l'espagnol hablar) ou sa variante fabellari, les autres langues parabolare. Langue de secte, au départ, ce latin parlé et écrit — la littérature chrétienne naît vers le IIe s. — devient rapidement une « langue chrétienne », cohérente, marquée par un vocabulaire particulier, une syntaxe claire et un style très simple. Le but était, en effet, d'atteindre les masses en utilisant un discours sans ornements (sermo humilis). Lorsque l'Empire romain s'effrite au Ve s., la force unificatrice que représentait l'administration romaine est remplacée par les gouvernements ecclésiastiques. Le diocèse devient alors le noyau administratif autour duquel la vie sociale s'organise. L'influence du diocèse est renforcée par le fait que ses limites coïncident avec les zones de peuplement des tribus préromanes. On a longtemps cru, de ce fait, que les phénomènes linguistiques s'arrêtaient aux frontières des diocèses. C'était sans compter avec la distribution géographique et la configuration topographique (voies de communication, fleuves, montagnes, etc.). Quoi qu'il en soit, le latin ecclésiastique réussit à maintenir un semblant d'unité sans pour autant fixer les évolutions internes des différents parlers. La preuve en est qu'en 814, le Concile de Tours demande aux prêtres de prêcher « in rusticam romanan linguam aut theotiscam » (en langue vulgaire romane ou germanique), afin d'être mieux compris par le peuple, ce qui permet à Wolff de conclure que la prédication « a été comme une ‘accoucheuse’ des langues romanes » (op. cit., p. 71).
Ainsi, les évolutions linguistiques immanentes à toute langue et modifiant son système ont été renforcées par des facteurs externes qui ont abouti à la différenciation de ces langues issues de la même souche : diversification, dès le départ, du latin parlé ; apport du christianisme ; différentes strates d'invasion ; résurgence des anciens idiomes locaux ; nouvelle configuration administrative et politique. Les changements se sont accélérés, en outre, lorsque ces différents groupes se sont retrouvés dans une situation d'isolement, après la chute de l'Empire romain en 476. On peut dire, en fait, qu'« il n'y a pas eu un latin vulgaire unique se scindant en langues nouvelles, mais accroissement des divergences au point de susciter de nouveaux regroupements » (Wolff, op. cit., p. 65).
Bien que cette évolution aboutissant à des langues distinctes s'inscrive dans un long continuum allant par exemple du latin parlé au latin de la Gaule, au roman, puis au français, on peut toutefois poser quelques jalons chronologiques. Vers 500, « la langue parlée partout mérite un nom unique, c'est encore du latin (même si certains linguistes préfèrent l'appeler protoroman) ; vers 800 dans la France du Nord (et plus tard ailleurs), l'opposition entre latin et langue parlée est reconnue par les contemporains eux-mêmes » (Wolff, op. cit., p. 65). Au Ve s., on peut déjà parler de balkanoroman, d'italoroman, de galloroman, de rhétoroman et d'ibéroroman, qui sont autant de variantes du bas latin. D'autre part, les principaux changements phonétiques discriminants s'achèvent vers la fin du Ve siècle. On peut avancer, grosso modo, que les langues romanes ont commencé à se former entre le IIIe et le Ve s., qu'elles se sont distinguées les unes des autres autour de 600 et qu'au début du IXe s. on prend conscience de l'existence des idiomes romans distincts. Rappelons que le plus ancien texte rédigé intentionnellement en roman (galloroman) est celui des Serments de Strasbourg (842). Nous avons jusqu'à présent parlé, par commodité, de langues. Sachons cependant qu'autour de l'an 1000, il s'agit encore de dialectes. Si nous devions établir une carte linguistique du domaine roman à cette époque, elle présenterait une multiplicité de dialectes plus ou moins spécifiques et d'une « langue » unique : le latin. Ce n'est que plus tard, en effet, que certains de ces dialectes spécifiques accéderont au statut de langue.
II. LES LANGUES ROMANES
Nous nous abstiendrons d'établir une typologie des langues romanes car, dans la pratique, nous aurions sous les yeux une longue énumération des traits spécifiques (phonétiques, phonologiques, morphologiques, etc.) qui différencient chaque langue et des traits communs qui les rapprochent. Nous constaterons simplement que l'on peut classer, selon leurs affinités, les langues romanes en trois grands blocs (pour reprendre la division de Wartburg) : le roumain, d'une part, le français (galloroman), d'autre part, et enfin le groupe méditerranéen ou méridional (italoroman, ibéroroman, rhétoroman, sarde), qui comporte toutes les autres langues du groupe — notons toutefois que cette typologie ne rallie pas la majorité des linguistes. Nous nous contenterons donc de donner brièvement quelques caractéristiques, avant tout lexicales, de ces langues.
Commençons tout d'abord par quelques généralités. Certaines régions de la Romania se montrent plus conservatrices que d'autres. C'est le cas de la Roumanie et de l'Espagne, qui, par leur lexique, manifestent leur caractère conservateur. Citons quelques exemples : lat. class. (h)umerŭs « humérus ; épaule » > roum. umăr « épaule » et esp. hombro alors que les autres langues romanes ont préféré le lat. tardif spatŭla « épaule » > fr. épaule, ital. spalla ; ou encore lat. class. fervĕre « bouillir » > roum. fierbe et esp. hervir à côté du latin bullīre « bouillonner, former des bulles », plus expressif, > fr. bouillir, ital. bollire (voir également l'exemple cité sous I.3.). Le sarde également, dans sa variante dialectale logoudorienne, est certainement l'idiome roman le plus archaïque ; cette situation linguistique particulière est renforcée par le caractère insulaire de la Sardaigne. Le français, quant à lui, passe pour la langue romane la plus évoluée. P. Bec parle même « d'évolutionnisme endémique », « spécificité atavique du français, qui dès sa genèse lui conférait dans l'ensemble roman surtout du point de vue phonétique, une typologie particulière [...] » (Bec, op. cit., II, 9). De fait, c'est l'idiome qui a évolué le plus rapidement. Le caractère archaïque et conservateur de certaines de ces langues (sarde, roumain, rhétoroman, dalmate) permet d'attester, d'une part, des formes du latin parlé que l'on ne posséderait pas sans elle, et d'autre part, de reconstituer et dater des évolutions phonétiques ou sémantiques particulières, disparues du reste de la Romania.
1. L'italien
se distingue par le nombre impressionnant de ses dialectes toujours très vivants : on a pu traduire en à peu près 700 dialectes italiens une nouvelle de Boccace ! Les premiers documents d'une langue italoromane remonteraient au IXe siècle. La langue littéraire, qui devient la langue commune, est celle diffusée par Dante (1265-1321), en particulier grâce à sa Divine Comédie. La base en est le toscan et plus particulièrement le dialecte florentin. Il faut attendre cependant le début du XIXe s. pour que ce dialecte soit définitivement adopté comme langue nationale et le XXe s. pour qu'il se diffuse. La base du lexique italien est constituée par des types lexicaux qui continuent le latin parlé, mais aussi le latin classique ; certains sont spécifiques de cette langue : pècora « brebis » < lat. pĕcora ; némbo « nuage » < lat. nimbus, etc. Le lexique s'est enrichi par des emprunts précoces au latin qui se distinguent très difficilement des mots hérités à cause du conservatisme phonétique de la langue ; l'italien a également beaucoup emprunté, d'une part, à ses nombreux dialectes, d'autre part, à l'espagnol (mots de cour) et à date ancienne au français et au provençal (voir Italien).
2. L'ibéroroman : espagnol et portugais
a) La langue espagnole possède beaucoup moins de dialectes que l'italien ou le français. La langue commune actuelle est basée sur le dialecte castillan. Ce n'est qu'à la fin de la Reconquista (après 1492) que le dialecte castillan s'impose comme langue commune, après avoir éliminé, dans sa progression vers le Sud, le mozarabe, parler roman, en fait peu prestigieux, des populations sous domination arabe. C'est contre l'arabe, avant tout, que le castillan dut lutter. Les plus anciens témoignages remontent au Xe s. : ce sont les Glosas emilianenses et les Glosas silenses.
Le fonds lexical, constitué essentiellement par le latin parlé, a conservé quelques types du latin classique qu'il a en commun avec le portugais : ex. lat. mĕtus « peur » > esp. miedo, port. medo ; lat. avis « oiseau » > esp. et port. ave, etc. Les autres langues romanes ont préféré les types pavor > fr. peur, ital. paura et avicellu > fr. oiseau, ital. uccello (voir d'autres exemples sous I.1.). Le lexique de l'espagnol s'est enrichi par quelques emprunts au basque, qu'il partage parfois avec le portugais et le gascon : ex. basq. ezker > esp. izquierdo, port. esquerdo, gascon esquer. Son originalité réside cependant par le nombre d'emprunts à l'arabe, peu nombreux, à vrai dire, si l'on considère le fait que les Arabes sont restés pendant huit siècles dans ce pays. Les arabismes se retrouvent surtout dans les domaines de l'administration, de la guerre, et des sciences. Notons que beaucoup de ces termes arabes ont pénétré en italien et en français par l'intermédiaire de l'espagnol, comme par exemple : ar. az῾ar « rougeâtre » > esp. alazán > fr. alezan ou ar. baṭāna « doublure d'un vêtement » > esp. badana « peau de mouton tannée » > fr. basane. Ajoutons enfin que l'espagnol a emprunté au français, dès le moyen âge, et à l'italien, au XVIe s. (comme le français, d'ailleurs) — voir l'article encadré L'espagnol.
b) La langue portugaise a des dialectes encore plus homogènes que l'espagnol. Ceci s'explique à nouveau par le mouvement d'extension de la Reconquista vers le Sud. Se rattache aux dialectes portugais le galicien (gallego), parlé en Galice espagnole et qui semble en être l'origine. Portugais archaïque et galicien furent intimement liés au moyen âge et cet ensemble sert de base à la langue littéraire, illustrée particulièrement par la poésie lyrique. Les plus anciens témoignages datent du XIIe siècle.
On a vu que le portugais partageait des types lexicaux avec l'espagnol. Il comporte toutefois beaucoup moins d'arabismes et s'en distingue par quelques archaïsmes. Là où l'espagnol dit ventana « fenêtre » < lat. °ventana, le portugais utilise janela < lat. janua, mot qui ne s'est maintenu que dans les régions les plus conservatrices de la Romania. Comme l'espagnol, il a emprunté au français ; pourtant le stock des gallicismes désignant des objets courants est différent : port. chapeu « chapeau », rua « rue » mais esp. sombrero « chapeau » et calle « rue ». — Voir l'article encadré le portugais.
3. L'occitano-roman : occitan et catalan
On rattache en général le catalan à l'occitan, parfois à l'ibéroroman. Il présente toutefois d'étonnantes ressemblances avec les parlers languedociens ; il fait en outre partie, au moyen âge, de la communauté culturelle des pays de langue d'oc. On remarquera, de plus, qu'à partir du XIIIe s., le catalan constitue une entité culturelle autonome, se démarquant de la France du Sud puis de la Castille. L'ancien catalan littéraire ne se distingue pas de l'ancien occitan. On le traite donc dans l'ensemble « occitano-roman ».
Comme pour la phonétique et la morphologie, cet ensemble présente, au niveau lexical, une situation intermédiaire entre le galloroman et l'ibéroroman. Soit il prend les solutions du français, comme par exemple, pour occit. et catal. finestra, fr. fenêtre, qui se distinguent de l'esp. ventana et du port. janela, soit il adopte celles de l'espagnol et du portugais comme pour campana « cloche », esp. campana < lat. campana, là où le français a eu sein < lat. signum, puis cloche < lat. clocca (du vieil irlandais probablement). D'autre part, occitan et catalan possèdent en commun avec l'espagnol des mots spécifiques de la région aquitano-pyrénéenne, tel occit. esquèr « gauche », catal. esquerre, aragonais et port. esquerdo, esp. izquierdo, d'origine basque, là où le français a un terme d'origine germanique gauche < francique °wenkjan ; d'autres mots, spécifiques de la région méditerranéenne comme occit. mourre « museau », catal. morre, esp. morro, sarde mourrou, gênois mourou, d'un mot probablement préroman dont la base est °mŭrr-. Le lexique de l'occitan et du catalan possède également quelques mots d'origine arabe que le français ne connaît pas. Les plus anciens témoignages datent de la fin du Xe s. et sont rédigés en ancien occitan ; c'est, avec le roman des Gaules, la langue romane la plus anciennement attestée. Les premiers témoignages d'une langue vulgaire catalane remontent à 892 ; le premier texte en catalan n'apparaîtra qu'à la fin du XIIe siècle. Le catalan littéraire se détachera enfin de l'occitan au début du XIVe siècle. En ce qui concerne la période contemporaine, il faut noter la renaissance du catalan, surtout en Espagne, avec la fin du franquisme.
4. Le français (Voir l'article encadré).
5. Le roumain
constitue à l'heure actuelle une enclave romane dans un monde slave et hongrois. Pourtant, dès la conquête des territoires balkaniques (Dalmatie, Illyrie) par Rome, la Dacie était rattachée au reste de l'Empire romain. Perdue par Rome dès 271 à la suite d'invasions de peuplades venues d'Asie et du Nord, ce territoire se trouve isolé du reste de la Romania. Seul le latin de Dacie survivra. La Dacie n'ayant été soumise que pendant deux siècles à peine à l'emprise de Rome, il est curieux de constater que sa romanisation se soit produite si rapidement. On pense que la rapidité de ce processus d'assimilation linguistique est dû au brassage des populations citadines et rurales ; les habitants des villes s'étant réfugiés dans la campagne sous la pression des Barbares, ils ont achevé de romaniser les populations rurales. Un autre facteur important explique cette rapidité d'assimilation : les Daces, peuple essentiellement composé de paysans, d'artisans et de colons, ont été profondément christianisés, et ce, avant le départ des Romains. Un îlot daco-latin s'étant formé dès le IIIe s., la langue évoluera très vite en daco-roman et se démarquera des autres langues romanes en manifestant, d'une part un profond conservatisme, d'autre part une grande homogénéité. L'influence slave commence à s'exercer dès le VIIe s. alors que la structure de la langue, différenciée et du latin et des autres langues romanes, est déjà fixée ; l'action de superstrat sera, de ce fait, sporadique, ce qui marque l'originalité du roumain par rapport aux autres langues romanes.
On distingue en général cinq phases dans l'évolution du latin parlé en Dacie et jusqu'au roumain actuel : le daco-latin (avant le IIIe s.), peu différent du latin des autres pays romans mais présentant cependant quelques « dacismes » ; le proto-roumain, formé entre le Ve et le VIIIe s. ; l'ancien roumain (IXe au XIe s.) : pendant cette période (IXe au XIIe s.), le proto-roumain se fragmente sous l'influence des migrations slaves en quatre aires linguistiques. Les premières attestations d'ancien roumain manifestent des traits dialectaux nord-danubiens. L'âge classique se situe entre le XVIIe s. et la première moitié du XVIIIe siècle. L'immobilisme social explique que la langue a dû puiser dans ses propres ressources pour s'enrichir, d'où son archaïsme et son conservatisme. Le roumain moderne apparaît au début du XIXe siècle.
Les différentes influences qu'a subies le roumain (hongroise, grecque, turque puis française) n'ont touché que le lexique ; seules les influences slave et française ont atteint le fonds lexical originel et ont modifié la structure de la langue. On notera que le français a largement contribué à la formation du roumain littéraire et commun par un apport lexical massif et une élimination des éléments slaves si bien que l'on peut parler de « ré-romanisation » du roumain. Un sondage effectué sur le lexique de base du roumain révèle que sur 1 419 mots, environ 58 % sont d'origine latine et environ 21 % d'origine slave. Dans la langue parlée, en revanche, le pourcentage des éléments d'origine latine (français, italiens, etc.) s'élève à environ 80 %. On peut caractériser, en résumé, le roumain comme suit : « Dans nombre de faits de langue, le roumain fait cavalier seul (c'est, avec le français, l'‘enfant terrible’ de la Romania), tout en ayant gardé une structure foncièrement romane et ayant évolué moins que d'autres idiomes romans » (P. Bec).
6. Le sarde
est rattaché généralement au groupe italoroman car il présente avec les parlers de l'Italie du Sud de nombreux traits communs. On peut néanmoins le traiter comme une langue à part : le caractère insulaire du pays, ses dialectes très archaïques (en particulier le logoudorien et le nuorais à côté du campidanien, à base sarde mais fortement italianisé) et un système linguistique caractéristique en font un îlot linguistique spécifique. Langue véhiculaire et administrative jusqu'au XIVe s., elle fut alors remplacée par le catalan, puis par l'espagnol et enfin par l'italien, ces langues faisant office de langue de culture et d'administration. Le logoudorien est considéré comme le sarde par excellence. L'ancien sarde nous est connu par des textes appelés condaghi, dont les premiers datent du XIe siècle.
Le lexique sarde se caractérise par son archaïsme, d'un côté, et la variété de ses couches lexicologiques, de l'autre. Parmi les archaïsmes, on notera des types lexicaux latins particulièrement originaux que l'on ne retrouve que dans cette langue : ex. lat. cĭnus « cendre » > sarde du Sud ts̆inus, là où le reste de la Romania (sauf le roumain) a des représentants du latin cĭnis, -ĕris ; d'autres ont disparu dans les rares langues où ils étaient attestés : ex. lat. domus (domo), au sens premier de « maison » sarde et ancien lombard domo (là où l'ital. a casa) ; lat. imber « pluie, averse » > logoudorien imbre « pluie », ancien occit. ymbre ; on rencontre également d'anciens types lexicaux latins qui ne se retrouvent que dans des zones marginales et archaïsantes de la Romania : ex. lat. vĕtĕrānus « vieux » > ancien logoudorien betranu, roum. betran, sicil. vitranu, rhétorom. (frioulan) vedran « vieux garçon » ; lat. jūbĭlare « appeler ; pousser des cris de joie » > logoudorien džuilare (/djouilare/) « appeler (qqn) », rhétorom. (engadinois) džüvler (/djuvler/) « pousser des cris de joie ». L'action du substrat punique, langue des Carthaginois qui s'étaient installés en Sardaigne au VIe s. avant J.-C., est très faible. Parmi les langues de superstrat (germanique, arabe), seuls l'espagnol et le catalan ont joué un rôle très important : présence de nombreux éléments catalans au Sud (en campidanien), espagnols, au Nord (logoudorien). Quant à l'influence italienne, elle s'est traduite au moyen âge par l'apport d'éléments génois et pisans, aujourd'hui par l'adoption de l'italien comme langue officielle.
7. Le rhétoroman :
romanche, ladin, frioulan forme un ensemble constitué de trois groupes de parlers : le groupe occidental situé en Suisse, dans les Grisons, formé par les dialectes romanches (en particulier le sursilvan et l'engadinois) ; le groupe central constitué par les dialectes ladins des Dolomites (Italie) ; enfin, le groupe oriental frioulan (parlé dans la province d'Udine, en Italie). Cet ensemble, unifié autrefois, se trouve aujourd'hui morcelé et deux groupes de parlers se détachent de par leur conscience linguistique et leur identité culturelle : le romanche, reconnu comme quatrième langue en Suisse en 1938, et le frioulan. Les vagues successives d'invasions germaniques expliquent l'éclatement de ce domaine. La question qui se pose aux linguistes est de savoir à quel type il faut rattacher cet ensemble de parlers : au galloroman ou à l'italoroman ? Historiquement, les affinités entre l'italoroman du Nord (gallo-italien) et le rhétoroman sont incontestables ; les évolutions linguistiques qui rapprochent le rhétoroman du galloroman septentrional ont eu lieu indépendamment l'une de l'autre et à des époques différentes ; actuellement, le romanche et le frioulan sont des langues distinctes. Cependant, si l'on considère leur ancienne unité et la situation actuelle, le rhétoroman constitue un groupe en soi. Le romanche a obtenu le statut de langue ; comme il est formé d'environ une vingtaine de sous-dialectes, la Confédération helvétique a créé une espèce de romanche commun écrit appelé interromanche.
L'espace linguistique rhétoroman se distingue, comme beaucoup de zones marginales, par son conservatisme et son archaïsme, en particulier lexical. Il conserve des types lexicaux qui lui sont spécifiques : ex. lat. algēre « avoir froid » > romanche aulže (/aouljé/) ; lat. caseolus, diminutif de caseus « fromage » > romanche kizíəl, engadinois tsážoẹl (/tsajeul/) alors que le frioulan possède un type fromage ; proche du gallo-italien, il partage avec lui certains types comme lat. mēla, pluriel de mēlum, variante de mālum « pomme » > rhétoroman mayl, ital. mela et franco-provençal (fribourgeois) mel ; avec le galloroman, des types tel le diminutif du lat. sōl, °soliculus « soleil », présent dans la majeure partie du gallo-roman, en occitan et en catalan ; le rhétoroman possède en commun avec les zones marginales archaïsantes quelques termes tout à fait spéciaux comme par exemple les trois noms de couleur, « rouge », « blanc » et « fauve », issus respectivement du lat. coccĭnus (à l'exception du frioulan), albus et mēlĭnus : on ne les retrouve, comme mots hérités, le premier qu'en roumain et en albanais, le second en roumain, dalmate, ancien sicilien, ancien sarde, portugais, espagnol et très rarement en galloroman, le troisième en sarde et en ancien occitan. L'originalité du rhétoroman ressort, en outre, du choix aléatoire et différent des types latins répartis sur son territoire ; il est frappant que ce phénomène se soit produit dans des domaines aussi fondamentaux que celui de la nature ou des animaux. Pour désigner l'arbre, le frioulan a choisi le terme courant latin arbor, le romanche le lat. planta, le tyrolien le lat. lĭgnum et l'engadinois le germanique °bosk- ; pour désigner la brebis, le romanche s'est décidé pour un représentant de °nutrica, l'engadinois pour bestia et le frioulan pour pĕcora (probablement emprunté à l'italien).
Comme pour les autres langues romanes, les langues de superstrat ont enrichi le vocabulaire. Le courant slave a introduit dans le Frioul une centaine de mots slaves. L'apport le plus important est celui des langues germaniques, à date ancienne — ceci est valable particulièrement pour le Frioul dont la langue officielle fut pendant trois siècles (Xe au XIIIe s.) l'allemand ; actuellement, les emprunts aux divers dialectes germaniques environnants sont continus. L'influence de l'italien s'exerce particulièrement dans le Frioul, mais aussi en Engadine. On remarquera qu'à l'intérieur du domaine linguistique rhétoroman, le Frioul entretient un individualisme certain.
8. Le franco-provençal
La spécificité du franco-provençal n'a été reconnue que récemment (1873). Pourtant, cet ensemble linguistique possède des traits propres qui le distinguent d'une part du français d'oïl, d'autre part, de l'occitan. Son aire recouvre la plus grande partie des cantons suisses de Fribourg et de Neuchâtel, le Valais et le canton de Vaud (groupe septentrional), le canton de Genève, en France le Lyonnais, le Dauphiné, la Savoie, et en Italie, le Val d'Aoste (groupe méridional). La grande plaque tournante qu'était Lyon au moyen âge a permis le développement d'une « langue de cité » et d'une langue écrite à base dialectale lyonnaise ; c'est le prestige de cette même ville, qui, dès le XIVe s., favorisera la pénétration du français dans l'aire méridionale. On s'accorde aujourd'hui pour reconnaître que le franco-provençal n'est pas une entité intermédiaire entre le français d'oïl et l'occitan ; ce serait, en fait, le premier ensemble à s'être détaché, vers le Xe s., du galloroman septentrional (dès le VIe s. des évolutions françaises ne s'y produisent pas) pour former une aire marginale, et par là même conservatrice, ce caractère étant renforcé par le fait que son territoire est surtout constitué de régions montagneuses. Comme pour le rhétoroman, certains traits le rapprochent du domaine d'oïl, d'autres du domaine d'oc. Le fonds lexical est essentiellement latin ; un substrat pré-roman se fait surtout sentir dans les Alpes ; le superstrat germanique, plus précisément burgonde, n'a marqué que le lexique du franco-provençal. Le franco-provençal a emprunté au français, à l'italien, à l'occitan et aux dialectes germaniques qui l'entoure.
9. L'illyro-roman, ou dalmate
est une langue disparue aujourd'hui. Le dernier sujet parlant s'est éteint en 1898. Le dalmate était parlé autrefois dans une dizaine de villes côtières, dans ce qui fut naguère la Yougoslavie. Cette langue est essentiellement connue par le vegliote, mot formé d'après le nom italien de la ville de Krk : Veglia ; le ragusain, de Raguse aujourd'hui Dubrovnik, moins bien attesté que le vegliote, était aussi un dialecte du dalmate. On a essayé de rattacher au groupe illyro-roman l'albano-roman parlé au moyen âge dans quelques villes de la côte d'Albanie et du Montenegro ; ce dialecte est trop peu connu pour que l'on en tienne compte ici. Si la Dalmatie romane formait sous l'Empire romain un territoire continu, elle ne comporte plus, au VIIe s., que quelques îlots disséminés en milieu slave, croate. Soumis à l'influence de la République de Venise dès le XVe s., le parler vénitien y a été modifié. La comparaison entre le vénitien parlé en Dalmatie et celui qui était parlé en Italie permet de reconstruire quelque peu le dalmate de cette époque, pour laquelle nous ne possédons aucun document. Un autre moyen de reconstruction est fourni par les emprunts à date ancienne que le croate a fait au dalmate.
Le lexique dalmate fait preuve de conservatisme. Quelques types lexicaux latins anciens se retrouvent aussi en roumain et, parfois, en rhétoroman. Comme le roumain, le vegliote a perdu certains types lexicaux latins qu'il a remplacé par d'autres mots d'origine latine : ex. lat. ecclēsia a été remplacé par basĭlĭca. Fortement influencé par le croate, le dalmate a également emprunté, dans une faible mesure, au vénitien, au grec, aux langues germaniques et au dialecte roumain d'Istrie (au nord-ouest de la Yougoslavie).
CONCLUSION
La différenciation des langues romanes a été étudiée ici sous l'aspect lexical et non phonétique. Les différentes couches lexicales d'une langue sont, en effet, plus faciles à reconstituer et à dater que les évolutions phonétiques ; la reconstruction d'une action de substrat sur le phonétisme d'une langue est, en outre, plus aléatoire à déterminer que celle d'un type lexical. Il faut dire que le linguiste possède un matériel lexical exploitable très riche — tous les pays de langue romane possèdent des atlas linguistiques et des dictionnaires étymologiques ; les dictionnaires de latin médiéval par région sont en cours d'achèvement. Il est, pour ces raisons, moins aventureux d'aborder le problème de l'origine des langues romanes par le biais du lexique : « celui qui voudra s'attaquer au sujet de la différenciation des langues romanes, devra s'en tenir essentiellement au vocabulaire » (trad. de Wartburg, cité d'après Schmitt, Die Sprachlandschaften der Galloromania [Les Paysages linguistiques de la Galloromania], Berne/Francfort, 1974, p. 44).
Marie-José Brochard
BIBLIOGRAPHIE