Laboratoire Ligérien de Linguistique
facilityChaingy, Centre-Val de Loire, France
Research output, citation impact, and the most-cited recent papers from Laboratoire Ligérien de Linguistique (France). Aggregated across the NobleBlocks index of 300M+ scholarly works.
Top-cited papers from Laboratoire Ligérien de Linguistique
International audience
International audience
Abstract The goal of this paper is to present newly collected data of Djibouti Somali and show how it offers insight into the architecture of nouns. Djibouti Somali, like Standard Somali, is characterized by the presence of inflectional classes. Building on my own fieldwork material, I discuss both the empirical statements and the theoretical implications that emerge from the observation of three aspects of noun inflection: (1) pluralization strategies, (2) the position of pitch accent with respect to gender and (3) the opposition between Absolutive and Nominative case. In particular, the fact that Djibouti Somali uses mainly two suffixes to pluralize nouns, leads us to the hypothesis that the inflectional system of this variety consists of only two inflectional types. Basic non-derived nouns belong to what I call type A, whereas suffixed nouns belong to type B. This dichotomy is confirmed by the behavior of pitch accent with respect to both gender and syntactic case. Finally, I propose that the distinction between type A and type B can be accounted for, in the context of a formal analysis, by postulating the existence of a contrast between null vs. overt nominalizer.
La comparaison de deux corpus d’enquêtes sociolinguistiques réalisés à quarante ans d’intervalle permet de mettre en perspective certains aspects centraux de la constitution des données et d’interroger, par delà une description des différents choix méthodologiques et théoriques opérés, la place des données dans la linguistique de corpus.
LE FRANCIEN (1815-1914) : LA LINGUISTIQUE AU SERVICE DE LA PATRIE Le francien, dialecte de l'Ile-de-France, représenterait le français « standard » du Moyen Age, mais ce concept correspond en fait à une attente jacobine des classes dominantes de la Troisième République, relayée par des universitaires en quête de légitimité, et à une stabilisation du marché de la linguistique sous la férule de G. Paris. Outil opératoire et symptôme d'une politique de la science vouée à une histoire apologétique du français, le « francien » relève de la fiction scientifique.
Nous examinons comment la linguistique cognitive aborde les relations entre langage et pensée à partir de l’exemple emblématique des couleurs. L’analyse linguistique des formes lexicales référant aux couleurs disponibles en langue et repérées dans différents types de corpus (dénominations de pastilles colorées, discours descriptifs de la qualité visuelle), couplée avec une théorie psychologique de la catégorisation, conduit à identifier une diversité de conceptualisations et de modes de référenciation de la couleur. Ceci nous amène à discuter la position naturalisante de la sémantique cognitive et à proposer une théorie linguistique cognitive «située » où s’articulent une sémantique des langues et de la construction du sens en discours, et une théorie psychologique des catégories du sensible dans une sémiotique cognitive des cultures.
Abstract This study investigates a recent web-enabled feature, the use of brief audio/video recordings for the communication of scientific research findings to a non-specialized audience, and discusses the implications of these “scholarly soundbites” for genre evolution in the digital environment and for the mediatization of science. We focus on four types of audiovisual material, all characterized by their brevity: Three-Minute Thesis presentations, author videos, and podcasts on a popular science and a research journal website. An analysis of the moves and of the recontextualization strategies used to manage the knowledge asymmetry between scientists and audience highlights differences between the four types of soundbites as well as with the corresponding written genres (research articles, PhD dissertations).
Cet article presente tout d'abord la cascade de transducteurs CasEN pour la reconnaissance des entites nommees. CasEN est implantee sous le logiciel CasSys de la plate-forme Unitex et est librement mise a disposition des utilisateurs sous licence LGPL-LR. Apres une discussion sur la typologie des entites nommees qu'elle utilise et une description du fonctionnement de la cascade, nous rapportons son evaluation sur le corpus Eslo 1 (corpus d'Orleans) et les performances qu'elle a montrees au cours de la campagne d'evaluation Ester 2. Nous presentons ensuite deux autres cascades qui utilisent le texte etiquete par CasEN. La premiere ajoute des informations sur les locuteurs de l'enquete sociolinguistique Eslo 1 et la seconde met en relation des entites nommees dans un corpus du journal Le Monde.
Cet article souhaite porter un regard réflexif sur le projet scientifique de constitution et d’exploitation d’un grand corpus de français parlé, les Enquêtes sociolinguistiques à Orléans, né à l’aube de la sociolinguistique et qui se développe au tournant méthodologique et épistémologique des digital humanities. Quels objectifs ? Quelles données ? Quels traitements ? Ce sont les questions qui guident la réflexion proposée ici afin d’apporter une contribution à l’élaboration de nouvelles pratiques scientifiques dans une perspective variationniste contemporaine.
International audience
Bergounioux Gabriel. La science du langage en France de 1870 à 1885 : du marché civil au marché étatique. In: Langue française, n°63, 1984. Vers une histoire sociale de la linguistique, sous la direction de Jean-Claude Chevalier et Pierre Encrevé. pp. 7-41.
Cette contribution dresse le bilan critique d’une étude de corpus, menée par deux chercheuses de disciplines différentes. Elle vise à définir les conditions d’une pratique scientifique interdisciplinaire de l’analyse des données textuelles à l’intérieur des Sciences Humaines et Sociales. Cette étude de cas nourrit un objectif plus vaste, celui d’une herméneutique théorisée dans la tradition française de l’analyse de discours et articulée à un principe méthodologique fondamental – la variation des données textuelles et des pratiques interprétatives – au service duquel sont mis différents outils lexicométriques.
L'omniprésence de la polysémie dans les langues force à considérer la compréhension des énoncés comme un processus dynamique, dans lequel le sens de chaque unité linguistique se détermine en même temps que se construit le sens global de l'énoncé. Ce processus d'interaction, que l'on peut appeler compositionnalité gestaltiste, s'oppose radicalement au mécanisme de compositionnalité classique prôné par les formalismes linguistiques qui sont fondés sur la primauté de la syntaxe. Cela revient au contraire à considérer la structure syntaxique d'un énoncé comme un résultat de la construction du sens, et non plus comme son initiateur. La compréhension d'un énoncé repose donc directement sur le processus d'interaction entre les différents composants élémentaires de cet énoncé : unités lexicales, marqueurs grammaticaux, relations positionnelles entre unités, ou, plus généralement, constructions élémentaires au sens des grammaires de construction. Modéliser ce processus dynamique constitue un enjeu essentiel pour tous les courants linguistiques qui, comme les grammaires cognitives et les théories de l'énonciation, récusent le principe de compositionnalité classique.Nous présentons dans cet article un cadre théorique dans lequel la dynamique d'interaction obéit à un principe de convocation-évocation : les différents composants élémentaires d'un énoncé contribuent à construire une représentation globale dans un espace intersubjectif que nous appelons scène verbale. Chaque composant sert à évoquer un nouvel élément de la scène verbale en construction, mais pour ce faire, il doit d'abord convoquer d'autres éléments présents sur cette même scène ou dans la situation d'interlocution. Le principe de convocation-évocation constitue ce qui définit l’identité d’une unité linguistique. Nous exprimons cette identité sous la forme d’une instruction dynamique de construction du sens et nous considérons que toute unité linguistique donne une telle instruction. Ainsi, le sens est bien le résultat d'un processus de composition gestaltiste, puisque la contribution de chaque composant élémentaire dépend de la contribution des autres composants présents dans l'énoncé. Nous montrons à partir d’exemples français et anglais une première tentative de modélisation de ce processus.Nous discuterons aussi du statut cognitif tout à fait particulier de ces scènes verbales, en défendant l'idée que les spécificités du langage humain découlent de cette fonction de représentation dans un espace intersubjectif, le terme de représentation n'étant pas à prendre au sens habituel en sciences cognitives, mais au sens premier de son étymon latin : repraesentare = rendre présent.
In this paper, we discuss a cross-document coreference annotation schema that we developed to further automatic extraction of timelines in the clinical domain. Lexical senses and coreference choices are determined largely by context, but cross-document work requires reasoning across contexts that are not necessarily coherent. We found that an annotation approach that relies less on context-guided annotator intuitions and more on schematic rules was most effective in creating meaningful and consistent cross-document relations.
Bergounioux Gabriel. Les enquêtes de terrain en France. In: Langue française, n°93, 1992. Enquête, corpus et témoin, sous la direction de Gabriel Bergounioux. pp. 3-22.
ABSTRACT: The aim of this study is to reconstruct on the one hand the sociallogic in the career of Arsene Darmesteter, the French linguist who was relegated to a marginal position because of his religious status and his education, and on the other hand the scientific logic of his work, which is close to the neo-grammarian theses and prefigures Bréal's semantics. This study relates biography and research to the market of linguistics and, using the theories of P. Bourdieu, attempts to demonstrate both the richness and the limits of Arsene Darmesteter's work within the historical context of the European romanistics and phonetics of the late XIXth century.
International audience
This article presents ANCOR_Centre, a French coreference corpus, available under the Creative Commons Licence. With a size of around 500,000 words, the corpus is large enough to serve the needs of data-driven approaches in NLP and represents one of the largest coreference resources currently available. The corpus focuses exclusively on spoken language, it aims at representing a certain variety of spoken genders. ANCOR_Centre includes anaphora as well as coreference relations which involve nominal and pronominal mentions. The paper describes into details the annotation scheme and the reliability measures computed on the resource.
International audience
Dans le cadre d’une sémantique linguistique reposant sur la distinction signification/sens et partant du principe que le sens se construit en discours, nos recherches ont pour objectif de rendre compte de la diversité des emplois d’un signe dans une perspective intégrant la prosodie, afin de définir un processus de discrimination prosodique des différents sens d’une même unité tels qu'ils peuvent être décrits sur la base de corpus oraux authentiques. Elles portent sur un ensemble d’objets empiriques, de enfin à quelques ou oui en passant par disons, mais principalement sur des connecteurs discursifs. Après avoir mis au jour des corrélations forme prosodique/sens au niveau du lexique, et en prenant en compte le caractère gradable de la langue ainsi que la notion d’argumentation dans la langue, nous proposons un nouveau format de représentation sémantique distinguant, sur la base de nos résultats, deux niveaux de sens que sont l’interprétation-type et l’emploi-type, ce dernier présentant la particularité de comporter un commentaire exprimé par la prosodie, commentaire qui porte sur le rapport à la situation et/ou à l'énonciation. L’intégration d’un niveau de sens supplémentaire constitue l’originalité de ce nouveau format et présente l’avantage de réduire les phénomènes de surgénéralisations observables dans les caractérisations sémantiques des emplois. Nous présentons ensuite la façon dont nos résultats pourraient être intégrés à une perspective lexicographique, et dont ils pourraient permettre d'obtenir à la fois une plus grande cohérence et une plus grande exhaustivité des articles d’une entrée de dictionnaire, et une prise en compte systématique de la prosodie des emplois.