Types d’unités et procédures de segmentation
Toute entreprise de description, d’annotation ou de traitement automatique du langage implique le choix d’unités définies univoquement, applicables de manière robuste aux différents types d’échanges verbaux. À quelles unités faire appel lorsque l’on travaille sur des corpus de langue parlée, des écrits faiblement ponctués ou des faits de syntaxe relevant de la parataxe, de la corrélation, de l’énoncé averbal ?
Au cours des dernières décennies, le développement des études sur l’oral et sur la phraséologie a vu l’apparition d’une profusion d’entités nouvelles : noyau, clause, intervention, énonciation, construction, chunk, fragment, jet textuel, etc. ; et l’on a vu resurgir l’antique période, redéfinie de diverses manières. Ces unités ont été caractérisées en fonction de critères syntaxiques, sémantiques, illocutoires, psycholinguistiques, praxéologiques et/ou prosodiques – autant de paramètres dotés de statuts et de poids différents selon les auteurs et les écoles.
Les onze chapitres de cet ouvrage dressent un portrait de ces nouvelles unités, des applications auxquelles elles donnent lieu, des avancées qu’elles permettent, des difficultés auxquelles elles achoppent. Les points d’accord et de désaccord qui se manifestent dans le livre apportent en eux-mêmes des enseignements précieux : ils permettront espérons-le, sur des bases épistémologiques épurées, de poursuivre dans de bonnes conditions un débat dont les enjeux, à la fois théoriques, méthodologiques et didactiques, sont fondamentaux pour les sciences du langage.
Couverture : Irina Laskin, Segmentation, 2015, huile sur toile 24” x 30”, reproduit avec l’aimable autorisation de l’artiste (www.irinalaskin.com)