摘要:Cet article aborde la question de la segmentation par des pauses du flux de production écrite enregistré en temps réel et de la motivation linguistique et statistique de l’emplacement des pauses. En effet, les pauses segmentant des séquences textuelles linguistiquement analysables, il est crucial de comprendre si des contraintes régulières en fixent les frontières. Nous avons choisi de nous pencher sur le cas de la conjonction et, en vertu de la diversité sémantique et morphosyntaxique des relations qu’elle sémiotise. Après avoir mis en perspective les résultats d’une analyse de corpus antérieure, nous procédons à une annotation manuelle des occurrences en départageant les emplois extra- et intraphrastiques de et dans un corpus de textes courts produits par des adultes (étudiants). Une méthode d’analyse statistique est ensuite appliquée aux données annotées pour tester les attentes statistiques en termes d’emplacement des pauses. Cette analyse permet de faire ressortir des différences de segmentation en fonction du type d’emploi de et.
其他摘要:This paper addresses the issue of segmentation by pauses of the stream of written production recorded in real time and the linguistic and statistical relevance of the location of these pauses. Indeed, as pauses segment linguistically analyzable textual sequences, it is crucial to understand whether regular constraints set their boundaries. We have chosen to focus on the case of the conjunction and (et) due to the semantic and morphosyntactic diversity of the relations it semiotizes. Once put into perspective the results of a previous corpus analysis, we proceed to a manual annotation of the occurrences by separating the extra- and intraphrastic uses of and in a corpus of short texts produced by adults (students). A statistical analysis method is then applied to the annotated data to test statistical expectations in terms of break location. This analysis reveals differences in segmentation based on the type of use of et..