摘要:Dans cette étude exploratoire, nous nous intéressons aux Phrases Préfabriquées des Interactions (p. ex. c’est clair ; je te jure ; on dirait). Après avoir défini ce type de phrase, nous évaluons dans quelle mesure le corpus arboré Orféopeut être exploité pour extraire et caractériser ces éléments. Les résultats de l’analyse qualitative montrent que le repérage des phrases parenthétiques apparaît plus complexe que pour les clausatifs (propositions indépendantes). Nous montrons aussi comment l’outil Lexicoscope permet, en exploitant la combinatoire lexico-syntaxique et la distribution des éléments entre et à l’intérieur des tours de parole, de mieux cerner les caractéristiques de ces phrases préfabriquées.
其他摘要:Extraction of Prefabricated Interaction Phrases from a French Spoken Treebank : An Exploratory Study. In this exploratory study, we are interested in Prefabricated Phrases of Interactions (e.g., ‘c’est clair’; ‘je te jure’; ‘on dirait’). After defining this type of sentence, we evaluate to what extent the Orféo treebank can be exploited to extract and characterize these elements. The results of the qualitative analysis show that the identification of parenthetical sentences appears to be more complex and difficult than for clausatives. We also show how the Lexicoscope tool allows us, by exploiting the lexical-syntactic combinatorics and the distribution of the elements between and within the speech turns, to better identify the characteristics of these prefabricated sentences..