摘要:Le corpus TALC-sef (pos-TAgged Literary Corpus, Serbian-English-French), initié dans le cadre de deux projets de recherche (2007-2009 et 2010-2011) impliquant les universités Lille 3, Artois et l'université de Belgrade, était à l'origine conçu comme un corpus parallèle de référence, de traductions dans le domaine littéraire, pour le serbe, l'anglais et le français. En complément d'un alignement au niveau phrastique, réalisé de façon automatique et validé manuellement, des annotations morpho-syntaxiques en parties du discours avaient été rajoutées dès les premières versions du corpus, de façon complètement automatique pour les sous-corpus français et anglais, grâce aux modèles d'étiquetage du Treetagger (Schmid, 1994). Toutefois, faute de ressources exploitables en serbe, ces annotations n'avaient pu être menées à bien. Nous détaillons dans la suite de cet article la méthodologie adoptée pour la définition d'un jeu d'étiquettes syntaxiques pour la langue serbe, les choix techniques et linguistiques que nous avons faits dans le but d'enrichir le sous-corpus serbe d'annotations syntaxiques comparables à celles des sous-corpus français et anglais, afin de permettre des recherche de cooccurrences d'étiquettes syntaxiques en parallèle dans les trois langues. Puis, nous discutons des performances d'étiquetage syntaxique enregistrées avec trois étiqueteurs librement disponibles : TnT (Brants 2000), Treetagger (Schmid, 1994) et BTagger (Gesmundo & Samardžić, 2012), avant d'aborder les perspectives d'exploitation de l'étiquetage syntaxique réalisé pour d'autres niveaux d'annotations, en soulignant l'apport de ce corpus multilingue pour la linguistique française.