摘要:Nous proposons dans cet article l’approche IC-Doc, permettant une représentation automatique de
collections de documents textuels pour une caractérisation thématique du contenu. IC-Doc est basée
sur une méthode originale de représentation des termes prenant en considération à la fois les notions
de co-occurrences contextuelles et de partage de contextes, en vue du calcul de mesures pertinentes de
similarités textuelles. Ce papier présente également une expérimentation de l’approche IC-Doc sur des
collections de documents textuels.
关键词:Caractérisation thématique, Représentation de termes, Connaissances textuelles,
Similarité textuelle, Clustering.