INDECT: Rapport en VO sur la méthodologie textuelle utilisée pour les blogs, infos, chat
Rapport en anglais "XML Data Corpus: Report on methodology for collection, cleaning and unified representation of large textual data from various sources: newsrzports, weblogs, chat".
Document à traduire. Document en version PDF ici