Table des matières
Wikipedia
Les outils
Version offline et traitements spécifiques
Les données
STX
Parsers
Les sites
Divers
Wikipedia
Wikipedia
est une encyclopédie collaborative basée sur un wiki
Les outils
Outil pour télécharger les dumps
Wikipediabot
Wandora
Wikipedia Miner
JWPL (Java Wikipedia Library)
Version offline et traitements spécifiques
Wikifilter
Ways to process and use Wikipedia dumps
Building a (fast) Wikipedia offline reader
Wikipédia:Requêtes XML
Extracting Text from Wikipedia
(Evan Jones)
Alternative parsers
Wikipedia Extractor
Les données
Les dumps de Wikipedia
STX
Introduction à STX
Exemple STX
Processing Mediawiki with STX
Parsers
Parse Mediawiki dump
Wiki preprocessor
One-pass parsers
Alternative parsers
Wikipedia Tools
Export
The Java Wikipedia API is a parser library for converting Wikipedia syntax to HTML
Les sites
DBpedia
contient des informations structurées extraites de Wikipédia
Divers
How today's college students use Wikipedia for course-related research
Comment les étudiants utilisent-ils Wikipedia ?
Six Degrees of Wikipedia
(Stephen Dolan)
Extracting and Re-using Structured Data from Wikis
Utilisation de JSoup pour extraire le premeir paragraphe d'une page wikipédia
wikidistrict
est un moteur de recherche qui permet de faire des liens entre deux mots grâce à wikipédia.