SimpleText@CLEF-2021 Tâches pilotes


SimpleText@CLEF-2021 Tâches pilotes

Accueil Appel à communication Dates importantes Tâches pilotes  
Programme Publications Organisation Contacts

Directives pour les tâches pilotes de SimpleText

Nous vous invitons à soumettre aussi bien des passages automatiques que manuels ! Les interventions manuelles doivent être signalées.



Accès

Veuillez vous inscrire à l’atelier SimpleText@CLEF afin d’accéder aux données : http://clef2021-labs-registration.dei.unipd.it/
Après l’inscription, vous recevrez un courriel contenant les informations nécessaires pour vous connecter au serveur de données : https://guacamole.univ-avignon.fr

Soumission des résultats :

Les participants doivent placer leurs résultats dans le dossier Documents créé pour leur utilisateur.

2021 - Dataset

Pour cette édition, nous utilisons le Citation Network Dataset : DBLP+Citation, ACM Citation network (https://www.aminer.org/citation). Un index Elasticsearch est mis à la disposition des participants et est accessible via une API GUI. Cet index est adapté pour :

  • appliquer des méthodes de base de recherche de passages basées sur des modèles de RI vectoriels ou linguistiques,
  • générer des modèles d’allocation de Dirichlet latente,
  • former des Graph Neural Networks pour la recommandation de citations, comme c’est le cas sur https://stellargraph.readthedocs.io/ par exemple,
  • appliquer des Transformers bidirectionnels profonds pour l’expansion des requêtes,
  • et bien plus encore…

2021 - Requêtes

Pour cette édition, les requêtes sont une sélection de titres de presse récents du Guardian enrichis de mots-clés extraits manuellement du contenu de l’article. Il a été vérifié que chaque mot-clé permet d’extraire au moins 5 résumés pertinents. L’utilisation de ces mots-clés est facultative.

Format d’entrée pour toutes les tâches :

  • Sujets au format MD