Nouveautés

Faculté

Départements

Formation

Vie estudiantine

Ecole Doctorale

Stages

4C FSS

Accès

Contact

Data Engineering and Semantics Research Unit : Projets
Projets

English | Français

DAAD (2016): Transfert de l'expérience de formation en recherche sur les médias sociaux [avec l'Université Duisburg-Essen, Allemagne]
L’objectif de ce projet est de transférer l’expérience de l’équipe de Duisburg-Essen dans la recherche sur les médias sociaux. La contribution porte sur les méthodes de similarité/proximité sémantiques et les techniques d’évaluation utilisées dans ce domaine. Le travail réalisé a fait l’objet d’une publication dans une revue internationale avec comité de lecture. Deux Workshops sont réalisés, un en Tunisie et un autre en Allemagne. Un stage de fin d’études d’ingénieurs ainsi que deux stages pour des doctorants ont été réalisés en Allemagne dans le cadre de ce projet.
 
DAAD (2017): Transfert de l'expérience de mise en réseau et de valorisation de la recherche comme passerelle entre les enjeux académiques et industriels [avec l'Université de Passau, Allemagne]
L’objectif de ce projet est de développer un service basé sur les données sociales pour le suivi des personnes âgées. Il est à noter que ce projet a été réalisé en collaboration avec une équipe de recherche de l’université de Passau en Allemagne. Le travail réalisé a fait l’objet d’une publication dans une conférence internationale. Un workshop a été réalisé en Tunisie afin de présenter l’expérience de l’équipe allemande dans l’élaboration de projets H2020. Un stage de fin d’études d’ingénieurs ainsi que deux stages pour des doctorants sont réalisés en Allemagne dans le cadre de ce projet.
 
MESRS (2020): Surveillance Psycho-sociale et prEdiction EpiDémiologique du COVID-19 dans le contexte TUNisien [avec la Faculté de Médecine de Sfax, Tunisie]
Ce projet vise à créer des applications informatiques qui sont basées sur les technologies ouvertes comme les ressources sémantiques de NIH (Ex.: PubMed, MeSH), les programmes Open Source accessibles sur GitHub (Bases des données sur le COVID-19) et les projets Wikimédia (Ex.: Wikipédia, Wikidata) pour la prise en charge psycho-sociale de la pandémie COVID-19 en Tunisie :
  • Un système de prédiction du COVID-19 qui permettra d’identifier et de prévoir l’évolution de l’épidémie en utilisant des algorithmes de l’Intelligence Artificielle.
  • Un système d’analyse thématique des réseaux sociaux qui servira à l’identification en temps réel des intérêts des utilisateurs en Tunisie concernant l’épidémie (le virus SARS-CoV-2).
  • Un système de recommandation d’articles scientifiques qui proposera au ministère les publications scientifiques pour répondre aux rumeurs ou confirmer les vraies informations.
L’apparition du virus est souvent liée à des premiers symptômes. Ainsi, il est possible d’alerter une personne qui peut être un porteur potentiel du virus afin qu’il puisse prendre les mesures nécessaires en utilisant des conduites à tenir conventionnelles. De point de vue méthodologique, l’approche qu’on compte développer s’appuie essentiellement sur des algorithmes d'apprentissage automatique et profond, modélisant l’évolution de l’épidémie COVID-19 dans ces différentes phases (identification, transmission). La détermination d’outils statistiques en relation avec la propagation du virus SARS-CoV-2 représente une information très pertinente pour les médecins et les chercheurs. En effet elle permettra de minimiser le rayon d’action de lutte du virus. Il est ainsi possible de proposer des scénarios d’aide à la décision pour réaliser des traitements adéquats. En finalité, il devient possible de déduire la meilleure façon d’agir et les précautions à prendre une fois un foyer est détecté. Les bases de connaissances sont exploitées pour la détection des topics à partir des données extraites des réseaux sociaux en relation avec les sujets centrés CODIV-19 discutés et propagés entre les utilisateurs en Tunisie. Une étape de prétraitement sera mise en place pour la transformation des données textuelles écrites en arabe et en dialecte tunisien vers des concepts appartenant à des ontologies biomédicales. Cependant, nous exploitons des compétences de traitement de langages naturel qui se base essentiellement sur des approches hybrides joignant les approches statistiques (n-grams, réseaux bayésiens,…) et l'apprentissage profond (fastText, Word2Vec,…) pour surmonter certains problèmes liés à la nature de la langue arabe. Les technologies Big Data seront exploitées tout au long du data pipeline à partir de l'ingestion des données sociales volumineuses jusqu'à le traitement parallèle (MapReduce et Spark) des données sauvegardées dans un système de gestion de fichiers distribué (HDFS). Une architecture Big Data sera assurée par une panoplie de services fournis par le Datacenter qui sera mis en disposition via une couche logicielle appropriée. Les données seront collectées en mode streaming pour pouvoir mettre à la disposition des services en temps réel. Aussi, une solution dirigée par une ontologie est utilisée pour le traitement de l'hétérogénéité des données collectées à partir de différents réseaux sociaux. Une telle solution est déjà établie dans le cadre de nos travaux de recherche. Elle permettra aussi l'unification des données sociales pour le stockage dans un contexte Big Semantic Data et la manipulation d'un graphe de connaissances par les méthodes de Network Embedding. La technologie sémantique dirigée par les bases de connaissances fournit une représentation se basant sur les technologies de Web sémantique et interopérable avec les ontologies biomédicales pour pouvoir fournir les services en relation avec le système de recommandation envisagé.