©Freepik
Thèse Charles Abdoulaye Ngom (2024 - 2026)

Information spatiale et intelligence artificielle pour améliorer le suivi de la sécurité alimentaire à partir de données textuelles

Cette étude vise à améliorer la détection précoce des risques de crises alimentaires à partir de sources textuelles, un domaine encore peu exploré. Elle s’attache notamment à évaluer et représenter les facteurs de risque souvent diffus ou décalés dans le temps. Cette approche méthodologique innovante est destinée in fine à renforcer l’efficacité des systèmes d’alerte existant.

Contexte et enjeux

Cette étude porte sur la sécurité alimentaire, un enjeu sociétal majeur, et s’intéresse à la détection précoce des risques de crises alimentaires afin d’améliorer l’efficacité des systèmes d’alerte utilisés par les gouvernements et les ONG. La surveillance de ces crises à partir de sources textuelles demeure peu explorée, contrairement à la surveillance épidémique, stimulée par les récents contextes sanitaires mondiaux. Elle pose toutefois d’importants défis méthodologiques liés à la représentation de l’information, comme la nécessité d’une sémantisation fine de l’information spatiale - mais également temporelle - via la représentation de leur “portée”. Plus précisément, la notion de portée correspond à l'impact spatio-temporel de facteurs de risque de crise alimentaire qui ne sont pas ponctuels et peuvent être imprécis. Elle s’applique  également à des événements ponctuels comme une inondation ou une invasion de ravageurs dont les effets sur la production agricole - et donc sur la sécurité alimentaire - sont décalés dans le temps voire dans l'espace. La représentation spatio-temporelle des facteurs de risque de crises alimentaires nécessite donc des contributions innovantes et constitue un front de science méthodologique.

Objectifs

La thèse proposée s’intègre dans le domaine de la détection précoce et le suivi des crises alimentaires en se fondant sur des informations textuelles provenant de sources informelles telles que les articles de presse. L'objectif central est d'extraire et de représenter de manière appropriée les caractéristiques spatio-temporelles associées à ces données textuelles pour améliorer l’identification des événements qui sont liés. La prise en compte de la complexité de l'information spatiale, incluant des éléments comme les relations de hiérarchie et de proximité, représente un défi actuel pour lequel il existe peu de solutions satisfaisantes. Le projet se concentre sur le développement d'une méthodologie qui intègre des graphes de connaissances spatiaux dans les modèles issus de l'Intelligence Artificielle (dont les modèles génératifs), en tenant expressément compte de l'information spatiale et temporelle. Les méthodes proposées seront évaluées sur un corpus de documents déjà constitué, couvrant l’actualité de plusieurs pays d’Afrique de l’Ouest depuis plusieurs années. Une analyse quantitative et qualitative de la représentation des crises alimentaires étudiées sera réalisée afin d’en extraire les éléments de causalité, d’identifier les spécificités associées à la langue ou à la zone géographique.

Partenaire INRAE

Département INRAEUnité INRAEExpertises
MATHNUMTETISApproches avancées d'exploration de données. Exploration de textes. Modèles séquentiels. Extraction d’informations.

Partenaire extérieur

PartenaireExpertises
CIRADSciences des données. Extraction et combinaison d’informations épidémiologiques à partir de sources informelles pour la veille des maladies infectieuses animales