Appariements

Le traitement des images par des modèles de reconnaissance d’écriture va contribuer à construire un ensemble de données individuelles structurées par commune et par année de recensement : des millions de lignes, chacune contenant les nom et prénom d’un individu (et certaines de ses caractéristiques). Bien entendu, beaucoup de ces lignes correspondent à une même personne, observée dans plusieurs recensements différents.

Notre objectif est de relier les lignes qui correspondent à une même personne, pour suivre les individus au cours de leur vie, de recensement en recensement. Pour cela, compte-tenu de la masse de données à traiter, nous allons mettre en place des méthodes automatiques d’appariement entre les recensements.