Script Python d’identification de famille

Cet article présente un script qui a été utilisé pour identifier des familles à partir d’une base de donnée incluant le nom de 6116 victimes de la Shoah en Italie ainsi que, pour la plupart, le nom de leur mère, de leur père et de leur époux ou épouse.

Pour chaque combinaison possible entre deux de ces individus, le script compare les noms de leurs pères, mères, et époux ou épouses, et assigne un identifiant familial aux individus qui partagent les mêmes parents (frères et sœurs), sont mariés l’un à l’autre (mari et femme), ou pour lesquels le mari ou la femme d’un de leurs parents correspond à leur second parent (parent et enfants). dans chacun de ces cas, si l’un des deux individus à déjà un identifiant familial, ce même identifiant est attribué à l’autre individu. Dans le cas d’une correspondance partielle, par exemple si l’épouse d’un individu à un nom différent du nom de l’épouse de son époux (qui devrait être elle-même), ou si un nom est manquant, le script retourne l’incohérence dans le fichiers de log comme erreur possible. Le script créé également un tableau des relations entre tout les individus de la base de donnée.

Le script est écrit en langage python et a été conçu pour être utilisé avec le logiciel ESRI ArcCatalog. Cependant, une utilisation en dehors de ESRI ArcCatalog est possible simplement en modifiant les premières lignes de codes.

Ce script est basé sur le travail de Ryan Schuerman, actuellement doctorant à Texas State University, que je tiens à remercier pour m’avoir fourni la première version de ce code.

Laisser un commentaire