Unicite des donnees

Bonjour, j’ai besoin de votre aide SVP.
je cherche une macro qui peut me permettre de regrouper des noms qui sont dans ma base et qui se ressemblent.
En effet il y a des noms de personnes qui se répètent plusieurs fois dans la base mais qui ont parfois été écrits avec des erreurs d’orthographe
j’ai 300 000 lignes dans mon fichier et l’objectif et d’arriver à identifier les individus de manière unique à partir du nom et de la date de naissance.

Bonjour
image

Bonjour,

Je pense que le plus simple est la méthode manuelle.
Déjà il faut le nom, la date de naissance et le prénom pour distinguer les jumeaux
Utiliser des tris pour détecter visuellement les erreurs ;

  • date de naissance, Nom, prénom
  • date de naissance, prénom, Nom
  • Nom, prénom, date de naissance
  • prénom, Nom, date de naissance

C’est relativement rapide

Merci patrice, mais je parle de plus de 300 000 lignes c’est donc presqu’impossible de détecter visuellement toutes les erreurs.

Pour une détection automatique, c’est aussi impossible.
Il est quasiment impossible de définir mathématiquement «qui se ressemblent» et «erreurs d’orthographe» sur des noms propres, sans compter les permutations du type PIERRE Martin au lieu de MARTIN Pierre

Ce sujet a été automatiquement fermé après 30 jours. Aucune réponse n’est permise dorénavant.