Passer au contenu

IBM relie les bases de données dans l’anonymat

La société sort trois produits de réconciliation et d’analyse des identités. Ils corrèlent en toute confidentialité des données.

Léditeur n’a pas perdu de temps. En janvier dernier, il faisait l’acquisition de Systems Research & Development (SRD). Et vient de reprendre quasiment à l’identique les technologies développées par le
spécialiste de la réconciliation des identités (ou identity resolution). Au nombre de trois ?” Erik, Nora (Non-Obvious Relationship Awareness) et Anna (Anonymized
Data)
 ?”, ces solutions sont respectivement rebaptisées DB2 Identity Resolution, DB2 Relationship Resolution et DB2 Anonymous Resolution (DB2 AR), sur lequel IBM mise particulièrement.

Des données transformées en empreintes numériques

Véritable outil analytique, DB2 AR s’appuie sur les fonctions de data cleaning (ou nettoyage) et de qualification de données de DB2 Identity Resolution pour obtenir une vue à 360?’ d’un client. Il passe
ensuite la main à DB2 Relationship Resolution, qui va réconcilier, au sein d’une seule base, les données des identités réparties dans divers référentiels.L’objectif est de retrouver les correspondances entre des identités semblables mais redondantes, car saisies dans des champs différents dans les diverses bases. DB2 Relationship Resolution analyse ainsi les champs jusqu’à
trouver des recoupements. DB2 AR n’a plus ensuite qu’à repérer les liens entre les données. Il présente toutefois la particularité d’afficher ses résultats anonymement, sans dévoiler d’informations identifiant des
individus.Pour cela, le produit a recours à une fonction de hachage (hash en anglais) à sens unique pour maquiller les données originales des identités par le biais d’un chiffrement. Seules ces empreintes numériques
sont comparées. Et le résultat présenté ne renvoie pas directement à l’entrée dans le référentiel.Cependant, si les propriétaires des deux référentiels concernés ont donné leur accord, un pointeur peut dévoiler le texte en clair. Enfin, DB2 AR n’est pas lié qu’à DB2. Il peut fonctionner avec d’autres
sources de données, à la seule condition qu’elles soient structurées. C’est une limite significative, car une grande partie des données d’une entreprise sur ses clients n’est pas structurée.

Opérer des recoupements sans ouvrir d’accès aux bases de données

A l’origine, SRD destinait cette solution au recoupement de bases de données pour identifier les personnes fichées par les autorités. Ainsi, un hôtel américain travaillant avec les autorités fédérales pouvait utiliser Nora et
Anna pour les avertir de l’enregistrement d’un individu suspect.Désormais, l’hôtel n’ouvre plus ses bases de données, respectant ainsi la confidentialité et la vie privée de ses clients. En effet, Anna signale simplement une concordance entre les bases de données de l’hôtel et
celles des autorités, sans révéler nominativement l’identité concernée.IBM transpose cette fonction dans le monde de l’entreprise. Ainsi, deux sociétés qui fusionnent peuvent débuter un travail de rapprochement des clients qu’elles ont en commun, sans ouvrir d’accès à leurs bases de
données respectives. Ce qui serait illégal.Une institution financière peut aussi analyser des données dispersées dans ses référentiels sans établir de jonctions permanentes entre ses derniers, et sans construire de silo central. L’anonymat des corrélations de données
s’avère aussi particulièrement utile dans le monde de la santé.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Christophe Dupont Elise