Provate ora gratuitamente per 7 giorni!

 

Doblonatura universale

 

In queste funzioni, si possono definire a scelta le colonne da utilizzare per la doblonatura di duplicati e i criteri da applicarvi. Per ogni colonna è possibile definire se debba essere inclusa nel confronto oppure no.

Se si desidera confrontare un campo dati con un altro, è necessario inserire le seguenti informazioni:

  • Contenuto del campo: Tipo di contenuto del campo dati. La selezione fatta qui deve descrivere il contenuto del campo dati nel modo più preciso possibile, in modo che il programma possa gestire correttamente i dati durante il confronto. Per un campo dati che contiene un codice postale, è necessario selezionare anche "codice postale" come contenuto del campo.
  • Grado di identità: Valore di soglia per il fattore di identità in percentuale che deve almeno essere raggiunto per la coppia o il gruppo di colonne in questione. 
    Se più campi dati contengono lo stesso contenuto, possono essere combinati in un gruppo. Questo o combina i loro contenuti per il confronto o confronta ogni campo di dati in un gruppo singolarmente con ogni campo di dati nell'altro gruppo.

In opzione, è possibile definire un valore di soglia separato per il grado di identità calcolato per l'intero record di dati.

Inoltre, se necessario, è possibile utilizzare le seguenti opzioni:

  • Definizioni di deduplica multiple: In questo modo è possibile definire diversi criteri di confronto che vengono poi utilizzati uno dopo l'altro. Questi potrebbero essere, come per il deduplica all-in-one, ad esempio, il numero di telefono, l'indirizzo e-mail e l'indirizzo postale.
  • Ponderazione: Riducendo il peso dei campi dati meno importanti, questi campi dati esercitano influenza minore sul fattore di identità calcolato.
  • Salta record di dati se il campo dati è vuoto: Ciò consente di escludere dal confronto i record di dati incompleti.
  • Condizione che può non essere soddisfatta: In questo caso, al fine di trovare una corrispondenza, non deve essere raggiunto e non deve essere superato. Ad esempio, è possibile determinare record di dati nei quali corrisponde il nome, ma non il titolo personale. Oppure si potrebbe fare in modo che, nel confronto di due tabelle, non vengano confrontati due record di dati se il loro ID è identico.

Poiché il criterio di deduplica per questa funzione si può combinare liberamente, si possono concepire le più diverse applicazioni ed effettuare una deduplica ad esempio in base alla data di nascita, agli estremi bancari o al numero di carta di credito, ma si possono deduplicare anche tabelle contenenti valori diversi dai dati degli indirizzi, quali la definizione di un articolo, il titolo di un libro o un commento.

 

Doblonatura universale