Corsi on-line

Trovare velocemente record duplicati in MySQL

La ridondanza non ha sempre effetti negativi in informatica, in alcuni casi infatti essa viene utilizzata per aumentare l’affidabilità di un’applicazione tramite l’esecuzione di processi in parallelo, ma quando si parla di DBMS i record duplicati possono essere anche un problema, soprattutto quando ci si trova a gestire dei database di grandi dimensioni.

Non è necessario farsi prendere dal panico davanti a fenomeni di ridondanza, pochi record duplicati non sono in grado di influire negativamente sulle prestazioni generali di un Database Manager; per avere un’immagine corretta della presenza di dati duplicati in una tabella è possibile utilizzare una semplice interrogazione, come nell’esempio seguente:

SELECT email, count(email) AS totale
FROM newsletter
GROUP BY email
HAVING totale > 1
ORDER BY totale;

HAVING è una clausola che viene applicata sui record della tabella risultante da una query GROUP BY, nel caso specifico la clausola permette di visualizzare i record per i quali il conteggio delle ricorrenze è superiore ad “1” e quindi corrispondente ad un record duplicato.

Post correlati
I più letti del mese
Tematiche