Pulizia dei dati non correttamente formattati
In questo articolo ci occupiamo dell'analisi di alcune tecniche avanzate di pulizia e importazione dei dati per Power BI Desktop. Dopo aver dato forma ai dati nell'Editor di Query e averli portati in Power BI Desktop, è possibile esaminarli in diversi modi.
In Power BI Desktop sono disponibili diversi strumenti per verificare e correggere i dati non correttamente formattati.
Problemi comuni di formattazione
- Date in formato testo: "12/01/2024" importato come stringa
- Numeri con separatori errati: punto vs virgola
- Spazi nascosti: caratteri non visibili nelle stringhe
- Valori NULL e vuoti: gestiti in modo inconsistente
- Encoding dei caratteri: caratteri speciali corrotti
Strumenti di pulizia in Power Query
Rileva tipo dati
Power Query può rilevare automaticamente il tipo di dati di ogni colonna. Verifica sempre che il rilevamento sia corretto.
Sostituisci valori
Usa la funzione Sostituisci valori per correggere dati inconsistenti, come diversi modi di scrivere "Italia" (IT, Ita, ITALIA, Italia).
Rimuovi errori e null
Power Query offre opzioni per rimuovere righe con errori o valori null direttamente nella trasformazione.
Dividi colonne
Se una colonna contiene dati combinati (es. "Roma - RM"), usa Dividi colonna per separare le informazioni.
Validazione dopo la pulizia
- Controlla il profilo colonna per individuare anomalie
- Verifica la distribuzione dei valori per ogni campo
- Controlla i conteggi di righe prima e dopo la pulizia
- Testa le relazioni tra tabelle dopo la trasformazione
La pulizia dei dati è spesso la fase che richiede più tempo in un progetto di Business Intelligence, ma è anche quella che determina la qualità finale dell'analisi. Dati puliti producono insight affidabili.