Nwlapcug.com


Strumenti di ETL: Tecniche di Query

Strumenti di ETL: Tecniche di Query


Estrarre, trasformare e caricamento (ETL) strumenti estrarre dati da un'origine esterna, trasformarlo o modificarlo e quindi caricarla in un repository o database di destinazione. Strumenti di ETL interrogare i database per le informazioni estratte, trasformate e presentazione o caricati nel database di destinazione. Tecniche di query ETL possono essere basati su metadati, dati i parametri e le query utente. ETL query eseguite su richiesta o su base periodica. Multi-livello query in strumenti di ETL possono essere eseguite con motori di elaborazione analitica online (OLAP).

Metadati

Informazioni sui metadati vengono descritte le informazioni all'interno di una cella o file allegato memorizzato nel database. Query utente possono essere basate su specifici termini di ricerca o nomi di file. Strumenti di ETL possono eseguire una query informazioni cercando termini all'interno dei metadati dell'utilizzatore. Ricerca in un database per un numero specifico di disegno o documento creatori è una query di metadati. Strumenti di ETL utilizzati per il mapping dei dati cercare valori nelle celle con un nome specifico o un riferimento e copiarli nelle celle di destinazione con il nome mappato o riferimento.

Ad Hoc



Ad hoc mezzi specializzati o unici.


Report ad hoc sono personalizzati e su misura per il singolo utente. Report ad hoc possono essere strette sottoinsiemi di report esistenti o basata su rapporti esistenti con parametri aggiuntivi. Report ad hoc possono anche essere creati da zero. Gli utenti eseguire report ad hoc quando necessario.

Aggiornamenti periodici

Estrarre dati da un database e convertirlo nel formato per uso in un altro database comporta l'utilizzo di strumenti ETL in aggiornamenti periodici dei dati tra i sistemi. Aggiornamenti periodici si verificano a intervalli specifici, ad esempio giornaliera o settimanale. Personale dell'help desk possono avere la possibilità di attivare manualmente un aggiornamento periodico dopo interruzione del sistema di comunicazione o computer. Gamma di partizionamento si divide dati basati sulla sua data. Partizionamento per intervalli viene utilizzato per estrarre i record per un determinato periodo di tempo. Dati di fuori delle partizioni di gamma non viene eseguita una query. Aggiornamenti periodici si basano su partizionamento per intervalli con la data dell'ultimo aggiornamento impostando il limite della partizione.

Misure di qualità

Misure di qualità per le query di ETL quantificano quanto bene tecniche di query ETL eseguono la ricerca di dati e la conversione. Qualità dei dati può essere definita per il numero totale di errori generati dalla query. Qualità dei dati può essere calcolata in base la precisione di un pull di dati basato su casi di test pre-definiti. Strumenti di monitoraggio query ETL traccia il tempo necessario per generare i risultati per una query. Il recupero di dati medio tempo o tempo di risposta di query può essere utilizzato per monitorare le prestazioni e la qualità delle query del database. Tecniche di query che generano tassi di errore elevati o richiedono più tempo rispetto alla media possono essere considerati peggio di quelli che vengono eseguiti rapidamente e senza intoppi.