Čistenie údajov je proces zisťovania a opravy (alebo odstránenia) nepresných záznamov zo sady záznamov, tabuľky alebo databázy a týka sa identifikácie neúplných, nesprávnych, nepresných alebo irelevantných častí údajov a následného nahradenia, úpravy, alebo vymazanie špinavých alebo hrubých údajov. Ukážeme ti ako sa môže vykonávať čistenie údajov interaktívne s nástrojmi na úpravu údajov alebo ako dávkové spracovanie pomocou skriptovania. Po vyčistení by sada údajov mala byť konzistentná s ostatnými podobnými súbormi údajov v systéme. Čistenie údajov sa líši od validácie údajov v tom, že validácia takmer vždy znamená, že dáta sú zo systému odmietnuté pri vstupe a vykonávajú sa skôr pri vstupe ako pri dávkach údajov. Niektoré riešenia na čistenie údajov vyčistia údaje krížovou kontrolou s overeným súborom údajov.
Zdieľaj kurz a získaj zľavu
v hodnote 5 €
Integrita dát
Konzistentnosť údajov
Transformácie údajov
Štruktúry súborov (TXT, CSV, XML, XLSX, JSON, YAML, TAR)
Databázové Engines (MySQL, Microsoft Access, PostgreSQL)
Business Intelligence (Microsft Excel, Microsoft Power BI, Tableau)
Data Science (Python, Pandas, Matplotlib, Numpy)
Dátové Typy
Kolekcie a Dátové Štruktúry
Eliminovanie a potlačovanie duplicít
Práca s null stavmi/hodnotami
Importy dát
Dummy a testovacie dáta
Validácia a Overovanie Hodnôt
Filtrovanie a Masky
Vykresľovanie nečistôt
Programovacie Jazyky a Technológie
Dostupnosť
Bezpečnosť
Ľudia
V cene kurzu sú zahrnuté učebné elektronické materiály, elektronická príručka spolu s certifikátom a drobným občerstvením.
Možnosti platby:
Pri denných, večerných aj víkendových kurzoch sú 2 prestávky po 10-15 minút.
Kurzy sa realizujú na kvalitných notebookoch značiek Asus, Lenovo a HP.
spokojných klientov
odučených hodín
skúsených lektorov
prezenčných kurzov
online kurzov