Vai al contenuto

Testare e documentare i dati

Intro

Luca Gilli, CTO e founder di Clearbox.AI, ci fornisce suggerimenti su come rendere le nostre pipelines di dati piu' robuste tramite la scrittura di unit tests e documentazione, usando la libreria open-source great_expectations. Successivamente viene fatto un approfondimento su cosa voglia dire efficientare la creazione di test attraverso la profilazione del dato, condividendo l'esperienza acquisita durante lo sviluppo della libreria StructuredDataProfiling.

Materiale

📚 Meteriale della serata:

Github

📚 Repository great_expectations:

➡️ https://greatexpectations.io/

➡️ https://github.com/great-expectations/great_expectations

📚 Repository StructuredDataProfiling:

➡️ https://github.com/Clearbox-AI/StructuredDataProfiling

Video del meetup