V prostředí otevřených dat označuje datová sada skupinu záznamů, které se týkají stejného tématu, například seznam škol nebo dopravních uzlů. Každá datová sada má mít popis, který vysvětluje její obsah, strukturu, periodicitu aktualizace a kontaktní místo. Ve veřejné správě může jít jak o datové sady publikované jako open data, tak o interní datové sady pro analytiku a řízení. Jasná definice datových sad usnadňuje jejich katalogizaci, opakované použití a sdílení mezi systémy. Důležitá je konzistence formátů a kódování, aby se s daty dalo pracovat automatizovaně. Správce datové sady odpovídá za její úplnost, včasnou aktualizaci a dodržení licenčních podmínek. Při návrhu nových služeb je dobré myslet na to, zda mohou vzniknout nové datové sady, které bude užitečné sdílet. V praxi pomáhá používat datové katalogy, které uživatelům usnadní datové sady vyhledat a pochopit.