Pergunta de entrevista da empresa Annalect

how do you dedup petabytes of tabular data?