Я пытаюсь найти решение для сжатия нескольких петабайт данных, которые у меня есть, которые будут храниться в AWS S3. Я думал об использовании сжатия gzip и задавался вопросом, может ли сжатие повредить данные. Я попытался выполнить поиск, но не смог найти конкретных случаев, когда сжатие gzip фактически искажало данные, так что их больше нельзя было восстановить.
Я не уверен, что это правильный форум для такого вопроса, но нужно ли мне проверять, правильно ли были сжаты данные? Кроме того, любые конкретные примеры/точки данных помогут.