При конвертации файлов jsonl.zst в формат parquet, очень сильно вырастает потребление RAM и SWAP. Программа завершается c помощью OOMKiller. Нагрука на CPU - незначительная
Размер исходного файла от 5 до 8Gb
Интересно, что в коде я не увидел явной поддержки zst, может какие-то нюансы у формата..
undatum convert --format-in jsonl ~/records0.jsonl.zst test.parquet
OS: Linux 6.10.13 (x86_64)
RAM: 32Gb DDR5
Storage: SSD NVMe
CPU: AMD Ryzen 7 7700 8-Core