shuf kazakh_latin_pairs.jsonl -o kazakh_latin_pairs.jsonl grep '\S' kazakh_latin_pairs.jsonl > clean_pairs.jsonl