Progetto di predisposizione dei dati necessari ad addestrare il modello Transformer per la traduzione da Dantesco a Italiano.
Gli script prendono in input i dati scaricati tramite il progetto Data_Scraping, ne effettua una pulizia.
Per avere più dati a disposizione tutti i dati scaricati in altre lingue diverse dall'italiano (Inglese, Tedesco e Francese) sono stati tradotti tramite le pipeline messe a disposizione de HuggingFace