Google Translate supera (a metà) l’esame di dialetto veneto Test superato solo a metà tra errori e falle

Putela e buteleta: per Google Translate i termini del dialetto veneto utilizzati per indicare la parola ragazza significano rispettivamente avvolgere e burro. Va un po’ meglio con la traduzione di fiola, diffuso nel Veneziano, che però viene tradotto solo come figlia senza l’accezione più ampia di ragazza.

Quest’ultimo termine dall’italiano al veneto è tradotto solo come tosa, vocabolo utilizzato prevalentemente nel Padovano, mentre in altre parti del territorio regionale sono diffuse altre forme come il bellunese mula, tradotto però dall’applicativo Google con viola. 

Google Translate alla prova del dialetto veneto

L’aggiornamento di Google Translate – con l’inserimento del dialetto veneto, friulano, lombardo, ligure, siciliano – è dei giorni scorsi, ma i primi test effettuati dal team di AlpiLinK, macroprogetto per la mappatura digitale dei dialetti del Nord Italia che vede come capofila l’Università di Verona, non restituiscono un risultato confortante.

La traduzione si basa sull’intelligenza artificiale e sul modello linguistico conversazionale PaLM2 lanciato da Google, ma al momento le performance per quanto riguarda la traduzione dei dialetti non sono paragonabili a quelle delle altre lingue.

I risultati dell’analisi realizzata dal team di ricerca sono stati raccolti in un report. Se i test con singole parole evidenziano dei problemi, non va meglio – con qualche eccezione – nella traduzione di frasi: tu dormi più di lui restituita da Google –  ti te dormi più de lu – corrisponde al parlato di diverse aree del veneziano e del padovano, ma già spostandosi in altri territori delle stesse o di altre province del Veneto la traduzione sarebbe diversa, spaziando da ti te dormi piassè de lu a Bonavigo (Verona) a ti te dormi (de) pi de elo a Chioggia (Venezia), solo per fare alcuni esempi.

I primi test e i risultati

“I casi che abbiamo raccolto mostrano come la recente introduzione di alcuni dialetti italiani nell’aggiornamento di Google Translate – spiega Stefan Rabanus, docente di linguistica tedesca all’ateneo di Verona e coordinatore scientifico di AlpiLinK -, pur rappresentando di per sé una buona notizia perché riconosce il valore dei dialetti e delle lingue minoritarie, sia soggetta a molti limiti.

A differenza delle lingue nazionali, denominazioni come “veneto” non fanno riferimento ad una lingua unitaria ma ad una molteplicità di dialetti diversi presenti nello stesso territorio e questo rende ancor più vulnerabile il traduttore, che necessiterebbe di un corpus molto più ampio e diversificato e la possibilità di specificare il tipo di “veneto” per non incorrere in falle ed errori”.

Il riconoscimento vocale

Un altro limite è rappresentato dal fatto che, mentre per l’italiano Translate consente anche il riconoscimento vocale, nel caso del dialetto non è possibile ascoltare audio. Proprio sulla raccolta di contributi audio è basato invece il progetto AlpiLinK.

Tutte le persone che parlano un dialetto possono partecipare direttamente alla ricerca attraverso il sito di AlpiLinK, compilando in poco tempo l’audio-sondaggio dedicato in cui viene proposto all’utente di utilizzare il proprio dialetto o la propria lingua locale per descrivere cosa accade in una scena o per tradurre le parole o frasi indicate, tra cui il sopra citato tu dormi più di lui. Un modello di ricerca partecipativa, che punta sul coinvolgimento “dal basso” e che sta raccogliendo un notevole interesse.