Cos'è la traduzione automatica?

La traduzione automatica (TA) è una traduzione automatizzata, ovvero il processo che utilizza un software per tradurre un testo da una lingua naturale (ad es. inglese) a un'altra (ad es. italiano).

Per elaborare qualunque traduzione, umana o automatica, è necessario che il significato di un testo in lingua originale (di partenza) sia restituito integralmente nella lingua di arrivo, cioè la traduzione. Anche se a prima vista sembra essere elementare, si tratta di una questione molto più complessa. La traduzione non è la mera sostituzione di una parola con un'altra. Un traduttore deve interpretare e analizzare tutti gli elementi in un testo e sapere quale parola può influenzarne un'altra. Ciò richiede un'estesa competenza in grammatica, sintassi (struttura delle frasi), semantica (significati) e così via in entrambe le lingue, quella di partenza e quella di arrivo, oltre che una familiarità con le corrispondenti aree geografiche locali.

La traduzione umana e automatica presentano entrambe delle sfide. Ad esempio, due singoli traduttori non produrranno mai traduzioni identiche di uno stesso testo nella stessa combinazione linguistica e possono essere necessarie varie fasi di revisione per soddisfare un cliente. Ma la sfida maggiore è rappresentata dal modo in cui una traduzione automatica può produrre testi di qualità pubblicabile.

Tecnologia di traduzione automatica basata su regole

La traduzione automatica basata su regole fa affidamento su un numero quasi infinito di regole linguistiche incorporate e su milioni di dizionari bilingue per ogni combinazione linguistica.

Il software analizza la sintassi del testo e crea una rappresentazione temporanea da cui viene generato il testo nella lingua di arrivo. Questo processo richiede lessici estesi con informazioni di tipo morfologico, sintattico e semantico, nonché un gruppo di regole molto vasto. Il software utilizza questi gruppi complessi di regole e successivamente trasferisce la struttura grammaticale della lingua di partenza alla lingua di arrivo.

Le traduzioni vengono create in base a dizionari di proporzioni gigantesche e sofisticate regole linguistiche. Gli utenti possono migliorare la traduzione predefinita aggiungendo la propria terminologia al processo di traduzione. A tale scopo, creano e definiscono dei dizionari personalizzati, che hanno la precedenza sulle impostazioni predefinite del sistema.

Nella maggior parte dei casi, sono previste due fasi: un investimento iniziale che aumenta significativamente la qualità a un costo limitato e un investimento continuativo per migliorare in modo incrementale la qualità. Anche se la traduzione automatica basata su regole consente alle aziende di raggiungere e superare la soglia di qualità desiderata, il processo di miglioramento della qualità può essere lungo e costoso.

Tecnologia di traduzione automatica statistica

La traduzione automatica di tipo statistico utilizza modelli di traduzione statistica i cui parametri derivano dall'analisi di corpora monolingue o bilingue. La creazione dei modelli di traduzione statistica è un processo rapido, ma la tecnologia fa affidamento in modo significativo su corpora multilingue preesistenti. È richiesto un minimo di 2 milioni di parole per un settore specifico, o anche di più per un argomento generico. In teoria, in tal modo è possibile raggiungere la soglia di qualità ma la maggior parte delle aziende non è provvista di corpora multilingue sufficientemente estesi per creare i modelli di traduzione necessari. Inoltre, la traduzione automatica statistica sottopone la CPU a un grosso carico di elaborazione e richiede una configurazione hardware avanzata per eseguire i modelli di traduzione con livelli di prestazione medi.

Confronto tra traduzione automatica basata su regole e statistica

La traduzione automatica basata su regole fornisce una buona qualità nelle situazioni generiche (ovvero non specifiche di un settore) ed è per natura prevedibile. La personalizzazione basata su dizionari garantisce un miglioramento della qualità e della conformità alla terminologia aziendale. Tuttavia, alla traduzione risultante potrebbe mancare la fluidità attesa dai lettori. In termini di investimento, il ciclo di personalizzazione necessario per raggiungere la soglia di qualità può risultare lungo e costoso. Le prestazioni sono però elevate anche con l'hardware standard.

La traduzione automatica statistica fornisce una buona qualità solo se sono disponibili corpora estesi e qualificati. La traduzione è fluida, nel senso che è di facile lettura e pertanto soddisfa le aspettative degli utenti. Tuttavia, la traduzione non è né prevedibile né coerente. L'addestramento a partire da corpora di buona qualità è automatico e poco costoso. Tuttavia, un addestramento su corpora linguistici generici, con significati diversi da quelli del settore specifico, non è sufficiente. Inoltre, la traduzione automatica statistica richiede molte risorse hardware per poter creare e gestire modelli di traduzione di grandi dimensioni.

Traduzione automatica basata su regole Traduzione automatica statistica
+ Qualità coerente e prevedibile – Unpredictable translation quality
+ Traduzione di qualità anche al di fuori dei settori – Poor out-of-domain quality
+ Riconoscimento delle regole grammaticali – Does not know grammar
   
+ Prestazioni elevate e solidità – High CPU and disk space requirements
+ Coerenza tra le versioni – Inconsistency between versions
   
– Lack of fluency + Buona fluidità
– Hard to handle exceptions to rules + Buona capacità di individuare le eccezioni alle regole
   
– High development and customization costs + Costi di sviluppo ridotti in presenza del corpus richiesto

Dati i requisiti complessivi, emerge chiaramente l'esigenza di un terzo approccio attraverso il quale gli utenti ottengano una migliore qualità di traduzione e prestazioni elevate (come accade con la traduzione automatica basata su regole) con un investimento più ridotto (come accade con la traduzione automatica statistica).

*Campi obbligatori

We respect your privacy, and will use this information only for contact purposes.