DeepL ako hrozba či pomoc?

O najnovšom vývoji strojových prekladačov sme hovorili s odborníkom na umelú inteligenciu Martinom Takáčom.

Na akom princípe funguje strojový prekladač DeepL?

Pracuje na báze takzvaných umelých neurónových sietí, ktoré sú inšpirované ľudským mozgom. Ten sa skladá zo sto miliárd neurónov a informácia sa medzi nimi šíri cez spojenia, ktoré sú tvárne, plastické, a menia sa pri zapamätávaní si nových vecí. Umelá neurónová sieť je obrovská matematická funkcia s miliardami parametrov, ktoré sa menia počas učenia. Sieť sa učí nové veci počas takzvaného trénovania, kde sa jej predkladajú vzory toho, čo sa má naučiť. Pri preklade sú to  páry viet, takže pri tréningu jej predložím napríklad slovenskú vetu, sieť vypočíta jej preklad, ten sa porovná so vzorovým, napríklad anglickým, prekladom a parametre siete sa upravia tak, aby v budúcnosti dali výsledok bližší tomu želanému vzorovému prekladu. A to sa robí milióny krát s rôznymi vetami. Na rovnakom princípe fungujú aj ďalšie prekladače, napr. Google Translate, avšak DeepL, ktorý v súčasnosti dokáže prekladať medzi 31 jazykmi, býva v slepých textoch hodnotený až trikrát lepšie, čo sa týka presnosti, prirodzenosti a celkovej kvality prekladu. Detaily, prečo je lepší, nevieme, pretože algoritmy učenia sú obchodným tajomstvom, ale časť jeho úspechu je v tom, že má veľmi kvalitný paralelný korpus. Čerpá z textov, ktoré sú viacjazyčné, či už patenty, dokumenty EU a podobne. V takýchto korpusoch identifikuje vety, ktoré si navzájom zodpovedajú a potom má iný algoritmus, ktorý hodnotí kvalitu prekladu a je natrénovaný na základe hodnotení ľudských expertov v preklade.

 

Je preklad totožného textu zakaždým rovnaký?

 Je. Je to preto, že keď sa takýto veľký model natrénuje, parametre sa zafixujú a ďalej sa nemenia, pokiaľ tam nevstupuje nejaký náhodný faktor, tak výsledok je vždy rovnaký. To však ale zároveň znamená, že pokiaľ autori budú takúto sieť dotrénovávať na nových dátach a budú svoj algoritmus zlepšovať, tak preklad toho textu už v budúcnosti rovnaký byť nemusí. Takisto aj užívateľ môže do procesu prekladu zasahovať tým, že dodá svoj slovník termínov a DeepL ho bude rešpektovať a podľa neho konzistentne prekladať. Dočítal som sa, že je možné aj zvoliť si medzi formálnym a menej formálnym módom prekladu.

 

Je teda možné overiť autorstvo prekladu?

Áno, jednoduchým porovnaním zhody. Vo vedeckej komunite sa používajú rôzne testy na plagiátorstvo a aj tu, ak máte preklad, o ktorom neviete, či ho urobil človek alebo stroj, porovnáte ho s prekladom urobeným pomocou DeepL a zistíte percentuálnu zhodu.

 

Hovorí sa o hrozbe, že prekladatelia prídu v súvislosti s umelou inteligenciou o prácu ako prví a stanú sa z nich editori strojových prekladov...

Strojové preklady sa ešte v súčasnosti nevyrovnajú ľudským prekladom, ale stále sa zlepšujú, takže je reálne, že jedného dňa dosiahnu porovnateľnú kvalitu. To však nemusí znamenať, že prekladatelia prídu o prácu, len sa povaha ich práce zmení. Budú používať strojové prekladače ako nástroje, tak ako dnes možno používajú nástroje na gramatické opravy. Ich práca bude spočívať v editovaní a cizelovaní prvotného prekladu, dodávaní osobitého štýlu a podobne. Sám som si to vyskúšal pri mojej knihe, ktorej anglický preklad chystám. Najprv som sa strojovému prekladu veľmi bránil, ale keď som si skúsil preklad malého úryvku, bol som prekvapený prirodzenosťou viet vygenerovaných DeepLom. Bolo tam však dosť nepresností, takže si to vyžadovalo ďalšiu precíznu prácu editorky najmä čo sa týkalo správnosti prekladu niektorých technických záležitostí. Ale bolo to rýchlejšie, ako manuálny preklad od nuly. Experimentoval som aj so spätným prekladom. Vzal som kus svojho slovenského textu, dal ho preložiť do angličtiny a späť a prekvapilo ma, že na mnohých miestach sa mi spätný preklad páčil viac ako originál, bol jednoduchší a plynulejší.

Myslím, že DeepL nemusí byť nutne hrozba, prekladateľom zvýši pohodlie práce a ich produktivitu, čo im umožní znížiť cenu a zvýšiť svoju dostupnosť. Dopyt po prekladoch stále bude, takže otázka by nemala byť formulovaná tak, že ľudský verzus strojový preklad, ale čo dokážu ľudskí prekladatelia s pomocou výpočtových nástrojov.

 

Zmení sa DeepL v budúcnosti natoľko, že bude schopný v texte rozoznávať citové zafarbenie a metafory?

DeepL je už teraz veľmi dobrý v preklade idiómov a metafor. Nerobí iba doslovný preklad. Ak je však niekde miesto pre autorskú originalitu prekladateľov, tak je to pri preklade umeleckých textov, alebo textov, ktoré by mali mať istý osobitý štýl. Aj toto sa však v budúcnosti môže zmeniť. Existuje nástroj umelej inteligencie na generovanie obrázkov, ktorému môžete zadať želaný obsah, teda napríklad krajinu s koňmi, ale nech je to napríklad v štýle Dalího. Pokiaľ by boli umelé neurónové siete trénované na textoch určitých štýlov alebo autorov, bude možné zadať, aby prekladač preložil text v štýle napríklad Borgesa, alebo Kerouaca.

 

doc. RNDr. Martin Takáč, PhD.
Pôsobí v  Centre pre kognitívnu vedu Katedry aplikovanej informatiky FMFI UK. Je autorom knihy Myseľ ako objekt. Kde hľadať pevný bod v meniacom sa svete? (Absynt, 2020)