Bolji od Google Translatea: Isprobali smo novi online prevoditelj i pričali s profesorom koji ga je razvio
Kako bi izvjestiteljima s hrvatskog predsjedanja Vijećem Europske unije olakšali posao, tim prof. dr. sc. Marka Tadića i njegov tim sa zagrebačkog Filozofskog fakulteta razvio je novi sustav za strojno prevođenje. Baziran na neuronskim mrežama, njihov online prevoditelj postiže bolje rezultate i od Google Translatea. Da bi to uspjeli, priča nam Tadić, morali su sakupiti gotovo pola milijuna rečeničnih parova na hrvatskom i engleskom jeziku.
– Uspješnost nekog online prevoditelja mjeri BLEU scores. Sustav kojeg smo razvili ima šest BLEU bodova više od Google Translatea, priča nam prof. dr. sc. Marko Tadić.
Istraživački tim Filozofskog fakulteta Sveučilišta u Zagrebu, predvođen profesorom Tadićem, razvio je novi online sutav prevođenja. EU Council Presidency Translator dostupan je svima, a prvenstveno je namijenjen stranim izvjestiteljima s hrvatskog predsjedanja Vijem Europske unije.
Međunarodno partnerstvo
Projekt ‘Prevoditelj za predsjedanje Vijećem Europske unije’, u sklopu kojeg je razvijen prevoditelj, poduprla je Europska komisija kroz program Instrument za povezivanje Europe (Connecting Europe Facility, CEF). Sustav za prevođenje nastao je u partnerstvu s Rumunjskom akademijom, Uredom finskoga premijera te latvijske jezičnotehnološke tvrtke Tilde.
– Tvrtka Tilde koordinatorica je projekta. Razvili su sustav za prevođenje koji nadograđuju s jezikom zemlje koja predsjeda Unijom. Prvo je to bila Rumunjska, pa Finska, a sad smo mi došli na red, kaže Tadić.
Još ranije, na sustavu su radili Austrija, Bugarska i Estonija. Kako je prof. Tadić i ranije surađivao s Tildeom, pozvali su upravo Filozofski fakultet kao partnera za nadogradnju prijevoda na hrvatski jezik i s hrvatskog jezika.
Razumije kontekst
EU Council Presidency Translator radi na principu neuronskih mreža zbog čega je jako učinkovit. Zbog korištenja umjetne inteligencije za razumijevanje konteksta, neuronski su sustavi puno učinkovitiji od statističkih koji se ne obaziru na kontekst, već nude najčešće značenje nekog pojma.
– Neuronski sustavi u obzir uzimaju kompletne rečenice, čak i njihov odnos s drugim rečenicama, dok statistički to ne mogu. Primjerice, ako imate rečenice ‘Vidio sam jučer crnog konja. On je preskočio ogradu’, neuronski sustav će razumjeti da se zamjenica ‘on’ odnosi na konja, dok statistički neće, pojašnjava profesor.
A da bi sustav radio, potrebno ga je trenirati.
– Finci su stavili prijevode dokumenata Europske unije, no pravni jezik, kakav se koristi u zakonodavnim aktima, je, kaže se, najgori dio svakog jezika, jer se jako razlikuje od govornoga. Zato smo skupili nešto manje od pola milijuna rečeničkih parova, hrvatskih rečenica i njihovih prijevoda na engleski jezik, ističe Tadić.
Specijaliziran za vijesti i politiku
Naglašava kako je glavna kvaliteta neuronskih sustava što prepoznaju domenu, odnosno tematsko područje teksta koji prevode.
– Na području vojske engleska riječ captain znači satnik. No ako prevodite tekst s područja sporta, onda ne želite takav prijevod. Na primjer, sportski novinari ne žele prijevod satnik Domagoj Duvnjak, objašnjava Tadić na primjeru.
Budući da je sustav prvenstveno namijenjen praćenju predsjedanja Vijećem EU, tematski su ga bazirali na novinske vijesti te unutarnju i vanjsku politiku (no, bez obzira na to, dobro prevodi Duvnjakovu titulu).
Isprobali smo kako radi
Odlučili smo ga i isprobati. Za test smo odabrali engleski tekst sa stranica hrvatskog predsjedanja: The European Union will be smaller in numbers, but remains strong and unified as ever. Croatia highly appreciates the hitherto tireless work of EU Chief Negotiator Michel Barnier and his team. They have our full support and confidence in the forthcoming negotiations about the future relationship with the United Kingdom, as well.
Google Translate preveo ga je ovako: Europska unija bit će manja u broju, ali ostaje snažna i jedinstvena kao i uvijek. Hrvatska visoko cijeni dosad neumorni rad glavnog pregovarača EU Michela Barniera i njegovog tima. Imaju našu punu podršku i povjerenje u predstojećim pregovorima o budućim odnosima s Ujedinjenim Kraljevstvom.
EU Council Presidency Translator zaista je ponudio bolji prijevod: Europska unija bit će brojčano manja, ali ostaje jaka i jedinstvena kao i uvijek. Hrvatska visoko cijeni dosadašnji neumorni rad glavnog pregovarača EU Michela Barniera i njegove ekipe. Oni imaju našu punu podršku i povjerenje u predstojeće pregovore o budućem odnosu s Ujedinjenom Kraljevinom.
Voditelj projekta, zadovoljan učinjenim, ističe da se i u Hrvatskoj možemo pohvaliti kako, zahvaljujući vlastitoj pameti, upotrebljavamo umjetnu inteligenciju kako bismo mogli raspoznati značenje, ali i očuvati hrvatski jezik.
– I mi imamo svog konja za trku na području jezičkih tehnologija, zaključio je Tadić.
________________________________________________________________________________________________
Ovaj materijal nastao je uz financijsku podršku Europske unije u okviru projekta “Towards an open, fair and sustainable Europe in the world – EU Presidency Project 2019 – 2021”. Za sadržaj je isključivo odgovorna redakcija portala srednja.hr i ne može se smatrati službenim stavom Europske unije.