Otkrivamo deset pravopisnih grešaka koje su Hrvati najčešće pravili tijekom 2017. u 4,5 milijuna tekstova obrađenih u Haschecku

U srpnju prošle godine Hrvatski akademski spellchecker (Hascheck) dobio je novi izgled i ime. Svoje pravopisne pogreške od tada možete provjeravati na domeni – Ispravi.me, a mnogi akademci, novinari, studenti i učenici, to čine svakodnevno. Tako je u 11 mjeseci (prosinac nije gotov pa dakako nisu ni kompletirani podaci) 2017. godine obrađeno 4,5 milijuna tekstova. U čemu se najviše griješilo, doznajte u potonjim pregledima, koje je temeljito pripremio tvorac Haschecka i dugogodišnji profesor na FER-u Šandor Dembitz.

Kao neke načelne zaključke iz pregleda možemo zaključiti da Hrvati u pravopisu imaju probleme s razdvajanjem negacije od glagola, miješanjem hrvatskog sa srodnim jezicima (srpski, bošnjački), ali i da često upravo aplikaciji Ispravi.me, prepuštaju ‘stavljanje’ kvačica, što sugerira lijenost i/ili neznanje.

Sustav Ispravi.me u 2017. uštedio najmanje deset milijuna (ne miliona) minuta vremena korisnicima

Hascheck pokazao: Akademci su puno šlampaviji u pisanju od novinara

– U 2017. je dosad obrađeno 4,5 milijuna tekstova koji tvore korpus od preko 1,2 milijarde pojavnica, čemu je ekvivalent 5 milijuna autorskih kartica teksta. Za pročitati jednu autorsku karticu čovjeku treba najmanje 2 minute, pa je lako izračunati koliku smo uštedu čitanja napravili svojim korisnicima, navodi u uvodnom objašnjenju profesor Dembitz.

Većina tekstova koji su obrađivani zaprimljena je iz Hrvatske, no provjeru tekstova su vršili i korisnici iz još 122 zemlje.

– Obrade su zaprimljene iz 123 vršne IP-domene (zemlje), pri čemu je 86,8% prometa generirano iz Hrvatske, a 7,1% iz BiH. Uslugu je koristilo 236.000 individualnih korisnika (cookieja), ističe podatke Šandor Dembitz.

Na kraju je prijavljeno 20 milijuna zatipkovno-pravopisnih grešaka (1,6% obrađenoga korpusa), od kojih su najučestalije:

1. šta -> što 143.699 puta;

2. ko -> tko 64.381 puta;

3. jos -> još 17.682 puta;

4. slijedeći -> sljedeći 17.356 puta;

5. nebi -> ne bi 16.649 puta;

6. slijedeće -> sljedeće 16.252 puta;

7. preduzeće -> poduzeće 15.048 puta;

8. cu -> ću 14.438 puta;

9. vec -> već 14.426 puta;

10. miliona -> milijuna 13.631 puta.

Kontekstualnih pogrešaka 2,5 milijuna, a stilskih 375.000

Zagrebački FER izvozi znanje: Za pravopisnu aplikaciju oštro 'zagrizli' Francuzi

Ono što je dodatna snaga sustava Ispravi.me, odnosno pogonskog mehanizma Hašek, koji u pozadini obrađuje tekst je i mogućnost ispravljanja kontekstualnih te stilskih (pleonastičkih) pogrešaka.

Tako je u prvih 11 mjeseci 2017., kontekstualni provjernik prijavio 2,5 milijuna gramatičkih pogrešaka, od kojih su najučestalije:

1. na taj način -> tako 84.281 puta;

2. s obzirom da -> s obzirom na to da 75.717 puta;

3. ukoliko se -> ako se 41.459 puta;

4. biti će -> bit će 31.581 puta;

5. iz razloga što -> zato što 18.305 puta;

Kada je riječ o stilskim (pleonastičkim) greškama, Ispravi.me ih je ubilježio 375.000, a najučestalije su bile:

1. zajedno(skupa) s(sa) 105.565 puta;

2. biti u mogućnosti u različitim oblicima, premda je jednostavnije koristiti „moći“ u odgovarajućem obliku, 44.643 puta;

3. sastavni dio u različitim oblicima 35.410 puta;

4. vremenski period (vremensko razdoblje) u različitim oblicima 26.891 puta;

5. čitav niz u različitim oblicima 6.700 puta;

Profesor Dembitz je za kraj dao još nekoliko statističkih podataka i završnih napomena pa tko smo mi da mu ih uskratimo.

– Za napraviti sve ovo poslužitelj je odradio preko 3.300 sati računanja. Ljudska radna godina po europskim standardima broji 1.720 radnih sati (naš se rad ionako ne računa). 2017. je karakteristična po tome da smo nadživjeli svoga pokrovitelja (Agrokor), a dokle ćemo moći, to će vrijeme pokazati, zaključuje Šandor Dembitz.

Odgovori