04:32:22 10.07.2025
Stiri

Povestea informaticianului român care a făcut DEXONLINE

Social 27.11.2013 17:09 Vizualizări1711
Povestea informaticianului român care a făcut DEXONLINE

Îl găsim pe Cătălin Frâncu, informaticianul român care a odinioară fost printre primii 500 de angajaţi ai Google, în casa lui din sectorul 2 al Capitalei, în faţa calculatorului. Este o imagine care nu-ţi trezeşte nici cea mai mică urmă de surpriză, însă, dacă te apropii, vezi că pe monitor nu se află un nou limbaj de programare. Ci chiar limbajul, cuvintele limbii române pe care le folosim cu lejeritate zi de zi sau cărora nu le cunoaştem înţelesul. Sunt adunate toate pe platforma dexonline.ro, pe care Frâncu a creat-o în anul 2001. Dacă în sufragerie se află computerul de pe care informaticianul încarcă cele mai noi definiţii ale cuvintelor, la demisol sunt adunate dicţionarele care stau la baza celor 570.000 de definiţii accesate zilnic de sute de mii de români. Serverele pe care se află întreg vocabularul limbii române sunt situate ceva mai departe, la Cluj. Astăzi opt voluntari lucrează la proiectul care a adus marile dicţionare ale limbii române pe telefonul mobil sau pe calculatorul oricărui român care beneficiază de conexiune la internet. Printre ei se află şi un membru al MENSA, asociaţia celor mai inteligenţi oameni din lume. Însă totul a început de la un singur om, un IT-ist pasionat de limba şi literatura română, şi s-a dezvoltat în urma unei întâlniri norocoase.

Dispute lingvistice între românii din Sillicon Valley

Din casa sa din Bucureşti, Cătălin Frâncu îşi aduce aminte de locul în care se afla în urmă cu 12 ani. Era în SUA, unde venise în ultimul an de facultate pentru a studia informatica la prestigiosul Massachusetts Intitute of Technology (MIT) şi ajunsese în timpul studiilor să lucreze la Google. A fost chiar între primii 500 de angajaţi ai gigantului IT. Pe când stătea de vorbă cu românii din Sillicon Valley, şi-a dat seama de un lucru: dacă americanii aveau nenumărate dicţionare online, noi românii nu aveam niciunul. Iar această lipsă era cu atât mai frustrantă pentru românii aflaţi departe de casă, care nu puteau intra tam-nesam într-o librăriei sau bibliotecă să-şi ia un dicţionar şi să se lămurească asupra sensului unui cuvânt românesc.

„În Silicon Valley erau mulţi români şi uneori mai aveam dispute despre sensul cuvintelor: cum se zice la asta? Ce înseamnă cuvântul asta? Atunci am adus cu mine DEX-ul ediţia 1998, să-l confruntăm când era nevoie. Apoi am zis de ce n-am avea şi noi un dicţionar online, accesibil de oriunde?”, îşi aminteşte Cătălin de începuturile proiectului său.

Arahnidă şi arahnoidă, primele cuvinte explicate pe dexonline

S-a decis să creeze el un dicţionar online, la care în primele luni a lucrat singur. După orele petrecute la Google, Cătălin stătea să introducă, într-o variantă primitivă a Dexonline, cuvinte din dicţionarul tipărit. Primele introduse au fost arahnidă şi arahnoidă. „Am început cu paronimele. Am pus arahnidă şi arahnoidă după o discuţie cu alţi români despre păienjeni. În primele luni, Dexonline s-a dezvoltat lent şi haotic, aveam cam 40 de cuvinte. Din această cauză, multă lume îmi zicea că această idee n-o să prindă niciodată”, spune Cătălin.

Însă, el îşi dorea să dezvolte proiectul şi a căutat voluntari care să-l ajute să introducă definiţiile. „Eu voiam să dezvolt site-uri web. Ştiam informatică deja foarte bine, dar nu practicasem prea mult partea de dezvoltare web. În acelaşi timp, voiam un proiect care să rămână, nu numai un proiect didactic la care să nu se mai uite nimeni”, arată Cătălin Frâncu. Recunoaşte însă că, la început, site-ul arăta „groaznic”.

Printre voluntari, doi pasionaţi de Scrabble şi un membru MENSA

După şase luni a avut o întânire norocoasă. A fost contactat de cei de la Federaţia Română de Scrabble, care aveau nevoie de un dicţionar care să fie accesat de oriunde, indiferent de locul unde se desfăşoară competiţiile lor. „Din acel moment am început să lucrez sistematic pentru acest proiect”, spune inginerul. Şi astăzi îi are alături pe Matei Gall şi Tavi Mocanu, moderatori şi membri ai Federaţiei Române de Scrabble. Matei are 60 de ani şi trăieşte la Braşov, Tavi este cercetător la Universitatea Autonomă din Barcelona. Lângă ei au venit şi alţii. „Laurenţiu Başchir şi Laura Gellner sunt cei mai activi voluntari ai Dexonline. Oamenii ăştia au tastat 23 de milioane, respectiv 17 milioane de simboluri pe Dexonline. Laura trăieşte în Germania şi este bibliotecară, Laurenţiu e voluntar de patru ani şi până acum e primul în topul voluntarilor, iar de vreo 4 ani nu îl întrece nimeni". Opt sunt cei care în afară de Frâncu lucrează constant la adăugarea de noi şi noi definiţii pe Dexonline. Cel mai des acesta se întâlneşte cu Radu Borza, şi el programator, şi membru al MENSA. Este singurul care locuieşte la Bucureşti. „E la Dexonline din 2003. A dezvoltat componente mari din proiect: toată partea de declinări / conjugări, cuvântul zilei, cuvântul lunii. Este interesat de evoluţia limbii şi conduce proiecte de digitizare a unor dicţionare vechi", povesteşte Cătălin Frâncu.

În 2004, tot DEX-ul era online

Cu ajutorul primit a reuşit, în 2004, să pună pe net toată ediţia din 1998 a Dicţionarului Explicativ al Limbii Române. „Dar ne-am dat seama că de abia de acolo a început greul. În aceeaşi vară din 2004 am pus încă vreo patru dicţionare, de sinomine, antonime, ortografic şi Nodex-ul basarabean. Astfel, de la 65.000 de definiţii în 2004, am ajuns la 570.000 peste încă 9 ani. Am introdus şi dicţionare de nişă. Am avut câteva dicţionare foarte vechi, de exemplu două dicţionare foarte vechi ale lui Şăineanu şi Scriban, ieşite din uz”, spune Cătălin.

Dicţionarul online, actualizat cu voluntari

Pasionat de limba română, Frâncu a decis să introducă pe Dexonline şi dicţionarele vechi . „Cred că evoluţia limbii este foarte interesantă, mai interesantă decât forma ei de azi. De asta am şi introdus dicţionarele vechi. Ele îţi arată ce sensuri aveau cuvintele acum 80 de ani. Anumite cuvinte care astăzi sunt peiorative, pe vremea aia erau absolut normale”, spune Cătălin.

Dexonline a fost îmbunătăţit de la an la an. În 2006, a fost lansat subproiectul Dex Flex, prin care Frâncu şi echipa lui urmăreau generarea unei liste complete a cuvintelor limbii române împreună cu toate formele lor flexionare, precum declinările şi conjugările. Tot atunci, serverul principal al Dexonline a fost mutat în România, deoarece cei mai mulţi dintre utilizatorii proiectului erau, cum este firesc, de aici.

La trei ani după mutarea serverului în România, Cătălin Frâncu s-a decis să părăsească SUA şi să se întoarcă şi el definitiv acasă.

Două milioane de vizitatori unici pe lună

De multe ori proiectul Dexonline s-a lovit de opoziţia lingviştilor. „Noi nu ne atribuim rolul lingviștilor, tot ceea ce facem este să respectăm ad litteram dicţionarele pe care le introducem. Mergem pe ideea că DEX-ul este un bun făcut din bani publici, e un bun valoros şi le-am spus asta şi celor de la Institutul Iorgu Iordan care fac dicţionarele. Site-ul nostru are o licenţă permisivă, oricine îşi poate copia local definiţiile”, spune Frâncu.

Pentru DEX Frâncu spune că a încercat să obţină acordul editurii care îl tipăreşte. „Am căutat editura din 2001 până în 2004, când încă eram în SUA, dar nu mi-au răspuns nici la email şi în niciun fel. Într-un final, după ce proiectul a câştigat popularitate m-au căutat ei printr-un avocat să ne spună să închidem. Le-am explicat că nu facem decât să punem cuvintele online şi că nu furăm nimic”, spune Cătălin.
În prezent, site-ul are lunar două milioane de utilizatori unici şi 13 milioane de pagini afişate, iar Frâncu susţine că printre utilizatori se află inclusiv lingvişti. „În 2010, la o conferinţă despre cum putem folosi tehnolgia pentru limba română, organizată de Institutul de Lingvistică „Iorgu Iordan”, unde mă dusesem un pic cu inima strânsă, toată lumea mi-a spus că foloseşte Dexonline deoarece este mai rapid. Ne-am simţit apreciaţi”, afirmă programatorul. Spune că şi academicienii folosesc Dexonline. „Dar nu au vrut să colaboreze cu noi, le-am spus de multe ori că vrem să intrăm sub oblăduirea voastră. Nu i-a interesat”, arată programatorul

Cum se corectează greşelile

Dicţionarul online permite corectarea greşelilor. Dacă un cititor observă o greşeală, atunci el poate semnala acest lucru pe legătura Greşeală de tipar, unde poate descrie problema. „Însă, nu acceptăm corectarea definiţiilor, le lăsăm exact aşa cum apar în dicţionare”, arată inginerul, care spune că nu se subsituie în niciun caz lingviştilor sau academicienilor care se ocupă de limba română. „Noi vrem să fie un dicţionar mai bun şi oficial dacă se poate. Acum avem în lucru un sistem care să indexeze pagini româneşti, adică şi literatură şi articole şi câteva bloguri mai răsărite, şi să caute cuvinte menţionate frecvent în acele pagini, dar pe care noi nu le avem. Şi dacă un cuvânt apare de 50 de ori şi noi nu-l avem, este un semn că ar trebui să-l pasăm unui lexicograf şi să-l punem apoi în dicţionar”, arată Cătălin Frâncu.

Echipa de voluntari nu colaborează însă cu un lexicograf. „În general, tocmai pentru că nu suntem lingvişti şi pentru că nu avem vreo autoritate în domeniu definiţiilor, luăm dicţionare de prestigiu, dicţionare care au greutatea şi recenţia unui grup de lexicografi”, arată Frâncu.

Cuvântul lunii august, „torţionar”, în urma dezvăluirilor din „Gândul”

Dicţionarul are şi un cuvânt al lunii, cel mai căutat de către utilizatori, care este de regulă o dezbatere a celor mai aprinse dezbateri din societate. În luna august, cel mai căutat cuvânt a fost „torţionar”, ca urmare a dezvăluirilor făcute de Gândul, în parteneriat cu Institutul pentru Investigarea Crimelor Comunismului şi Memoria Exilului Românesc cu privire la cazul Vişinescu şi Ficior. „Acum câteva luni, cel mai căutat a fost calorifer, evident din motive care ţineau de scandalul din jurul directorului ICR, Andrei Marga. De multe ori, cuvântul cel mai frecvent căutat indică faptul că ceva s-a petrecut în societate. De exemplu, când e căutat cuvântul vocaţie înseamnă că poate la o emisiune tv s-a vorbit de asta. Şi poate s-au contrazis asupra sensului. Acum folosim integral 10 dicţionare şi mai avem alte 20 de dicţionare din care folosim numai părţi sau definiţii”, mai spune Cătălin Frâncu.

În schimb, în luna septembrie, cele mai căutate sensuri au fost cel pentru eutanasiere şi redevenţă, ca urmare a adoptării legii eutanasierii câinilor fără stăpân şi a scandalului privind Roşia Montană. Oricine vrea să contribuie la Dexonline cu definiţii poate face acest lucru. Există o pagină de contribuţii unde definiţia poate fi scrisă, apoi cei de la Dexonline o preiau, o corectează şi apoi o activează. „Dorim ca definiţiile trimise să fie cât mai conforme cu dicţionarele de unde provin, de aceea acceptăm numai cuvinte din sursele noastre, adică diferitele ediţii ale dicţionarelor”, spune Cătălin Frâncu.
El spune că nu se substituie în niciun caz lingviştilor sau academicienilor care se ocupă de limba română. Dar consideră că limba evoluează şi el nu face decât să consemneze toate sensurile. Frâncu susţine că românii fac o greşeală atunci când evită cacofoniile. „De multe ori, construcţiile la care ajungem încercând să evităm o cacofonie zgârie urechea mai rău decât cacofonia însăşi. Alte limbi nu se străduie deloc să le evite”, spune informaticianul, care arată că spaima pe care cacofoniile le provoacă vorbitorilor de limbă română se are loc din cauza automatismelor învăţate în şcoala primară.

Îşi apostrofează elevii care nu vorbesc corect româneşte

În afară de Dexonline, Cătălin Frâncu e profesor la un cerc de informatică la Liceul „Tudor Vianu” din Capitală, al cărui absolvent este. „Este un cerc de algoritmi în general, dar mai vorbim şi despre alte lucruri. Cursul mă solicită foarte mult, pentru că elevii sunt foarte deştepţi. Uneori îmi trebuie chiar 2-3 zile să mă pregătesc. Le spun şi despre Dexonline, dar elevii îl folosesc oricum pentru că au nevoie. Dar dacă îi prind că vorbesc greşit limba română le dau peste nas”, spune Cătălin Frâncu.

Proiectul de suflet: dicţionarul vizual

Frâncu spune că Dexonline rămâne un proiect „de suflet” şi chiar dacă a primit mai multe oferte de vânzare le-a refuzat pe toate.

„Vreau să dezvolt proiectul şi să creăm un dicţionar vizual. De exemplu, atunci când cauţi un cuvânt precum piston să poţi să şi vizualizezi”, dezvăluie programatorul planurile lui. Îşi doreşte ca voluntarii să devină propriii creatori de conţinut. „E bine să facem ceva şi să câştigăm autoritatea că ce spunem noi aici este adevărat. Mai vrem să confruntăm toate definiţiile pentru un cuvânt. În bună măsură unele definiţii sunt şi redundante pentru că autoriii se inspiră şi ei unii după alţii. Şi atunci unele definiţii sunt la fel şi astfel irosim timpul utilizatorilor. Am vrea să restructurăm tot ce avem într-o singură definiţie”, conchide Cătălin Frâncu.

sursa: Gandul.info

Autor: Mariana Rață
Stiri relevante
Top stiri

Parteneri
Punct de vedere NAȚIONAL
14.05.2025 13:06 ZiarulNational Mihai Gribincea // Moscova rescrie is...

30.12.2024 09:11 Nicolae Negru Nicolae Negru // Anul politic 2024, î...

30.12.2024 09:55 Valeriu Saharneanu Valeriu Saharneanu // Rezidenții tran...

Sondaj
Ce scenariu pare mai realist?
Prietenii noștri

Ziarul Național 2013-2025. Toate drepturile sunt rezervate

Despre noi Publicitate Termeni și condiții News widget RSS Contacte