Visul primului inginer al limbii române: un dicționar cît Google

Povești fără timbru Niciun comentariu la Visul primului inginer al limbii române: un dicționar cît Google 121

„Am făcut o pasiune din a vorbi corect românește”, spune Cătălin Frâncu. A crescut această pasiune în urmă cu zece ani, pe cînd era student în SUA, la MIT, iar, treptat, a transformat-o într-un proiect online. Fără să aibă vreo pregătire academică sau studii de specialitate, Cătălin s-a decis să facă site-ul dexonline.ro, unde să fie trecute toate cuvintele limbii române. I-a dat drumul în februarie 2001, iar de la 200 de definiții, cît a scris în primele luni, a ajuns la aproape 420.000. La început, oamenii credeau că este un lingvist sau cercetător al Academiei Române, dar el spune amuzat că „dincolo de clasa a opta nu am mai făcut gramatică”. A făcut totul pe cont propriu, fără nici o sursă de finanțare din partea vreunei instituții, iar acum portalul a devenit unul dintre cele mai accesate și mari dicționare online din România. După zece ani de locuit și lucrat în SUA, la Google, Cătălin a renunțat la visul american pentru a-și îndeplini visurile de inginer. Nu are nici un regret că și-a lăsat locul de muncă din California, iar acum se dedică numai proiectelor de voluntariat pe care le are. Dexonline a devenit copilul lui, care crește pe zi ce trece.

Era cu o copertă alb cu roz, iar li­terele erau puțin în relief. Era dic­ționarul de sinonime și a costat 35.000 de lei. A fost primul pe ca­re l-am primit. „O să facem toată co­lecția și o vezi de ce mare ajutor îți va fi”, spunea taică-miu, atunci cînd mi l-a dat. La opt ani des­co­pe­­­ream cum e să te joci cu unele cu­vinte, iar în colecție s-au adunat cam zece la număr. La Cătălin Frâncu, primul dicționar a fost u­nul al Limbii Române Moderne, ul­terior, pe la 11-12 ani l-a primit și pe cel al Limbii Române Con­tem­porane și de Neologisme. A­cum, acasă în București, are cam 15-20, împrăștiate pe rafturi, iar printre acestea se găsește și mamutul DEX. Pe o parte dintre ele le-ar putea arunca, le are deja în mi­cul server din cameră. Acolo se a­flă tot DEX-ul în varianta digitală, a­lături de alte șase dicționare. Este munca lui de mai bine de zece ani și are exact 417.948 de definiții.

Vorbește repede și clar, zîm­beș­te larg și entuziasmul i se ză­rește în colțul buzelor. A ajuns în SUA în 1999, cînd s-a transferat la MIT (Massachusetts Institute of Technology), iar din februarie 2001 a început să lucreze la DEX, va­rianta online. Îi plăceau dic­țio­na­rele americane pe care le găsea pe internet, bazele lor de date erau imense, iar în România nu vedea nici un astfel de proiect. A fost ca o probă de principii, iar în fond, recunoaște el, o dovadă de patrio­tism. Și a început singur, folosin­du-și calculatorul personal, care se trans­forma, periodic, cînd în server, cînd în consolă de joc. „Primul ser­ver a fost la mine, în camera de cămin, în primul an, după care, cînd am plecat în California, am luat calculatorul cu mine. L-am des­făcut bucăți, l-am pus în valiză, iar atunci site-ul a fost închis vreo do­uă-trei zile. Apoi, cînd mai vo­iam să mă joc pe calculator, în­chi­deam sistemul de operare Linux și treceam în Windows și serverul că­dea din nou. Dar asta a fost pînă prin 2003, cînd am cumpărat un cal­culator care stătea deschis non stop numai pentru DEX”, po­ves­teș­te Cătălin.

Primul cuvînt pe care l-a introdus a fost „negativ”. Fără nici un motiv anume, spune el. Fiecare pro­iect pe care l-a început l-a vă­zut ca pe o platformă la care să poa­tă contribui toți utilizatorii, care urma să crească pe măsură ce era descoperit de oameni. Iar pri­mul proiect la care a lucrat a fost un soi de trivia despre celebrități, un­de fiecare utilizator venea și a­dă­uga cîte o nouă întrebare sau cî­te un nou personaj. „La început am pornit cu o bază de date goală, dar oricine putea să adauge o în­tre­bare cu două răspunsuri. Prima întrebare pe care am băgat-o a fost ceva de genul «e în viață sau a murit?», «e bărbat sau femeie?». Da sau nu, astfel era un arbore de po­sibilități, care se bifurca la fiecare întrebare. Din momentul ăla, informația tot creștea și era la dis­poziția fiecăruia și a ajuns la câteva sute de noduri. Lumea își bă­ga pînă și colegii de clasă pe acolo”.

Student restanțier, caut coleg de cameră la MIT

Avea deja trei restanțe, materiile nu îi plăceau, iar „metoda de predare și de atitudine față de student era foarte dezamăgitoare”. Era în al treilea an de studii la Po­li­tehnica din București și a decis să se transfere. A depus vreo zece do­sare de admitere la cele mai bu­ne universități din SUA, printre care Princeton, Harvard, Stand­ford, și MIT. A fost acceptat nu­mai de ultima, MIT, iar în 1999 a a­juns în SUA, lăsînd în urmă Po­li­tehnica și, în total, alte cinci res­tan­țe.

„Acolo a fost prima oară cînd mi-am dat seama că eu acolo chiar trebuie să învăț. Spre deosebire de Poli, unde aveam 30 de ore de curs, la MIT aveam, cu tot cu laboratoare, pînă în 20 și mai învățam în­că pe atît în rest”, spune Cătălin. În plus, mai petrecea cîte șase ore pe săptămînă în sălile de lectură și în bibliotecile Institutului. În 2002 a terminat masterul și urma să dea și la studiile de doctorat, însă dosarul nu i-a fost admis. Spu­ne că ar fi fost de vină și contextul acelor ani, cînd a fost recesiu­nea dot-com bubble. Dez­vol­tarea puternică a Internetului a dus la cotarea a numeroase companii IT pe bursă, însă creșterile in­vestitorilor nu au venit atît de repede pe cît preconizau, iar multe au intrat în faliment: „Speculația mea este că, asta era în 2001 – 2002, fix după atacurile de la World Trade Center, atunci era și o recesiune, acel dot-com bubble, care a început în 2000 și a continuat pînă în 2004. Multă lume a dat la școală și numărul de dosare a fost mult mai mare decît de obicei și eu nu am fost atît de deștept pe cît credeam probabil și nu am fost primit”, spune Cătălin.

Autoironia i-o simți cînd vor­bește despre el și adeseori îl auzi cum se descrie drept un tocilar. „Pro­babil cînd iei zece la toate ma­­teriile, nu poți susține altceva, și nu îmi plăceau toate materiile”, con­tinuă el. Se descrie pe blogul său ca fiind un „mîndru tocilar al MIT-ului” și-ți aduce și argumen­te: își face gimnastica pe e­pisoa­dele din „The Big Bang The­ory” și „ieși să mănînci la un res­ta­urant din cartier cu o revistă Scien­tific American. Și scrii un post pe blog despre asta”.

Fără să fi fost acceptat la doctorat, și-a căutat un loc de muncă și a început un internship la Google. Din 2002 a devenit inginer de soft­ware la marele motor de căutare. În același timp, site-ul creștea cu pași mici și cu multă reticență din partea celorlalți. „Nu o să îți iasă”, „de ce te implici în așa ceva?” sau „nimeni nu te va ajuta”, au fost printre primele reacții pe care le-a tot pri­mit. La urma urmei, era un proiect pe care-l făcea din SUA, care era de folos în principal utilizatorilor din România, fără să aibă un ajutor din partea cuiva. A lăsat în spa­te părerile celorlalți, spunînd că „filosofia mea este că rețeta eșe­cu­lui este să încerci să îi mulțumești pe toți”.

Limba română, în 200 de cuvinte

În 2001, cînd a pornit proiectul, dicționarul avea numai definițiile pe care le-a scris Cătălin. Deși era în SUA, el a atras nu­me­roși voluntari care să-l ajute cu a­dă­ugarea cuvintelor. La un an au venit primii colaboratori, în februarie 2002, oamenii de la Fe­de­ra­ția Română de Scrabble și-au oferit ajutorul pentru a putea avea și ei la îndemînă, pe Internet, lista o­ficială a cuvintelor din lim­ba ro­mână. Ei s-au dovedit a fi printre cei mai activi voluntari ca­re au mă­rit dicționarul virtual.

Proiectul devenea popular și ve­­neau din ce în ce mai mulți oa­meni interesați. În 2003 s-au mu­tat la adresa actuală și erau deja 20.000 de cuvinte, pentru ca în fe­bruarie 2004 să ajungă la 30.000. În noiembrie 2003 au lansat și „ghi­dul de exprimare corectă”, iar pe 1 august 2004 au terminat definițiile din DEX: au fost peste 65.000, iar următorul pas a fost acoperirea celorlalte dicționare e­xis­tente. În 2006 erau peste 283.000 de definiții puse la dispoziția utilizatorilor. Toate aceste cuvinte au fost adăugate de voluntari, iar, pînă acum, sînt în jur de 200 de oameni care au reușit să ia cuvintele din maldărul de hîrtii și să le transforme în biți. „Mulți utilizatori vin și ne întreabă cum pot să ne ajute. Pe site, noi avem un ghid și le spunem că ne pot semnala greșelile de tipar și că pot contribui cu definiții. Alții au ve­nit și ne-au scris o aplicație de iPhone, astfel că omul fie poate să își ia cuvîntul de pe Internet, în timp real, fie, dacă nu are conexiune, poate să își descarce un set de date”, mărturisește Cătălin.

În total, el a adăugat în jur de 2.000 de cuvinte, ceea ce în­seam­nă cam 50 de pagini din DEX, însă prin­tre cei mai activi colaboratori se găsesc Laurențiu Bașchir și La­ura Gellner, care au tastat cît patru-cinci Biblii, iar „o Bibilie are cam 3,5 milioane de litere”, con­tinuă Cătălin. Pe site, cei doi a­par în topul colaboratorilor, iar pri­mul are 48.731 de definiții tri­mise, iar Laura Gellner are 66.251 pe care le-a scris din Ger­ma­nia, fără să se fi întîlnit vreodată cu Cătălin. În echipa lui se gă­sesc Radu Borza, Matei Gall sau Octavian Mocanu, care s-au o­cupat de „dex flex”, programul prin care utilizatorii pot vedea de­clinările și conjugările verbelor. Ei se ocupă și de ceea ce ține de pro­gramare sau promovarea site-ului, iar în total sînt șapte oameni care-și ocupă timpul cu programa­rea, scrierea, corectarea sau gă­si­rea definițiilor.

Facebook nu știe ce înseamnă „a partaja”

La început, el a apelat și la A­ca­demia Română, sperînd să pri­mească definițiile în format digital, fără să mai fie nevoie de trans­cri­­erea mecanică. „Prima oară le-am scris înainte să mă apuc de pro­iect. Le-am zis ce vreau să fac și da­că nu vor să îmi dea DEX-ul. Ceea ce acum mi se pare complet naiv, nici eu nu le-aș fi dat unui străin”, amintește Cătălin. Nu a pri­mit răspuns nici prima oară, nici după ce a început să adauge de­finiții, iar site-ul devenea din ce în ce mai popular. A vrut să facă din dexonline.ro un portal pentru Academie, punîndu-le la dispo­ziție bannere virtuale sau o­fe­rin­du-le alte facilități, dar aceștia nu au mai cooperat deloc. Oricum, măr­turisește el, le este re­cu­nos­cător pentru că nu s-au împotrivit pro­iectului și nu a fost vreun conflict legat de drepturile de autor. În plus, firma Siveco a reușit să le ofere drepturile de publicare pentru cinci dicționare.

„Viteza de reacție a instituției e destul de mică pentru rapiditatea cu care se modifică uzul sau a­nu­mi­te cuvinte din limba română”, ob­servă el. Edițiile revizuite apar la o perioadă destul de mare, iar a­ici el vine cu cazul în care A­ca­de­miei i s-a cerut să precizeze sensul pe­iorativ al cuvintelor jidan și ți­gan. „Academia a dat acel discurs, în care își exprima recomandările și spunea că «o veți vedea în 2014, în următoarea ediție a dicțio­na­ru­lui». Eu l-aș trimite la tipografie de mîine și aș scrie «ediția a doua revizuită și adăugită» sau «ediția 2.5», nu știu, dar s-a dus vremea cînd stăteai ca să aștepți trei ani de zile pentru rectificare”.

De aceea, mărturisește el, se ba­zează tot timpul pe acea masă de voluntari pe care o poate activa cînd are nevoie. Oricum, munca nu se va termina în viitorul a­pro­piat, „limba este într-o continuă mișcare și datoria noastră este să con­semnăm definiții, chiar și cu ris­cul de a greși și pe ici și pe colo”, iar pe ideea asta a introdus și argourile în dicționar, cu tot cu obs­cenitățile aderente. „Îmi spu­nea o mamă că a căutat «a se da u­ța», care are o conotație sexuală și așa este, dar soluția în nici un caz este să ne prefacem că nu există. Trebuie consemnat ca atare”, continuă Cătălin. Oricum, periodic, printre mesajele primite, numeroși u­tilizatori îi recomandă cîte o no­uă definiție pentru cuvintele obs­ce­ne care-s trecute pe site.

De asemenea, pe dexonline.ro se găsesc numeroase cuvinte care nu sînt recunoscute, în mod oficial, de vreo instituție – autoritate pen­tru limba română, acestea a­pă­rînd într-o perioadă scurtă de timp. Cătălin se folosește de Dic­țio­narul Cuvintelor Recente al Floricăi Dimitrescu. „De 40-50 de ani încoace, ea își cumpără pa­tru-cinci ziare pe care le citește, dar le citește, nu neapărat ca să se in­formeze, dar ca să caute și cu­vinte neconsemnate încă. Ea este un lexicon ambulatoriu, își dă sea­ma că acel cuvînt nu există și îl de­cu­pează din ziar, împreună cu sensul și le consemnează”, povestește el. Au venit și propuneri de a-l transforma și într-un dicționar en­ci­clopedic, iar unii autori deja sînt prezenți. Însă el e conștient de fap­tul că „ar munci inutil pentru a pu­blica efortul Wikipedia, care deja este deja mult mai bun decît ce am pu­tea noi să facem”.

În prezent, site-ul are peste un milion de vizitatori pe lună, tot într-o lună sînt căutate șapte mi­lioa­­ne de definiții și sînt afișate 20 de milioane de pagini cu informa­ții. Iar, periodic, în orele de vîrf, ser­verul se supraîncălzește și pică, a­tunci, Cătălin recurge la fi­lo­so­fia Google: „decît să cumpărăm un super mega computer, luăm ser­­vere multe și ieftine și parale­li­zăm munca”. În plus, întreținerea u­nui server scump l-ar costa foar­te mult, iar acum sînt găzduiți pe gratis de ELVsoft.

De un an și jumătate, dexonline.ro are o nouă interfață, iar din aprilie 2011 a pus și „cuvîntul zi­lei”, una dintre cele mai cerute ru­brici. Cuvintele care apar sînt se­lec­tate dintr-o listă făcută de vo­lun­tari, iar dacă ar avea ocazia, Că­tălin ar pune un cuvînt calchiat, „ar fi ceva de genul «a­pli­ca­ți­e», «a partaja», sau «expertiză»”.

E aproape ras în cap și se în­crun­tă mai degrabă în semn de bu­cu­rie. I se măresc pupilele ochilor și-ți spune cu bucurie că: „trecerea spre digital este fascinantă”. Ar vrea ca dexonline.ro să devină un punct de referință atunci cînd un u­tilizator are o nelămurire legată de limba română sau de un cuvînt a­nume. Își dă seama că cititul se îm­parte, încet, între răsfoitul unei cărți și plimbatul degetului pe o ta­bletă, însă „teoria mea este că inteligența unui copil și dorința lui de a se informa este influențată de cît de multe cărți vede la el în ca­să. De exemplu, la mine aveam bi­bli­otecile pline, îi vedeam pe ai mei citind seara la veioză. În clipa în care singurele tale cărți vor fi de fapt un ebook cu sute de cărți pe el, mie mi-e un pic teamă de impactul asupra copiilor”.

„Sînt aproape obligat moral să intru pe DEX”

În această toamnă vrea să mai aducă un programator. Site-ul este din ce în ce mai solicitat, iar periodic se blochează cînd traficul este foarte mare. Nu-și mai dedică cî­te 20 de ore pe săptămînă, cum făcea în 2007 și a creat o firmă în jurul site-ului, pentru a putea contabiliza cîștigurile care vor veni. Speră că va putea să-și plătească și cîțiva dintre voluntarii care au scris definițiile pentru site. În a­celași timp, a început un alt proiect. Civvic.ro va fi un portal unde se va găsi tot materialul legislativ al României, acolo vor fi postate legile, ordonanțele de ur­gență sau decretele, iar în acest mo­ment lucrează la publicarea Mo­nitoarelor Oficiale vechi. Iar dintr-o pasiune personală, a lansat și un site pentru anti-șah (în 2001), un joc de șah unde participanții trebuie să scape cît mai re­pe­de de piesele de pe tablă. „A­co­lo captura este obligatorie și re­gele e o piesă obișnuită, se poate lua ca orice piesă, iar cine își dă pri­mul piesele, cîștigă jocul”, po­vestește Cătălin. Pe nici unul dintre aceste proiecte nu primește vre­un ban, însă, într-un final „cînd ai o idee bună și tu știi că va fi fo­lo­sitoare, utilă lumii, implemen­tează și vei găsi și o modalitate să o monetizezi”.

În ieșirile în oraș, cu prietenii, discuțiile se poartă între paharele de vin și formele corecte ale cu­vin­telor. Cicălindu-l, prietenii îl în­treabă „hai măi, știi tu unde să verificăm și noi o definiție?” și, rî­zînd, Cătălin spune că „sînt a­proape obligat moral să intru pe DEX”.

***

E duminică, 23 octombrie, pe dexonline.ro cuvîntul zilei e „limi­nar”. Vine din francezul liminaire și înseamnă inițial, introductiv. E introdus de Laura Gellner și e doar una dintre cele 66.439 definiții pe care le-a scris. Nu l-aș fi căutat în dicționar și nici nu aș fi deschis vreunul în caz că m-aș fi întîlnit cu acest cuvînt. Dacă vo­iați să verificați, „a se da uța” în­seamnă de fapt „a avea contact se­xu­al”, ca să nu rămînă nici o cu­rio­­zitate.

Cătălin Frâncu se dedică a­cum numai proiectelor de volun­ta­­riat pe care le are, n-ar mai vrea să fie prins, opt ore, în biroul de serviciu, iar de DEX nu s-ar rupe decît dacă ar fi o idee „fascinantă, deși nu m-ar lăsa inima”. Pînă a­tunci, DEX-ul este copilul lui, as­ta pînă cînd va fi suficient de ma­tur să aibă copii reali, așa măr­tu­risește pe site-ul lui. În rest, e un to­cilar modest și e mîndru de asta.

***

Angajatul cu numărul 500

Nu a intrat la doctorat, însă a fost acceptat la un stagiu de prac­tică la Google, iar apoi, din 2002, a devenit angajatul cu nu­mă­rul 500. „Totul răul spre bi­ne”, trage el linie, iar acolo a stat pînă în 2006, unde a lucrat ca inginer software. Era prima lui slujbă și a fost o experiență ex­traordinară. Fiecare avea li­ber­­tatea să vină pînă și cu co­pi­lul sau animalul de companie – bine, să fie prezent la ședințe – dar „de vreme ce muncim toți la ideea asta care nouă ni se pare că e genială și că va revoluționa lu­mea, orice este permis”. Iar Că­tă­lin a muncit, printre altele, la un proiect, care presupunea cre­a­rea unui alt motor de căutare intern pentru inginerii Google, ca­re se numea SiteInfo. „Eu am fă­cut un acest motor prin care inginerii care lucrau la Google să poată căuta rapid un url, o a­dre­să, ca să vadă în ce stare este a­cea pagină”, povestește el.

O vară a lucrat lîngă biroul fon­datorilor Larry Page și Ser­gey Brin. Echipa lui lucra la un pro­iect care presupunea crearea unei baze de date cu angajații com­paniei, unde să se găsească proiectele și stadiile în care se a­flau aceștia. Era un soi de inventar al resurselor din companie. „Ei aveau un war room, cameră de război, iar echipa care lucra la acel proiect era mutată mai a­proape de ei și ei dădeau buzna din cînd în cînd să vadă cum mer­ge”, era un alt fel de a se motiva, spune Cătălin. I-a plă­cut foarte mult și motoul intern pro­movat între angajați, „don’t be evil”. Trebuiau să dea tot ce era mai bun din ei, nu erau a­dep­ții „cîrpelilor”, iar produsul în sine trebuia să îmbunătăteșească viața la cît mai mulți oameni.

„Insistau pe anumite de­prin­deri”, iar, într-un final, acestea fă­ceau parte din mecanismului an­gajatului. Cătălin își însușea toate practicile care-l atrăgeau. La trei ani de cînd s-a întors din A­merica, pe unele dintre ele le păstrează și acum. „Ei trăiesc într-o relaxare pe care nu am întîlnit-o la noi” continuă el.

Visul american înlocuit cu visul de inginer

Însă România a rămas „a­ca­să”.  „E greu de pus degetul. Noi ne-am decis să venim în Ro­mânia prin 2005, dar am amânat din diverse motive. Eu țin foarte mult legătura cu România, iar în vacanțe, în loc să vedem alte lo­curi, noi veneam aici și atunci am fost sinceri cu noi. Am zis că ne place în România și că prefe­răm să locuim în România și să mergem în America, in­vers”, mărturisește Cătălin. Da­că voiau, atît el cît și soția lui, să ob­țină cetățenia, ar fi primit-o, du­pă un lung proces, abia în 2012. Era prea mult, recunoaște el.

El nu s-a gîndit niciodată că va rămîne definitiv în SUA, iar pro­iectul DEX a fost, își dă sea­ma, și o formă de manifestare a patriotismului. Cît a stat acolo, purta discuții cu prietenii despre for­mele corecte ale cuvintelor, se întîlneau periodic la grătar, pre­ferînd mîncărurile cu gust de Ro­mânia. „E ciudat, cînd ajungi acolo începi să faci lucruri de pa­triotism pe care aici nu le faci, ți se par desuete, iar acolo e alt­ce­va”.

George GURESCU

Autor:

Opinia Studențească

Revistă săptămînală de actualitate, reportaj și atitudine studențească, editată de studenți ai Departamentului de Jurnalism și Științe ale Comunicării de la Universitatea Alexandru „Ioan Cuza din Iași”.

Adaugă un comentariu

Etichete:

Opinia studențească este o revistă săptămînală de actualitate, reportaj şi atitudine studenţească, editată de studenţi ai Departamentului de Jurnalism şi Ştiinţe ale Comunicării de la Universitatea Alexandru „Ioan Cuza din Iași”. A fost înfiinţată în 1974 și continuă tradiția școlii de presă de la Iași.

Căutare

Back to Top