Dacă memoria umană este ultimul suport accesibil cărţilor in distopia 451 Fahrenheit, iată că era informaticii ne ingăduie să visăm la un corpus al tuturor textelor reprezentative ale culturii noastre, după modelulNew York Times CorpussauReuters Corpus.
Pe 6-7 mai a.c., la Muzeul Naţional al Literaturii Române (M.N.L.R.), lingvişti şi informaticieni de vârf, recunoscuţi ca fiind printre cei mai buni din lume, dar şi studenţi şi masteranzi, se intâlnesc in cadrul conferinţei internaţionale "Resurse lingvistice şi instrumente de prelucrare a limbii române" (http://consilr.info.uaic.ro/consilr2010/index.html).
Organizatorii tradiţionali ai acestui eveniment, ajuns la a şasea ediţie, sunt: Universitatea "Al.I. Cuza" din Iaşi, Academia Română prin Institutul de Cercetări in Inteligenţă Artificială şi Institutul de Informatică Teoretică Iaşi, cărora li s-au alăturat acum, in cel de-al zecelea an al proiectului, M.N.L.R. Participarea la lucrări se face şi in regim de videoconferinţă.
Tematica abordată include următoarele subiecte: realizarea de resurse lingvistice româneşti, textuale ori vorbite, in forma originară ori adnotată; crearea de corpusuri româneşti reprezentative; realizarea de colecţii lexicografice româneşti in format electronic; tehnologii lingvistice aplicate limbii române şi/sau altor limbi (dar cu aplicabilitate pentru limba română); aplicaţii in care au fost utilizate tehnologii lingvistice pentru limba română; realizări de lingvistică teoretică cu aplicaţii in tehnologia limbii române; crearea, completarea, adnotarea şi utilizarea resurselor şi a tezaurelor multilingve, in care una dintre limbi este limba română; alinierea resurselor multilingve de natură diversă, cu accent pe resursele limbii române; aplicaţii ale resurselor multilingve aliniate in traducerea automată, extragerea de informaţii, dezambiguizarea sensurilor,