Dependency Grammar Annotator (DGA) este un instrument conceput pentru a facilita operatia de adnotare sintactica a textelor (a unui corpus) in cadrul formal al gramaticilor de dependenta.
Conform
EAGLES : "Adnotarea
sintactica este actiunea prin care se adauga informatii sintactice unui
corpus, incorporand in text indicatori ai structurii sintactice cum ar fi: parantezari
etichetate sau simboluri care sa indice relatiile de dependenta dintre
cuvine". Desi foarte folositoare in practica (testarea diverselor teorii
gramaticale, achizitionarea automata de gramatici etc.) aceste corpusuri sunt
costisitoare deoarece operatia de adnotare sintactica este mare consumataore de
timp si efort din partea celui / celor care adnoteaza. DGA a fost proiectat cu scopul de a minimiza efortul uman
depus pe parcursul procesului de creare a unui corpus.
DGA este o interfata grafica usor de folosit care permite crearea si manipularea eficienta a structurilor sintactice. Deoarece formalismul in care se lucreaza este cel al gramaticilor de dependenta. aceste structuri sintactice constau in relatiile de dependenta formate din cuvintele unei propozitii etichetate cu partile de vorbire corespunzatoare si relatiile gramaticale care exista intre aceste cuvinte. In mod traditional relatiile de dependenta sunt indicate prin arce care leaga cuvantul dependent de cel pe care il determina, arcele fiind etichetate cu numele relatiei care exista intre cuvintele pe care le leaga. O astfel de reprezentare grafica (fiind conforma si cu recomandarile EAGLES) este folosita de DGA ca suport pentru opearatia de adnotare.
Pe tot parcursul procesului de adnotare, utilizatorul opereaza direct asupra acestei reprezentari grafice. Datorita acestui lucru, in afara comoditatii in utilizare, creste si acuratetea adnotarii, deoarece utilizatorul are un feedback grafic imediat in ceea ce priveste orice schimbare pe care o face in structura sintactica. Operarea asupra structurii sintactice este extrem de usoara si intuitiva: pentru a crea o relatie de dependenta este nevoie doar de doua clicuri de mouse (pe cele doua cuvinte intre care se doreste crearea relatiei), iar pentru etichetarea unui cuvant cu o parte de vorbire sau pentru stabilirea tipului unei relatii de dependenta este nevoie doar de un clic si selectarea dintr-o lista a etichetei respective. Astfel, DGA permite o adnotare rapida a textelor.
Consideram ca DGA raspunde la cerintele pe care Marcus si altii le-au identificat ca fiind importante in cadrul procesului de adnotare:
Acuratetea -datorata faptului ca se lucreaza direct asupra reprezentarii grafice si datorita feedbackului grafic imediat pe care DGA il ofera utilizatorului.
Viteza - crearea si manipularea relatiilor de dependenta se face extrem de rapid cu ajutorul mouse-ului.
Consistenta - utilizatorul isi stabileste setul de parti de vorbire si relatii de dependenta dupa care, pentru a le folosi, nu trebuie decat sa le selecteze din diferite liste.
>Dependency Grammar Annotator |