Dependency Grammar Annotator (DGA) este un instrument conceput pentru a facilita operatia de adnotare sintactica a textelor (a unui corpus) in cadrul formal al gramaticilor de dependenta. El a fost proiectat cu scopul de a minimiza efortul uman depus pe parcursul procesului de creare a unui corpus.
DGA se bazeaza pe reprezentarea grafica a relatiilor de dependenta. Pe tot parcursul procesului de adnotare, utilizatorul opereaza direct asupra acestei reprezentari grafice. Datorita acestui lucru, in afara comoditatii in utilizare, creste si acuratetea adnotarii, deoarece utilizatorul are un feedback grafic imediat in ceea ce priveste orice schimbare pe care o face in structura sintactica. Operarea asupra structurii sintactice este extrem de usoara si intuitiva: pentru a crea o relatie de dependenta este nevoie doar de doua clicuri de mouse, iar pentru etichetarea unui cuvant cu o parte de vorbire sau pentru stabilirea tipului unei relatii de dependenta este nevoie doar de un clic si de selectarea dintr-o lista a etichetei respective.
Usurinta in folosire: faptul ca se opereaza direct asupra reprezentarii grafice implica o mare usurinta in folosire si o viteza de lucru sporita.
Portabilitate: DGA a fost scris in Java 2. Fiind o aplicatie Java pura, DGA poate rula practic pe orice platforma / sistem de operare pentru care exista mediu de executie Java (JRE) 2. Deoarece foloseste tehnologia pluggable look and feel DGA se va comporta din punctul de vedere al interfetei ca o aplicatie nativa pe platforma pe care ruleaza, astfel utilizatorul fiind deja obisnuit cu elementele de baza ale interfetei: meniuri, butoane, casete de dialog standard etc.
Conformitate cu standardele actuale: DGA respecta recomandarile EAGLES referitoare la adnotarea sintactica. Textele adnotate sunt salvate in format XML, standardul in descrierea datelor adoptat si de comunitatea lingvistica ca modalitate standard de reprezentare a corpusurilor. Desi pentru adnotarea sintactica nu exista inca un set standard de taguri XML, asa cum exista pentru adnotarea morfosintactica XCES, DGA foloseste un set minimal de taguri inspirat din XCES. Astfel, fisierele XML produse de DGA pot fi transformate usor cu ajutorul XSLT in fisiere XML bazate pe alt vocabular (set de taguri) care sa raspunda nevoilor utilizatorului sau sa fie conforme cu un standard viitor.
Flexibilitate: in afara de faptul ca analiza sintactica trebuie sa fie sub forma relatiilor de dependenta, DGA nu impune nici o alta restrictie utilizatorului. Acesta isi poate defini cu usurinta si modifica oricand propriul set de parti de vorbire si relatii de dependenta pe care le va folosi in adnotare.
Pentru mai multe detalii vezi documentatia online |
Puteti pune orice intebare legata de DGA aici |
Daca aveti un browser care suporta Java 2 incercati un demo online |
Puteti de asemenea sa folositi intreaga aplicatie facand un download |
Aici sunt cateva texte adnotate cu acest instrument |