robertostling / ud-swl Goto Github PK
View Code? Open in Web Editor NEWUniversal Dependencies for Swedish Sign Language
License: GNU General Public License v3.0
Universal Dependencies for Swedish Sign Language
License: GNU General Public License v3.0
Nu har jag gått igenom filen "*409.eaf" och korrat det som jag tycker behövts korras (mest smådetaljer). Jag kan nog inte bistå med så mycket mer nu, utan föreslår att Robert genererar html-träd från denna och sen kan de som vill kontrollera träden och se om det ser rätt ut.
Tack för alla annotationer hittills, jag har lagt in det vi har nu i UD-repot (eftersom det är tre filer med annotationer har jag helt enkelt gjort dem till tränings-, utvecklings- och testmängder).
Här finns visualiseringar av allt: visualiseringar.zip
En sak jag märkte är att det saknas rätt många ordklasstaggar. För tillfället konverteras saknade och felaktiga taggar till skräpkategorin "X" i UD-annoteringen, men helst ska den inte användas i onödan. Dessutom kommer originaltaggarna med i slutversionen också, det är rätt många frågetecken där nu (bokstavligt talat, alltså) som kopieras rakt av från ELAN.
Det här är inte jätteakut, men eftersom det går relativt lätt att kolla ordklasstaggar jämfört med dependensträd kanske det är lika bra att snygga upp där när ni har tid nästa gång.
Nu blev det många förväxlingar mellan UD- och Link-raderna (första 8 felen).
Warning: invalid head "conj" at index 129
Warning: invalid head "nsubj" at index 174
Warning: invalid head "dobj" at index 104
Warning: invalid head "nummod" at index 81
Warning: invalid head "nummod" at index 78
Warning: invalid head "conj" at index 12
Warning: invalid head "nummod" at index 79
Warning: invalid head "conj" at index 14
Warning: signs 3 and 17 are connected to each other but not to the following signs between them: 12, 14
Warning: signs 76 and 84 are connected to each other but not to the following signs between them: 77, 78, 79, 81
Warning: signs 102 and 109 are connected to each other but not to the following signs between them: 104
Warning: sign 118 is "root" but has index 111
Warning: signs 123 and 143 are connected to each other but not to the following signs between them: 129, 130, 131, 132, 133, 134, 139
Warning: signs 168 and 177 are connected to each other but not to the following signs between them: 173, 174
Filen som Moa laddade upp idag har ett antal fel enligt konverteringsprogrammet:
Warning: invalid head "case"
Warning: invalid head ""
Warning: invalid head "aux"
Warning: gaps in tree at 22!
Warning: gaps in tree at 79!
Warning: gaps in tree at 103!
Warning: gaps in tree at 159!
Warning: gaps in tree at 171!
Warning: gaps in tree at 191!
De första tre beror nog på att du råkat blanda ihop index- och UD-raderna i några fall.
Resten är en lista över träd (indexnummer för tecken angivna) där annotering saknas eller är felaktig, du kan använda dem som utgångspunkt när du kollar igenom filen nästa gång.
Alltså det här trädet (i conllu-format för att det ska bli lättare att överblicka):
1 TITTA-PÅ _ VERB VB _ 2 conj _ _
2 PÅKALLA-UPPMÄRKSAMHET@g _ X G _ 0 root _ _
3 TYST _ ADJ JJ _ 2 discourse _ _
Adjektiv med discourse
-relation verkar konstigt, hur är strukturen här egentligen?
Här är felrapport från den senaste filen.
De tre första beror nog på förväxling mellan UD- och Link-raderna.
Resten måste man nog gå in i ELAN för att se vad som är fel.
Warning: invalid head "conj" at index 73
Warning: invalid head "conj" at index 32
Warning: invalid head "conj" at index 62
Warning: signs 19 and 36 are connected to each other but not to the following signs between them: 32
Warning: sign 45 is "root" but has index 42
Warning: signs 54 and 69 are connected to each other but not to the following signs between them: 62, 63, 64
Warning: signs 70 and 85 are connected to each other but not to the following signs between them: 73
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.