Code Monkey home page Code Monkey logo

ud-swl's People

Contributors

borstell avatar moagardenfors avatar robertostling avatar

Watchers

 avatar  avatar  avatar

ud-swl's Issues

Färdigkorrat 409

Nu har jag gått igenom filen "*409.eaf" och korrat det som jag tycker behövts korras (mest smådetaljer). Jag kan nog inte bistå med så mycket mer nu, utan föreslår att Robert genererar html-träd från denna och sen kan de som vill kontrollera träden och se om det ser rätt ut.

Saknade/felaktiga ordklasstaggar

Tack för alla annotationer hittills, jag har lagt in det vi har nu i UD-repot (eftersom det är tre filer med annotationer har jag helt enkelt gjort dem till tränings-, utvecklings- och testmängder).

Här finns visualiseringar av allt: visualiseringar.zip

En sak jag märkte är att det saknas rätt många ordklasstaggar. För tillfället konverteras saknade och felaktiga taggar till skräpkategorin "X" i UD-annoteringen, men helst ska den inte användas i onödan. Dessutom kommer originaltaggarna med i slutversionen också, det är rätt många frågetecken där nu (bokstavligt talat, alltså) som kopieras rakt av från ELAN.

Det här är inte jätteakut, men eftersom det går relativt lätt att kolla ordklasstaggar jämfört med dependensträd kanske det är lika bra att snygga upp där när ni har tid nästa gång.

Annotering: SSLC02_332_UD_MG_161025

Nu blev det många förväxlingar mellan UD- och Link-raderna (första 8 felen).

Warning: invalid head "conj" at index 129
Warning: invalid head "nsubj" at index 174
Warning: invalid head "dobj" at index 104
Warning: invalid head "nummod" at index 81
Warning: invalid head "nummod" at index 78
Warning: invalid head "conj" at index 12
Warning: invalid head "nummod" at index 79
Warning: invalid head "conj" at index 14
Warning: signs 3 and 17 are connected to each other but not to the following signs between them: 12, 14
Warning: signs 76 and 84 are connected to each other but not to the following signs between them: 77, 78, 79, 81
Warning: signs 102 and 109 are connected to each other but not to the following signs between them: 104
Warning: sign 118 is "root" but has index 111
Warning: signs 123 and 143 are connected to each other but not to the following signs between them: 129, 130, 131, 132, 133, 134, 139
Warning: signs 168 and 177 are connected to each other but not to the following signs between them: 173, 174

Annotering: SSLC02_331_UD_MG_161024

Filen som Moa laddade upp idag har ett antal fel enligt konverteringsprogrammet:

Warning: invalid head "case"
Warning: invalid head ""
Warning: invalid head "aux"
Warning: gaps in tree at 22!
Warning: gaps in tree at 79!
Warning: gaps in tree at 103!
Warning: gaps in tree at 159!
Warning: gaps in tree at 171!
Warning: gaps in tree at 191!

De första tre beror nog på att du råkat blanda ihop index- och UD-raderna i några fall.

Resten är en lista över träd (indexnummer för tecken angivna) där annotering saknas eller är felaktig, du kan använda dem som utgångspunkt när du kollar igenom filen nästa gång.

Annotering: index 226--228 i SSLC02_409_UD_CBMWMGCBMG.eaf

Alltså det här trädet (i conllu-format för att det ska bli lättare att överblicka):

1   TITTA-PÅ    _   VERB    VB  _   2   conj    _   _
2   PÅKALLA-UPPMÄRKSAMHET@g _   X   G   _   0   root    _   _
3   TYST    _   ADJ JJ  _   2   discourse   _   _

Adjektiv med discourse-relation verkar konstigt, hur är strukturen här egentligen?

Annotering: SSLC01_391_UD_MG_161027.eaf

Här är felrapport från den senaste filen.

De tre första beror nog på förväxling mellan UD- och Link-raderna.

Resten måste man nog gå in i ELAN för att se vad som är fel.

Warning: invalid head "conj" at index 73
Warning: invalid head "conj" at index 32
Warning: invalid head "conj" at index 62
Warning: signs 19 and 36 are connected to each other but not to the following signs between them: 32
Warning: sign 45 is "root" but has index 42
Warning: signs 54 and 69 are connected to each other but not to the following signs between them: 62, 63, 64
Warning: signs 70 and 85 are connected to each other but not to the following signs between them: 73

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.