Code Monkey home page Code Monkey logo

apertium-cat's Introduction

Catalan

apertium-cat

This is an Apertium monolingual language package for Catalan. What you can use this language package for:

  • Morphological analysis of Catalan
  • Morphological generation of Catalan
  • Part-of-speech tagging of Catalan

Requirements

You will need the following software installed:

  • lttoolbox (>= 3.3.0)
  • apertium (>= 3.3.0)
  • vislcg3 (>= 0.9.9.10297)

If this does not make any sense, we recommend you look at: apertium.org

Compiling

Given the requirements being installed, you should be able to just run:

$ ./configure $ make

You can use ./autogen.sh instead of ./configure if you're compiling from SVN.

If you're doing development, you don't have to install the data, you can use it directly from this directory.

If you are installing this language package as a prerequisite for an Apertium translation pair, then do (typically as root / with sudo):

make install

You can give a --prefix to ./configure to install as a non-root user, but make sure to use the same prefix when installing the translation pair and any other language packages.

Testing

If you are in the source directory after running make, the following commands should work:

$ echo "TODO: test sentence" | apertium -d . cat-morph TODO: test analysis result

$ echo "TODO: test sentence" | apertium -d . cat-tagger TODO: test tagger result

Files and data

  • apertium-cat.cat.dix - Monolingual dictionary
  • cat.prob - Tagger model
  • apertium-cat.cat.rlx - Constraint Grammar disambiguation rules
  • apertium-cat.post-cat.dix - Post-generator
  • modes.xml - Translation modes

For more information

Help and support

If you need help using this language pair or data, you can contact:

See also the file AUTHORS included in this distribution.

apertium-cat's People

Contributors

albertonl avatar annaevapeig avatar donissegui avatar e-gomez avatar frankier avatar ftyers avatar gramirez-prompsit avatar hectoralos avatar jaumeortola avatar jordimas avatar juanpabl avatar marcriera avatar mlforcada avatar mr-martian avatar padth4i avatar sandy9999 avatar sushain97 avatar tinodidriksen avatar tradumatica avatar unhammer avatar xavivars avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

apertium-cat's Issues

desambiguar: els fins, els seus fins, els set

Ho apunto perquè no ens passi per alt. Cal arreglar la desambiguació en aquestes frases:

els fins aquí regulats,
els fins, objectius,
aconseguir aquests fins
els set acadèmics.

Preferències: avui/hui

Si creem una preferència per a avui/hui, val_uni es queda només amb diferències de terminacions verbals respecte a val_gva, i estem més a prop d'eliminar una compilació més per a la generació.

missing cat.autopgen-diacritics-vells.bin

Output from trying to build apertium-eng-cat

make: *** No rule to make target `/Users/username/apertium/share/apertium/apertium-cat/cat.autopgen-diacritics-vells.bin', needed by `eng-cat.autopgen-diacritics-vells.bin'.  Stop.

'haver' + adverbi que comença amb 'de'

Una frase com "ha de fet treballat" s'analitza com

$ echo "ha de fet treballat" | apertium -d . cat-disam
"<ha de>"
	"haver# de" vbmod pri p3 sg
"<fet>"
	"fet" n m sg
;	"fer" vblex pp m sg REMOVE:1903
"<treballat>"
	"treballat" adj m sg
	"treballar" vblex pp m sg

Hauria de ser "haver" + "de fet". He intentat solucionar-ho afegint aquesta línia al diccionari, però no ha funcionat:

<e r="LR" lm="haver de fet"><i></i><par n="haver__vblex"/><p><l><b/>de<b/>fet</l><r><j/>de<b/>fet<s n="adv"/></r></p></e>

Un cop solucionat, caldria fer el mateix per a un munt d'adverbis que comencen per "de" ("de co(l)p", "de mica en mica", "de dalt a baix", etc.).

Interrogants a principi de pregunta

Quan traduïm del català al castellà:

Teniu concedida alguna beca o ajut del curs 2020-21? > Tenéis concedida alguna beca o ayuda del curso 2020-21?

Hauríem de dir "¿Tenéis concedida alguna beca o ayuda del curso 2020-21?"

En castellà cal afegir-hi l'interrogant a principi de frase interrogativa.

nomenclàtor IEC

El Nomenclàtor mundial de l'IEC ha canviat la grafia en català d'alguns topònims internacionals. Tant l'ésAdir com l'AVL han començat a seguir aquests criteris. Deixo una llista (copiada de l'ésAdir) dels que sembla que són els canvis més significatius, per a quan tinguem temps de repassar-ho en els diccionaris d'Apertium.

Astana
Bandaaceh
Bengaluru
Dhaka
Donbàs, el
Guiza
Kirguizstan, el
Luhansk
Mississipi
Montreal
Myanmar
Múnic
Pensilvània
Ramal·lah
Yangon
El Salvador
Eswatini
Kenya
Trinidad i Tobago
Vènet, el
Shanghai
Zúric
Sant Feliu Sasserra

pense: indicatiu / subjuntiu

Algunes formes verbals valencianes poden ser ambigües. Es podria millorar la desambiguació, almenys en alguns casos clars.

"perquè ell pense que està resolt" cat-spa
porque él pienso que está resuelto

"perquè Joan pense que està resolt" cat-spa
porque Joan pienso que está resuelto

"perquè el meu amic pense que està resolt" cat-spa
porque mi amigo pienso que está resuelto

Error en make test

En fer "make test" surt un error:

diff --git a/dev/greptests.txt b/dev/greptests.txt
index a0d444f..f267292 100644
--- a/dev/greptests.txt
+++ b/dev/greptests.txt
@@ -1,3 +1,5 @@
+apertium-cat.cat.metadix: <e lm="van Doesburg"><i>van Doesburg</i><par n="Saussure__np"/></e>
+apertium-cat.cat.metadix: <e lm="van Eesteren"><i>van Eesteren</i><par n="Saussure__np"/></e>
 apertium-cat.cat.metadix:<e lm="que " r="RL">     <i>que<b/></i><par n="que__cnjsub"/></e> <!-- "que" afegit en castellà-->
 apertium-cat.cat.metadix:<e r="RL" lm="no tenir raó"><i>no<b/></i><par n="/tenir__vblex"/><p><l><b/>raó</l><r><g><b/>raó</g></r></p></e>
 apertium-cat.cat.metadix:<e lm="no tenir res a veure"><i>no<b/></i><par n="abs/tenir__vblex"/><p><l><b/>res<b/>a<b/>veure</l><r><g><b/>res<b/>a<b/>veure</g></r></p></e>
make: *** [Makefile:808: test] Error 1

Sospito que és perquè s'han afegit dos cognoms amb "van" al diccionari, però no s'han afegit en algun altre lloc.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.