Code Monkey home page Code Monkey logo

grammardb's People

Contributors

alex73 avatar koshul avatar viaczaslau avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

grammardb's Issues

Пытанні па парадыгмах pdgId="1237722" і pdgId="1086290"

Вітаю, маю пытанні па адзначаных парадыгмах:

pdgId="1237722"

Файл: N1.xml, радок 309623:

<Paradigm pdgId="1237722" lemma="генера+л-маёр" tag="NCAPBM1">
        <Variant id="a" lemma="генера+л-маёр" slouniki="piskunou2012:43211" pravapis="A2008">
            <Form tag="NS">генера+л-маёр</Form>
            <Form tag="GS">генера+л-маёра</Form>
            <Form tag="DS">генера+л-маёру</Form>
            <Form tag="AS">генера+л-маёра</Form>
            <Form tag="IS">генера+л-маёрам</Form>
            <Form tag="LS">генера+л-маёре</Form>
            <Form tag="NP">генера+л-маёры</Form>
            <Form tag="GP">генера+л-маёраў</Form>
            <Form tag="DP">генера+л-маёрам</Form>
            <Form tag="AP">генера+л-маёраў</Form>
            <Form tag="IP">генера+л-маёрамі</Form>
            <Form tag="LP">генера+л-маёрах</Form>
        </Variant>
    </Paradigm>

Маю пытанні да формы tag="LS": як я ведаю, мяккая р не характэрная для беларускай мовы, таму гэтая форма выклікала ў мяне пытанні. Іншыя ж парадыгмы, што маюць у сабе частку «маёр» (1173581, 1256551, 1133162) маюць у LS формах канчатак -у:

  • <Form tag="LS" slouniki="nazounik2008,sbm2012">інжыне+р-маёру</Form>
  • <Form tag="LS">прэм'е+р-маёру</Form>
  • <Form tag="LS" slouniki="nazounik2008,sbm2012">секу+нд-маёру</Form>

Ці не з’яўляецца гэта нейкай памылкай?

pdgId="1086290"

Файл: A2.xml, радок 451832:

<Paradigm pdgId="1086290" lemma="рібанукляінавы" tag="ARP">

Дадзенага слова я не знайшоў нідзе, у тым ліку і ў граматычнай базе, што сюды спасылаецца. У той жа час у розных слоўніках, а таксама ў той самай граматычнай базе можна знайсці слова рыбануклеінавы. Ці не з’яўляецца памылкай гэта?

Абнаўленне базы LanguageTool

Вітаю!

Гэта не issue, а хутчэй пытанне. Я бачу, што LanguageTool спасылаецца на Граматычную базу ў сваім рухавіку праверкі. На колькі я бачу база там ужо адрозніваецца ад той, што можна пабачыць на сайце корпуса.
Дык вось пытанне, базу LanguageTool можна абнавіць выкарыстоўваючы бягучую Граматычную базу, ці гэта адбываецца толькі пасля новага рэлізу граматычнай базы?

Дзякуй за ўвагу

A1957 vs. A2008 у базе

Некаторыя тэгі Variant маюць правапіс, які не супадае с правапісам тэгаў Form:

    <Paradigm pdgId="1039062" lemma="Цэнтрвыбарка+м" tag="NPIIBM1" theme="Імёны ўласныя/Таксаномія/арганізацыі">
        <Variant id="a" lemma="Цэнтрвыбарка+м" slouniki="piskunou2012:208027" pravapis="A2008">
            <Note>Націск выстаўлены праз web/batch</Note>
            <Form tag="NS" pravapis="A1957">Цэнтрвыбарка+м</Form>
            <Form tag="GS" pravapis="A1957">Цэнтрвыбарка+ма</Form>
            <Form tag="DS" pravapis="A1957">Цэнтрвыбарка+му</Form>
            <Form tag="AS" pravapis="A1957">Цэнтрвыбарка+м</Form>
            <Form tag="IS" pravapis="A1957">Цэнтрвыбарка+мам</Form>
            <Form tag="LS" pravapis="A1957">Цэнтрвыбарка+ме</Form>
            <Form tag="NP">Цэнтрвыбарка+мы</Form>
            <Form tag="GP">Цэнтрвыбарка+маў</Form>
            <Form tag="DP">Цэнтрвыбарка+мам</Form>
            <Form tag="AP">Цэнтрвыбарка+мы</Form>
            <Form tag="IP">Цэнтрвыбарка+мамі</Form>
            <Form tag="LP">Цэнтрвыбарка+мах</Form>
        </Variant>
    </Paradigm>

Некаторыя тэгі Variant наогул не маюць інфармацыі аб правапісе:

        <Variant id="a" lemma="берасцяны+">
            <Form tag="MNS" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+</Form>
            <Form tag="MGS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+га</Form>
            <Form tag="MDS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+му</Form>
            <Form tag="MAS">берасцянога</Form>
            <Form tag="MAS" slouniki="prym2009" pravapis="A1957,A2008" options="inanim">берасцяны+</Form>
            <Form tag="MIS" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+м</Form>
            <Form tag="MLS" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+м</Form>
            <Form tag="NNS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+е</Form>
            <Form tag="NGS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+га</Form>
            <Form tag="NDS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+му</Form>
            <Form tag="NAS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+е</Form>
            <Form tag="NIS" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+м</Form>
            <Form tag="NLS" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+м</Form>
            <Form tag="FNS" slouniki="prym2009" pravapis="A1957,A2008">берасцяна+я</Form>
            <Form tag="FGS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+й</Form>
            <Form tag="FGS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+е</Form>
            <Form tag="FDS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+й</Form>
            <Form tag="FAS">берасцяную</Form>
            <Form tag="FAS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+ю</Form>
            <Form tag="FIS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+й</Form>
            <Form tag="FIS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+ю</Form>
            <Form tag="FLS" slouniki="prym2009" pravapis="A1957,A2008">берасцяно+й</Form>
            <Form tag="PNP" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+я</Form>
            <Form tag="PGP" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+х</Form>
            <Form tag="PDP" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+м</Form>
            <Form tag="PAP" slouniki="prym2009" pravapis="A1957,A2008" options="inanim">берасцяны+я</Form>
            <Form tag="PIP" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+мі</Form>
            <Form tag="PLP" slouniki="prym2009" pravapis="A1957,A2008">берасцяны+х</Form>
        </Variant>

Такіх прыкладаў не шмат, але хапае. Таксама ёсць словы без інфармацыі аб націску.

Пытанне пра слоўнік праверкі правапісу

Каталог https://github.com/Belarus/GrammarDB/tree/master/spell утрымлівае толькі адзіны файл A2.xml (словы ад літары "О" да літары "Я"). Файл A1.xml недзе згубіўся?

Таксама https://addons.mozilla.org/en-US/firefox/addon/be-official2008/ і https://github.com/languagetool-org/languagetool/tree/master/languagetool-language-modules/be/src/main/resources/org/languagetool/resource/be/hunspell утрымліваюць прыблізна 1.2M словаформаў. Але файлы XML з базы GrammarDB утрымліваюць прыблізна 2.4M словаформаў. То бок прыблізна паловы словаформаў не хапае. Якім чынам былі выбраны словы для слоўніка праверкі правапісу? Некаторыя рэдкаўжывальныя словы былі наўмысна выкінуты?

Пытанне пра слова "цёрн"

Патрэбна для https://en.wiktionary.org/wiki/цёрн

У GrammarDB няма формы "цярна́", але пошук у інтэрнэце знаходзіць прыклад "Зрабіўся пакутнікам як ад цярна". Ці гэта састарэлая форма, тарашкевіца, або проста памылка ў беларускім перакладзе Бібліі?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.