Code Monkey home page Code Monkey logo

nlp's Introduction

lhy-nlp

如果您喜欢,请点一下star,我会持续更新其他好玩的东西。

各种nlp 工具的使用包括 word2vec nltk textblob crf++ 等

(1)机器人
(2)中文翻译,及繁体转简体
(3)关键词提取,主题提取,摘要提取
(4)命名体识别
(5)分词
(6)情感分析,正负类分析
(7)近义词,同义词,句子相似性
(8)聚类,监督,无监督
(9)词性标注
(10)词向量提取
.
├── chatbot   #########################机器人
│   ├── __init__.py
│   └── readMe.txt
├── chinese_trans ################ 中文翻译,及繁体转简体
│   ├── __init__.py
│   ├── readMe.txt
│   └── snowNlp
│       ├── chinese_to_fanti.py
│       ├── chinese_to_pinyin.py
│       ├── __init__.py
│       └── readMe.txt
├── keywords_summary_topic  ###########关键词提取,主题提取,摘要提取
│   ├── __init__.py
│   ├── jieba
│   │   ├── __init__.py
│   │   └── keywords.py
│   ├── readMe.txt
│   ├── snowNlp
│   │   ├── __init__.py
│   │   └── keyword_summary.py
│   └── Word2vec
│       ├── deerwester.dict
│       ├── deerwester.mm
│       ├── deerwester.mm.index
│       ├── example.py
│       ├── foo.tfidf_model
│       ├── __init__.py
│       ├── lda_corpus.mm
│       ├── lda_corpus.mm.index
│       ├── lsi_corpus.mm
│       ├── lsi_corpus.mm.index
│       ├── model.lda
│       ├── model.lda.expElogbeta.npy
│       ├── model.lda.id2word
│       ├── model.lda.state
│       ├── model.lsi
│       ├── model.lsi.projection
│       ├── text1.txt
│       ├── text2.txt
│       └── text3.txt
├── named\ _entity_\ recognition #################命名体识别
│   ├── crf
│   │   ├── 199801.txt
│   │   ├── create_corpus.py
│   │   ├── crf_model_1
│   │   ├── curpus.txt
│   │   ├── doc.py
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   └── train_and_test.py
│   ├── __init__.py
│   └── readMe.txt
├── participle       ########################分词
│   ├── crf
│   │   ├── 199801.txt
│   │   ├── crf_model
│   │   ├── crf_model_1
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   ├── setp_1.py
│   │   ├── setp_2.py
│   │   ├── test_input.txt
│   │   ├── test_output.txt
│   │   └── train.data
│   ├── __init__.py
│   ├── jieba
│   │   ├── fenci.py
│   │   ├── __init__.py
│   │   ├── stopdict.txt
│   │   └── userdict.txt
│   ├── readMe.txt
│   └── snowNlp
│       ├── __init__.py
│       └── words_sentences.py
├── sentiment_analysis ###########################情感分析,正负类分析
│   ├── __init__.py
│   ├── readMe.txt
│   └── snowNlp
│       ├── __init__.py
│       └── sentiment_test.py
├── similarity    #########################近义词,同义词,句子相似性
│   ├── __init__.py
│   ├── readMe.txt
│   ├── snowNlp
│   │   ├── __init__.py
│   │   └── sentence_similarity.py
│   └── Word2vec
│       ├── __init__.py
│       ├── sentences
│       │   ├── __init__.py
│       │   ├── lsi_corpus.mm
│       │   ├── lsi_corpus.mm.index
│       │   ├── lsi_similarity.sim
│       │   ├── model.lsi
│       │   ├── model.lsi.projection
│       │   ├── mydict.dict
│       │   ├── readMe.txt
│       │   ├── sentences_similer.py
│       │   ├── train_corpus.txt
│       │   └── train.py
│       └── words
│           ├── chinesewords.txt
│           ├── corpus.txt
│           ├── create_vec.py
│           ├── __init__.py
│           ├── plot.py
│           ├── readMe.txt
│           ├── read_vec.py
│           ├── remove_stopwords.py
│           ├── stopdict.txt
│           ├── wordvec_c.model
│           └── wordvec.model
├── text_classifier  ################聚类,监督,无监督
│   ├── __init__.py
│   ├── nltk
│   │   ├── example.py
│   │   ├── __init__.py
│   │   └── readMe.txt
│   ├── readMe.txt
│   ├── sklearn
│   │   ├── data_baoxian.json
│   │   ├── data.json
│   │   ├── example_1.py
│   │   ├── example_2.py
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   ├── stop_baoxian.txt
│   │   ├── stopword.txt
│   │   └── test.py
│   └── textblob
│       ├── female.txt
│       ├── __init__.py
│       ├── male.txt
│       ├── readMe.txt
│       ├── test2.py
│       └── test3.py
├── word_tagging   #################词性标注
│   ├── crf
│   │   ├── 199801.txt
│   │   ├── create_curpus.py
│   │   ├── crf_model_1
│   │   ├── curpus.txt
│   │   ├── doc.py
│   │   ├── __init__.py
│   │   ├── readMe.txt
│   │   └── train_and_test.py
│   ├── __init__.py
│   ├── jieba
│   │   ├── __init__.py
│   │   └── word_tagging.py
│   ├── readMe.txt
│   └── snowNlp
│       ├── __init__.py
│       └── test.py
└── word_vector  ######################词向量提取
    ├── __init__.py
    ├── readMe.txt
    └── Word2vec
        ├── chinesewords.txt
        ├── corpus.txt
        ├── create_vec.py
        ├── __init__.py
        ├── read_vec.py
        ├── remove_stopwords.py
        ├── stopdict.txt
        ├── wordvec_c.model
        └── wordvec.model

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.