详细解释,请参见利用sklearn训练LDA主题模型及调参详解。其中,主要内容包括:
-
1加载语料库及预处理
-
2CountVectorizer统计词频
-
3LDA主题模型训练
-
4结果展示
-
5Optional调参过程
-
附录:sklearn LDA API 中文解释
P.S. 原代码基于anaconda3编写,依赖python3,nltk以及sklearn,可根据实际情况转换为python2.或升级你的python python2转python3可利用现成工具 " 2to3 -w sample_lda_training.py " " 2to3-2 -w sample_lda_training.py "