三国演义简单分析
- demo_KGsegmenter.ipynb:演示知识库+字典树辅助jieba分词的notebook
- link_getting.py:知识库+字典树完成实体统计,并且建立人物联系网络。
- name_data.xlsx:三国主要人物姓、名、字知识库。从网络上收集并整理。
- ./三国演义:三国演义120回文本文件
- TSNE_node2vec.html:将三国人物连接网络使用node2vec化为embedding,再用TSNE降至2维,最后使用pyecharts进行散点图可视化。【按照国家区分】
- TSNE_node2vec_DBSCAN.html:散点构造过程同上,并且使用DBSCAN对点进行聚类。