整理出一些代码,如基础的排序、以及一些其它有意思的工具或算法,目的有二:(1)学习(2)备忘
算法相关,包含:
- 排序
- 编辑距离计算
- 用于纠错词的BKTree
数据结构相关(部分代码不完善),包含:
- 二叉搜索树
- KD树
- 字典树
- 图
词法分析句法分析的工具GIT上一堆,如Hanlp、LTP等等,这边主要给出一些不一样的:
- 拼音/汉字转换
- 简体/繁体转换
- 汉字单元拆分
- 相似汉字查找
- 基于互信息熵的新词发现
LTP因为是c的项目,个人也基于LTP官方的LTP4J给出自己的一个教程,以及编译好的动态链接文件。
个人有一个烦恼,经常看到一些好的博客,里面有多篇文章都不错,短时间又看不完,怎么办呢,这个时候很想将这个这些html页面打包生成pdf