ONSV1.0(Octopus News System)章鱼新闻采集系统
#ONS安装说明:
章鱼新闻采集系统是由PHP开发的,需要基本的php服务器环境支持,以及支持MyISAM引擎的Mysql数据库。
安装方法为直接把文件拷备到项目某目录中,在浏览器中访问,根据提示填写相关的数据库信息即自动完成安装。
如果需要重新安装,请先删除Data文件夹中的lock.html,再把install.php拷到根目录下即可。
在添加采集的过程中,需要知道PHP正则知识。
#如何添加一个采集
1、第一步,首先输入采集名称、采集地址(为某一列表页的链接),选择列表编码。点击“提交采集规则”。
2、第二步,点击列表匹配规后面的html图标获取列表链接的经过压缩处理后的html代码,查看源代码,提取编写相关的采集规则
3、第三步,填写其他参数,可以在“点击测试”中根据输出情况调整。
需要注意的是:
1)如果列表页的文章链接不是绝对地址,需要填写列表根链接。
2)选择正确的内容编码,不一定和列表页同一编码类型。
3)列表时间规则年(Y/y)、月(m)、日d)、时(H)、分(i)、秒(s)来替换原字符。
4)匹配顺序是由查看列表匹配规则后面的html源代码的排列中看出来的。
5)内容匹配规则直接在文章内容链接源代码中提取匹配规则即可。如果有缺失字符,可以加上内容右补填充字符
#如何修改插入数据库中的新闻类别
修改Cofig/categoryList.php的返回数组即可。
dewey363 / ons Goto Github PK
View Code? Open in Web Editor NEWThis project forked from byteape/ons
新闻采集系统V1.0