Code Monkey home page Code Monkey logo

xuebusi's Projects

distributed_spider_pku icon distributed_spider_pku

1. 主要分为三个模块,一个爬虫抓取模块,一个是数据处理模块,一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论,利用集群HADOOP抓取网页,分析得出URL集,提取特征URL 3. 网页linux脚本过滤得到原始网页,然后二次过滤得到文本,并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二,得到分词器,然后对文本进行操作,得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类,然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集,并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析,并动态显示WIKI信息,调入显示模块中和用户进行交换

distributed_spider_pku_java icon distributed_spider_pku_java

1. 主要分为三个模块,一个爬虫抓取模块,一个是数据处理模块,一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论,利用集群HADOOP抓取网页,分析得出URL集,提取特征URL 3. 网页linux脚本过滤得到原始网页,然后二次过滤得到文本,并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二,得到分词器,然后对文本进行操作,得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类,然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集,并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析,并动态显示WIKI信息,调入显示模块中和用户进行交换

doracms icon doracms

DoraCMS是基于Nodejs+express+mongodb编写的一套内容管理系统,结构简单,较目前一些开源的cms,doracms易于拓展,特别适合前端开发工程师做二次开发。

douyin-bot icon douyin-bot

😍 Python 抖音机器人,论如何在抖音上找到漂亮小姐姐?

ds-java icon ds-java

基于SSH(Struts2+Spring+Hibernate)搭建的论坛系统,属于一个类似于CSDN或者ITeye论坛的IT技术学习交流论坛,界面简单清爽,易于操作。

dubbo-test icon dubbo-test

一个使用Dubbo实现远程过程调用的小Demo

e icon e

框架采用微服务的设计**,而且各工程易分易合 此框架采用前后台分开,前后台都可以单独部署,前端采用轻量级的扁平化设计(html+javascript+Bootstrap), 会自动针对不同的屏幕尺寸调整页面,使其在各个尺寸的屏幕上表现良好。 后端采用Spring boot、 Spring Cloud,不需要部署WAR 文件,可直接运行jar文件。 系统权限框架采用spring-security oauth2,实现前后台权限校验,权限实现了用户授权和客户端授权。 持久层采用JPA ,能够很好的适应不同数据库,并实现注解式动态查询功能。 数据响应该采用json格式。 服务采用REST形式,能够方便的与手机app进行对接,集成swagger能够在线查看RESTAPI 文档和在线测试服务接口 支持单点登录,可以多系统进行菜单集成,形成一个portal。 支持高并发和水平扩展,支持Session的统一存储。 项目采用gradle构建,能够方便的将各项目进行按需组装。

easydeploy icon easydeploy

EasyDeploy——基于SpringBoot+Shell搭建的自动化部署平台,

easyee icon easyee

开源 JavaEE 企业级快速开发平台。提供了 Spring Boot, Struts2, Hibernate, MyBatis, Shiro, EasyUI 等技术,包含完整的权限管理系统等。提供自动化代码生成器。 Open source JaveEE enterprise-class rapid development of the basic platform. Integration of Spring Boot, Struts2, Hibernate, MyBatis, Shiro, EasyUI and other technologies, including the integrity of the rights management. Provides an automated code generator.

easyreport icon easyreport

A simple and easy to use Web Report System for java.EasyReport是一个简单易用的Web报表工具(支持Hadoop,HBase及各种关系型数据库),它的主要功能是把SQL语句查询出的行列结构转换成HTML表格(Table),并支持表格的跨行(RowSpan)与跨列(ColSpan)。同时它还支持报表Excel导出、图表显示及固定表头与左边列的功能。

easyuiex icon easyuiex

jQuery EasyUI 简化扩展架构插件, 在进行项目开发时使用jQuery EasyUI + EasyUIEx 架构能大大简化EasyUI框架使用的复杂性,尤其在各种数据网格的CRUD方面,做了高度封装。Simplify&Extended Architecture plugin

edeploy icon edeploy

基于 Nginx 的 Java Web 项目灰度发布框架

edusoho icon edusoho

EduSoho是杭州阔知网络科技有限公司推出的开源、免费的互联网教育产品,帮助企业、个人快速建立互联网教育网站。本开源软件简洁易用,定制性强,是开展互联网教学、销售、推广的最好的选择。

elasticsearch-mysql icon elasticsearch-mysql

简单实用的同步工具,实现mysql数据库中数据定期同步到elasticsearch,只需简单的配置,便能达到非凡的效果,支持elasticsearch 5.X版本

es icon es

JavaEE项目开发脚手架

fileutil icon fileutil

自定义File工具类,实现文件的读取,复制,删除等功能。

flask-movie icon flask-movie

用Flask开发的电影网站前台和后台管理系统,包含完整前端和后端源码。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.