Code Monkey home page Code Monkey logo

news-recommendation's Introduction


##

新华社推荐系统v3.0 ####E-mail: [email protected]


###目录


###项目介绍

基于Spark、Spray提供新闻推荐服务(针对用户及用户当前正在浏览的新闻):

  • 新闻推荐接口:根据用户当前正在浏览的新闻,以及用户历史浏览记录,调用推荐模型从候选文档集中推荐topK条最新新闻。
  • 日志及中间计算结果保存:按日期存储,用于出错回滚,快速恢复到正常状态。

框架如下: frame


###使用说明

  • bin/boot.sh,功能如下:

    • 停止之前启动的推荐服务,将之前更新的用户向量落盘
    • 根据更新后的用户向量,启动新的推荐服务
  • 新闻推荐查询请求:

curl -X POST -H "Content-Type:appuser_id":"001","key_words":"我们:1"}' "http://10.1.111.15:8488/golaxy/recommend/news/query"
  • 新闻推荐停止服务:
curl -X POST "http://10.1.111.15:8488/golaxy/recommend/news/stop"

###数据说明

  • 用户数据

    • 路径:data/news_user
    • 格式:[user_id]\t[key_word_0]:[frequency_1],[key_word_2]:[frequency_2],...
    • 说明:从左至右分别是,用户id,用户关键词向量。
  • 候选集

    • 路径:data/news_doc
    • 格式:[doc_id]\t[key_word_0]:[frequency_1],[key_word_2]:[frequency_2],...
    • 说明:数据格式从左至右分别是,文档id,文档关键词向量。

###版本更新

  • 2016/09/29

    • 重新设计tf-idf新闻推荐系统,v3.0
  • 2016/03/16

    • 重新设计程序框架,v2.0
    • 添加关键词推荐功能
    • 添加事件推荐功能
  • 2015/08/26

    • 添加bin/merge.sh
    • 添加bin/boot.sh
    • 重写离线计算(增量式更新)和在线推荐模块
    • 增加候选文档集更新功能
  • 2015/08/18

    • 离线在线处理的分词组件改用Ansj。
    • 返回的结果根据JaccardSimilarity进行去重。
  • 2015/08/17

    • 限制用户向量长度
    • 对向量进行归一化
  • 2015/08/12

    • 更改用户向量计算方式
  • 2015/08/11

    • 优化tf-idf计算
    • 代码整理,去除冗余
  • 2015/08/10

    • 离线处理部分完成
      • 历史新闻文档向量计算
      • 候选新闻文档向量计算
      • 用户向量计算
        • 根据数据集提取关键词构造用户向量
        • 根据tf-idf排序提取关键词构造用户向量
    • 在线处理部分完成
      • 计算context_vector
      • 计算context_vector与候选新闻文档向量相似度

news-recommendation's People

Contributors

houjp avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.