Code Monkey home page Code Monkey logo

Chang che's Projects

ai_wiki icon ai_wiki

AI实践:各类知识和样例汇总,包括股票量化交易、编程、机器学习、 深度学习、强化学习、图神经网络,语音识别、NLP和图像识别等

authority-data icon authority-data

官方权威数据:统计年签,统计公报,互联网行业报告,工信部数据,ICT报告等 Official authoritative data (Chinese)

bourse icon bourse

深圳-上海证券交易所爬虫-处理PDF-DOC-DOCX-HTML等等

buddhism icon buddhism

各种佛教资料汇集,包括:阿含经、南传巴利文三藏、小乘部派佛教、大乘佛教、中土佛教、藏传佛教等。

cnki-data-analysis icon cnki-data-analysis

请切换分支到Django-vue!!!毕业设计-**知网(cnki)爬虫及数据可视化,采用Django和Celery将爬虫内置在网站内,展示实时爬取的数据

cnki_patent_svm icon cnki_patent_svm

文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据**知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取前3000个词语形成语义词典,然后根据观察设置停用词。然后再用TF-IDF的方式对每个摘要进行词频选取,通过布尔模型,对比语义词典生成文本向量。然后对标签进行数字化转换。取90%的文本为训练集,10%的文本为测试集。用有监督学习的SVM算法对文本进行分类,(人类生活必需品、作业运输、化学冶金、纺织造纸、固定建筑物、机械工程、物理学、电学)分成8类

crawlcnki icon crawlcnki

用于爬取知网上指定期刊从2012年到2020年所有发表文献的信息,包括篇名、作者、期刊名、发表时间、被引用量、被下载量

crawlproject icon crawlproject

python爬虫项目合集,从基础到js逆向,包含基础篇、自动化篇、进阶篇以及验证码篇。案例涵盖各大网站(xhs douyin weibo ins boss job,jd...),你将会学到有关爬虫以及反爬虫、自动化和验证码的各方面知识

datascienceassignment icon datascienceassignment

数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图

hamulete icon hamulete

🏔️国立**大学、新加坡国立大学、早稻田大学、东京大学,**研究院(**)以及**重点高校及科研机构,社科、经济、数学、博弈论、哲学、系统工程类学术论文等知识库。

hanlp icon hanlp

中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

meaf-book icon meaf-book

《现代企业架构框架白皮书》数字化转型底层方法论 V4 的文本拆解版,个人学习目的

nlp-dictionary icon nlp-dictionary

情感词典、停用词典、同义词典、程度词典、否定词典、敏感词典

paper icon paper

爬取了三千条论文,并仿照一般论文网站编写了论文查询系统,可以根据题目,关键词,年份以及所属会议查询论文 利用python分析的论文摘要,提取出关键词,形成关键领域TOP10,并通过词云图与图表的形式展示,实现了词云图与图表的联动

react-native-awesome icon react-native-awesome

React Native 学习资源精选仓库(汇聚知识,分享精华)汇集了各类react-native学习资料、工具、组件、开源App、资源下载、以及相关新闻等,只求精不求全。

scopus_api_examples icon scopus_api_examples

Examples of retrieving publication information from Scopus using Scopus API and Elsapy

spiderforwebofscience icon spiderforwebofscience

python写的一个小爬虫,爬取web of science的文献信息,包含"title","作者全名", "作者简写","关键词","摘要"一切网页上有的信息,并转成CSV信息表格存储。还有下载web of science存有的pdf文献文件功能。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.