初步介绍Python与Jupyter Notebook的用法与实现。
主要通过C4.5决策树来介绍分类算法与监督学习,涉及特征工程的简单处理与数据不平衡问题,并通过优化ROI来理解其商业应用。
主要通过K-Means来入门聚类算法与无监督学习,并试图挖掘消费者群体划分背后的商业含义。
通过Pagerank算法的实现来理解网络问题。
通过Apriori算法来了解关联算法的逻辑。
通过Keras入门来搭建神经网络,并学习初级的模型融合。
注:由于github阅读Jupyter Notebook的功能较差,建议用nbviewer进行打开。可以从https://nbviewer.jupyter.org/github/Cage6666/Big-Data-Application/tree/master/ 链接进入,打开一个Notebook后点击Open in Colab,就直接可以在线使用啦~