导航
导航

Spark快速大数据分析—读书笔记(三)

单独划分一章一来是为了凑篇幅(手动滑稽)二来是个人谈谈近两年大热的机器学习(微小见解)。

机器学习是一个多领域交叉的学科。本书介绍的机器学习不足以涵盖所有,所以有想了解机器学习可以先看看ng教授的斯坦福公开课。

在业务中,机器学习应用场景大部分是三个方面:
1、分类问题:比如垃圾邮件识别、广告点击行为预测等
2、聚类问题:比如用户画像
3、推荐问题:最著名的就是互联网电商行业推荐系统

目前笔者还是个门外汉,还在学习ing,就简单说下我计划的学习路线,供参考
1、数学(大学数学好的跳过)
高数+线代+概率论与数理统计 “三驾马车”
2、语言学习
推荐Python,如果你是土豪你可以上MATLAB,没毛病老铁
3、课程学习
ng大神的公开课
4、书籍学习
周志华老师《机器学习》
李航老师《统计学习方法》
5、进阶
到这之前只是个入门(扎心了,老铁)
根据你的计划方向先选择你的学习路线了,我也帮不你了 哈哈