零基础自学如何成为合格的数据挖掘工程师?
强烈推荐两门公开课,难度很低,讲得非常好。学完了应该可以直接上手干活。
1. BerkeleyX: CS190.1x Scalable Machine Learning CS190.1x Course Info
这门课是伯克利开的,教机器学习基础、Python Spark实现。我很懂机器学习,但不懂spark和python,花了1周多时间看完视频、做完作业。如果没机器学习基础的话几周应该够了。学完了可以用spark处理大数据,做分类、推荐系统。
- 在墙内搭建虚拟机环境有困难,装不好可以参照帖子 不用翻墙和等几小时,搞定VM安装
- 要是怎么装都不成功,原因很可能是没有开Intel Virtualization,需要进BIOS设置一下。我们好几个人都遇到这问题了。
- 这个里面的视频很卡,但是可以下载。希望有好心人下载传网盘或者优酷~
更新:新的课已经开始了,这次的不需要在本地装虚拟机,直接用databricks的服务器就好,方便很多。而且这次是半年内上一系列的Spark课程,有兴趣可以全学了。
链接:
CS105x Course Info2. 斯坦福公开课:
Convolutional Neural Networks for Visual Recognition
CS231n Convolutional Neural Networks for Visual Recognition优酷视频: 优酷网-中国第一视频网,提供视频播放,视频发布,视频搜索
这是我见过的讲神经网络最清楚最简单的课程,lecturer口才极好,英语说的清晰,配套的讲义说得更清楚明白。如果连作业一起做了,应该有能力用deep learning的工具做一些图像和视觉的工作。
- 课程讲义里有使用Python、IPython做数值计算的快速入门CS231n Convolutional Neural Networks for Visual Recognition
- 作业需要用Python 2,不能用Python 3,除非你乐意像我一样花时间把print全加括号,把cPickle全改成Pickle,还要设置Pickle的编码:Pickle incompatability of numpy arrays between Python 2 and 3
初学者想要深入学习的话,可以顺着两门课的内容、扩展材料继续挖下去。
多说一句,不要报任何班。机器学习牛人要么忙着科研,要么是赚钱太容易,所以几乎没人开培训班来赚钱。有名的培训班,比如J***这样的都是不入流的,以其昏昏使人昭昭。
编辑于 2016-07-05 16:59