中国人民大学论坛

 找回密码
 注册[30秒完成]
搜索
查看: 119433|回复: 0

【数据科学职业发展】data science, machine learning, data mining, business an...

[复制链接]
发表于 2017-7-31 10:45:30 | 显示全部楼层 |阅读模式

如今做公司,言必称大数据,否则就显得很out,那么data  science, machine learning, data mining, business analytics, applied statistics, operations research这些时髦词,到底有什么联系和区别呢?从就业的角度,小伙伴们该如何选择?下面蟹老板来简单讲讲:

最近Data Science这个专业非常火,申请竞争也越来越激烈,好在越来越多的学校正在努力开设这个专业,满足小伙伴们日益高涨的学习热情~~有同学可能会担心,过两年这个专业是否会变得人才饱和然后不好找工作?

我认为是不会的:
首先,各行各业都需要data science的人才:市场营销需要分析数据,金融投资需要数据分析,风险管理需要数据分析,医疗系统需要数据分析,电商 、媒体、政府、能源等等,几乎所有重要的领域都越来越离不开数据分析,因此数据科学人才的需求将在未来很长的一段时间持续增长。

再者,数据科学是偏理工的实践类专业,对逻辑能力和动手能力都有较高要求,不是大家都能学明白的,因此人才数量的增长有限,算是门槛较高的专业,不像一些做app、做前端的职业,学习门槛低,人才容易过剩。

最后,数据科学将慢慢发展成一种高级人才的必备工具,无论从事哪个行业,都需要具备一定的数据分析能力,即使不读专门的学位,也建议大家通过上网课来学习这方面的知识和技能,尤其是对于在国内读书的同学,由于我国教育在这方面比较落后,因此要多利用互联网资源,比如youtbue上就有很多免费的教程非常不错。

下面谈谈小白们常有的一些疑问和误区:
1. “我喜欢跟人沟通,不喜欢编程,因此不适合学数据科学。”
实际上从事数据科学工作,往往需要很强的沟通能力和business acumen,而编程只是辅助技能,不是决定性的,在职业生涯中后期,能脱颖而出的data scientist都是具备很强的沟通能力、解决问题的能力,而且一般都有自己深钻的领域,比如金融行业、医疗行业、电商平台等等。从漫长的职业发展道路来看,编程只是一座小小的山丘,后面还有连绵不绝的高山等着大家去征服。此外,据我观察,大部分声称“我擅长跟人沟通,不喜欢搞技术的”人,只是因为喜欢跟人聊天而产生了自己擅长跟人沟通的幻觉,实际情况往往是既没有一技之长,也不擅长跟人沟通,请大家注意“话痨”和“商务谈判能力”、“营销能力”的区别,前者是毛病,后者才是技能,不要加错了属性点。

2. 常见名词解释:
Machine Learning(机器学习):听起来比较高级的前沿技术,实际上机器学习的核心算法就那么几个,也不是什么新发明,有编程基础的同学花上一两月就基本搞懂了,而且实际工作中,一般不会让你自己去实现某个算法的,有很多开源的库可以直接用,关键之处往往是获取和筛选出高质量的数据,有了好数据,具体用哪个算法其实差别都不大。

Data Mining(数据挖掘):主要是用模式识别和特征识别技术,从海量数据中找出有价值的信息或信息之间的联系,比如我们浏览亚马逊的网站时会留下很多记录,在某个页面的停留时间、购买特定产品的频率等等,有了这些原始数据,我们就可以对用户的访问和消费数据进行模式匹配,筛选出各类优质客户,为其推荐定制化的产品和服务。在实际工作中,需要用到一些基本的统计学知识,然后有不少现成的工具可以使用,比如Rapid Miner。

Predictive Modeling(预测建模):基于统计学的实际应用,主要是设计统计模型,根据过去的数据预测未来的数据,比如根据过去的销量预测未来的销量,从而优化原材料的采购、运输线路的部署等等。

Applied Statistics(应用统计学):所谓“应用”,在实际工作中,一般是使用STATA, SAS,R这样的统计分析工具和编程语言分析数据,听起来没有data science, machine learning那么酷,实际学的东西有很多交叉的地方,从留学申请的角度,applied statistics一般设置在统计学院下面,学的东西相对窄一点,不如data science综合性强。

Quantitative Investment(量化投资):简单来说,就是通过编写计算机程序辅助投资决策,比如通过分析公司的价格、财务报表信息,选出符合指标的股票,不一定要使用程序自动交易才算量化投资,可以用计算机程序分析,然后人工买卖,也属于量化投资。另外听起来比较高级的高频交易,实际上是量化投资中非常小众的一个分支,资金量一大就不好使了,因此发展空间其实不大。

Business Analytics(商业分析):商学院开出来的专业,没有data science技术性那么强,适合商科出身没有编程经验的小伙伴,就业面比data science窄一些,也就是说data science出来的人可以胜任BA的工作,BA的不一定能干data science的工作。

Operations Research(运筹学):从统计学演化出来的一个专业,最早哥大的data science项目发的是operations research的学位,可见联系紧密,相对来说,OR更侧重大型企业的decision-making和process optimization,比data science更传统一些。

3. 自学资源推荐:
小象学院:
国内最好的数据科学网课平台,团购一节课400左右,质量很高

Python学习(英文网站,视频+文字教程):pythonprogramming.net
一个自由职业者做的Python教学网站,内容很全,从Python基础到机器学习到量化投资都有涉及,强烈推荐,一节课10多分钟左右,适合每天看一点

蟹老板书单(量化投资+数据科学):


需要留学申请服务的小伙伴请加微信(xieqiao1218)预约咨询,预约请注明“留学申请”,本人是布朗大学CS系2010年毕业的校友,仅限数据科学、商业分析、量化金融、CS等相关专业。
您需要登录后才可以回帖 登录 | 注册[30秒完成]

本版积分规则

手机访问本页请
扫描左边二维码
         本网站声明
本网站所有内容为网友上传,若存在版权问题或是相关责任请联系站长!
站长电话:0898-66661599    站长联系QQ:7123767   
         站长微信:7123767
请扫描右边二维码
www.jtche.com

手机版|小黑屋|中国人民大学论坛 ( 渝ICP备17000839号-9 )

GMT+8, 2024-4-18 19:00 , Processed in 0.014691 second(s), 16 queries .

Powered by 校园招聘信息---重庆爱这代科技有限公司

© 2001-2020 中国人民大学论坛校园招聘

快速回复 返回顶部 返回列表