通过Cloudera公司提供的数据科学培训和认证,将您的知识提升到一个新的水平。
数据科学家帮助政府、企事业单位及科研院校创建大数据时代的新型信息平台,用于对海量数据进行深度挖掘、从中提取有用的信息,用于回答以前无法解决甚至是无法想象的问题。
学员将学习数据科学家是如何使用Hadoop和Spark技术来帮助企业改进现有产品、开发新产品新应用,留住用户并开拓市场,降低成本,提高收益,发现和带来新的商业机会。
Cloudera大学为期3天的数据科学家课程帮助学员理解什么是数据科学家,他们解决什么样的问题,以及使用何种高效工具和新技术。通过课堂模拟,学员学会如何运用数据科学的方法来应对并解决现实中来自不同行业的挑战,为以后胜任数据科学家的角色做好准备。
一. 培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
二. 培训对象及学员基础
本课程面向软件开发人员、大数据工程师以及高级数据分析人员。学员需掌握使用Linux环境的基本技能,建议具备Hadoop方面的基本知识或经验:HDFS,MapReduce,HadoopStreaming,以及ApacheHive等,并能熟练使用至少一种脚本编程语言,建议Python,或者熟悉其他语言譬如Perl或Ruby。
三. 数据科学家认证
在完成本课程的学习后,我们鼓励培训学员继续深造并注册参加Cloudera认证专家:数据科学家(CCP:DS)考试。获得该认证可以让学员脱颖而出;它可以帮助学员成为该领域的精英,并向雇主和客户提供与您的专业知识相关的确凿证据。
四. 课程大纲
1. 引言
2. 数据科学概述
3. 使用案例
4. 项目生命周期
5. 数据采集
6. 评估输入数据
7. 数据转换
8. 数据分析和统计方法
9. 机器学习的基础知识
10. 推荐系统概述
11. Apache Spark和MLlib简介
12. 通过MLlib实现推荐系统
13. 实验和评估
14. 生产部署和超越
15. 总结
Cloudera大数据课程体系