通过Cloudera公司提供的ApacheHadoop培训和认证将您的知识提升到一个新的水平。
Cloudera大学提供的针对ApacheHBase为期3天的培训课程可以让培训学员存储和访问海量的多结构化数据,并且每秒的查询速度提升至数十万次。 提升你的生态系统专业知识 ApacheHBase是一款建立在ApacheHadoop基础之上的分布式、可扩展NoSQL数据库。HBase可以将数据存储在由数十亿行和数百万列组成的海量表中,实时地向众多用户和应用程序提供数据服务,并且向用户和应用程序提供快速、随机的读/写存取功能。 一.培训内容 ● 通过讲师在课堂上的讲解,以及实操练习,学员将熟悉Hadoop生态系统,学习主题包括: ● HBase、Hadoop和RDBMS的使用案例和使用场合。 ● 使用HBaseShell直接操作HBase表。 ● 设计优秀HBase架构以实现高效的数据存储和恢复功能。 ● 如何实时地使用JavaAPI插入和检索数据而实现与HBase的连接。 ● 适用于识别和解决性能瓶颈的实践。 二.培训对象及学员基础 本课程适合打算使用HBase的开发员和管理员。拥有数据库和数据建模的先前经验对于学习本课程是有帮助的,但不是必需的。本课程要求培训学员具备Java知识。对于参加本培训课程而言,Hadoop先验知识不是必需的,但是Cloudera公司开发类的培训可以作为本课程的前序课程。 三.课程大纲 1. Hadoop和HBase介绍 ● 什么是大数据 ● Hadoop介绍 ● Hadoop组件 ● 什么是HBase ● 为什么使用HBase ● HBase的优势 ● 生产中的HBase ● HBase的弱点 2. HBaseTables ● HBase概念 ● HBaseTable基础知识 ● 表设计思考 3. HBaseShell ● 通过HBaseShell创建表 ● 表的使用 ● 表数据的使用 4. HBase架构基础知识 ● HBase区域 ● HBase集群架构 ● HBase和HDFS数据本地性 5. HBase模式设计 ● 一般设计考虑 ● 以应用程序为中心的设计 ● 设计HBase行键 ● 其它HBas表功能 6. 基于HBaseAPI的基本数据访问 ● 访问HBase数据的选项 ● 创建和删除HBase表 ● 使用Get检索数据 ● 使用Scan检索数据 ● 插入和更新数据 ● 删除数据 7. 更多高级HBaseAPI功能 ● 筛选扫描 ● 实践 ● HBase协同处理器 8. 集群上的HBase ● HBase如何使用HDFS ● 压缩和分割 9. HBase的读取和写入 ● HBase如何写入数据 ● HBase如何读取数据 ● 读取数据的块缓存 10. HBase性能优化 ● 列族注意事项 ● 模式设计注意事项 ● 高速缓存的配置 ● 时间序列和顺序数据的处理 ● 预分割 11. HBase系统管理与集群管理 ● HBase守护进程 ● ZooKeeper注意事项 ● HBase的高可用性 ● HBaseBalancer的使用 ● 使用hbck修复表 ● HBase的安全性 12. HBase的复制和备份 ● HBase的复制 ● HBase的备份 ● MapReduce和HBase集群 13. Hive、Impala与HBase的协同使用 ● Hive、Impala与HBase的协同使用 14. 总结
Cloudera大数据课程体系