通过Cloudera公司提供的Hadoop和企业数据中心培训,将您的知识提升到一个新的水平并有助于您解决实际问题。
Cloudera大学提供的为期3天的检索培训课程是专门针对希望在Hadoop中索引数据以实现更强大的实时查询功能的开发人员和工程师而设计的。培训学员将学习如何通过将Cloudera检索系统与外部应用程序进行整合,以挖掘他们的数据更多的价值。
提升您的生态系统专业知识
Cloudera检索系统具备全文本、交互式搜索功能,并且具备针对Hadoop和企业数据中心的可扩展、灵活索引功能。Cloudera检索系统由Apache Solr提供技术支持,可以针对新一代集成式、多工作负载查询提供规模性和可靠性。
一. 培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
二. 培训对象及学员基础
本课程是专门针对至少基本了解Hadoop和具备通用语言(例如Java、C、C ++、Perl或Python)编程经验的开发人员和工程师设计的。培训学员应非常熟悉Linux命令行,并且应该能够执行基本任务(例如,创建和删除目录、查看和更改文件权限、执行脚本、并检查文件输出)。不要求培训学员必需具备Apache Solr或Cloudera检索系统使用经验,同时也不要求具备HBase或SQL使用经验。
三. 课程大纲
1. Cloudera Search概述
2. 执行基本查询
3. 编写功能更强大的查询
4. 准备索引文档
5. 通过MapReduce批量索引HDFS数据
6. 通过Flume的近实时索引
7. 通过Lily索引HBase数据
8. 以其他语言和格式索引数据
9. 内容提取
10. 提高搜索质量和性能
11. 构建搜索用户界面
12. 应用程序中
13. 部署注意事项
14. 结论
Cloudera大数据课程体系