设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 310|回复: 0

广州大数据公开课--Cloudera Administrator CCA131

[复制链接]
发表于 2018-7-4 10:49:41 | 显示全部楼层 |阅读模式


2018年8月16日至8月19日(地点:广东省广州市天河区珠江东路30号)


一、培训特色
  • 标准的课程体系及原厂商认证的授课讲师

与美国同步的原厂课程、经过层层考核的授课讲师,保证了我们的课程的规范化与标准化。大数据技术不同于其他学科技术,非常的新,发展也非常迅速,技术的迭代也使得我们的课程在不断更新。就目前来看,我们的课程涵盖的大数据运维、开发、分析方面,已处于市场领先地位。
  • 课程设计合理

知识体系层层递进,从基础开始逐渐深入,深入浅出授课,使学员更易于学习掌握。理论加实验的授课方式使课程更丰满。
  • 重底层、讲原理

为学员提供虚拟环境实战的同时,不放弃理论深度,以理论带动实际操作,使学员不仅仅只是一个纸上谈兵的理论者,更有动手的实力。
二、培训目标
为期4 天的Hadoop 管理员培训将帮助学员综合理解并全面掌握对Hadoop集群的运维管理,包括:安装,配置、负载平衡及性能调优等。通过该培训,Hadoop系统管理员将能准备好应对实际运维中遇到的挑战。
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:管理集群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。YARN、MapReduce、Spark及HDFS的工作原理。如何为你的集群选取合适的硬件和架构。如何将 Hadoop 集群和企业已有的系统进行无缝集成。如何使用Flume 进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop集群之间进行数据导入导出。如何配置公平调度器为 Hadoop 上的多用户提供服务级别保障。产品环境中 Hadoop 集群的最佳运维实践。Hadoop 集群排错、诊断问题和性能调优。
三、培训对象
面向系统管理员和IT经理,需具备Linux 经验,无需Apache Hadoop 基础。
四、培训证书
培训结束并顺利通过考试后,颁发Cloudera全球认证证书,证书全球通用,证书查询:http://certification.cloudera.com/verify/
证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

五、培训费用
  • 培训费9200元/人,大写人民币玖仟贰佰元整(含授课服务、教材、实验手册、培训期间虚拟机、税票费用)。
  • 考试费2500元/人,大写人民币贰仟伍佰元整(不参加考试无需缴纳考试费)。
    六、培训内容

    
课程介绍
  
    
名称
    
  
Cloudera  Administrator Training for Apache Hadoop
  

    
第一天上午
    
  
Apache Hadoop 介绍   
  
•  Hadoop 动机   
  
•  基本概念   
  
•  Hadoop 核心部件
  
Hadoop 集群安装   
  
•  集群管理方案     
  
•  Hadoop (CDH) 安装
  
Hadoop 分布式文件系统 (HDFS)   
  
•  HDFS 特性   
  
•  读写文件   
  
•  NameNode 内存考虑   
  
•  HDFS 安全简介   
  
•  HDFS Web UI   
  
•  使用 HDFS Shell
  

    
第一天下午
    
  
Hadoop 分布式文件系统 (HDFS)   
  
•  HDFS 特性   
  
•  读写文件   
  
•  NameNode 内存考虑   
  
•  HDFS 安全简介   
  
•  HDFS Web UI   
  
•  使用 HDFS Shell
  
YARN 上的 MapReduce 和 Spark     
  
•  计算平台在 Hadoop 里扮演的角色     
  
•  YARN:集群资源管理器   
  
•  MapReduce 概念   
  
•  Apache Spark 概念   
  
•  Yarn 上的计算平台   
  
•  YARN Web UI 及 Shell   
  
•  YARN 应用运行日志
  

    
第二天上午
    
  
Hadoop 配置及服务运行日志   
  
•  定位配置参数及进行配置变更   
  
•  管理角色实例及添加服务   
  
•  配置 HDFS 服务     
  
•  配置 Hadoop 服务运行日志     
  
•  配置 YARN 服务
  
向 HDFS 导入数据     
  
•  使用 Flume 从外部数据源实时导入数据     
  
•  使用 Sqoop 从关系数据库导入数据     
  
•  REST 接口   
  
•  导入数据的最佳实践
  

    
第二天下午
    
  
Hadoop 集群规划   
  
•  规划考虑因素   
  
•  硬件选择   
  
•  虚拟化选项   
  
•  网络因素   
  
•  节点配置
  
Hive,Impala 及 Pig 的安装及配置   
  
•  Hive   
  
•  Impala   
  
•  Pig Hadoop
  

    
第三天上午
    
  
客户端及 Hue   
  
•  什么是 Hadoop 客户端     
  
•  安装及配置 Hadoop 客户端     
  
•  安装及配置 Hue   
  
•  使用 Hue 进行身份验证及授权
  
集群高级配置   
  
•  高级配置参数   
  
•  Hadoop 端口配置   
  
•  HDFS 机柜感知配置   
  
•  HDFS 高可靠性配置
  

    
第三天下午
    
  
Hadoop 安全   
  
•  Hadoop 安全的重要性   
  
•  Hadoop 安全性概念   
  
•  Kerberos 简介   
  
•  使用 Kerberos 保护 Hadoop 集群   
  
•  其他安全特性
  
资源管理   
  
•  使用静态服务池配置 Linux cgroup   
  
•  公平调度器   
  
•  配置动态资源池   
  
•  YARN 内存及 CPU 设置     
  
•  Impala 查询调度
  

    
第四天上午
    
  
集群维护   
  
•  检查 HDFS 状态     
  
•  集群间复制数据   
  
•  添加/移除集群节点   
  
•  集群数据负载平衡   
  
•  目录快照   
  
•  集群升级
  

    
第四天下午
    
  
集群监控及排错      
  
•  监控 Hadoop 集群     
  
•  Hadoop 集群排错   
  
•  常见配置不当问题
  


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4  

GMT+8, 2018-9-21 12:27 , Processed in 0.264674 second(s), 28 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表