大数据在互联网时代的重要性无需赘言,阿里巴巴、腾讯、美团等巨头都有自身的大数据平台。随着大数据平台的逐步完善,如何保障数据安全、高效,以及系统架构的平稳运行,成为各数据平台的关键任务。因此,大数据运维这个岗位也一跃成为大数据领域的热门。
对于开发人员来说,兼顾大数据运维的工作是一项不小的挑战。相比大数据开发,大数据运维方向需要更多的经验积累,涉及到什么架构才能支撑大数据量、什么资源配置才能满足分析需求等问题,这需要实际接触、操作才能给出答案,而非靠理论或猜测。
本内容引用大量大数据运维的实战案例,围绕大数据平台的架构设计与部署、监控告警、性能调优等方面,全方位讲解大数据运维工作的技能点。课程目录如下:
1. 开篇词:掌握大数据,把握未来
2. 大话Hadoop生态圈
3. Hadoop发行版选型和伪分布式平台的构建
4. 自动化运维工具AnIblE在部署大数据平台下的应用(上、下)
5. 手动模式构建双Namenode+YaRn的Hadoop集群(上、下)
6. 通过Ambari工具自动化构建Hadoop大数据平台和外围应用(上、下)
7. 如何通过Hivetez与Hadoop的整合快速实现大数据开发(上、下)
8. HDFS组件运行机制剖析及HDFS Shell的使用
9. Hadoop分布式资源管理器Yarn、MR运行机制剖析
10. SpARK StandaLone模式的构建以及Spark与Yarn的整合
11. HBAE与Hadoop的整合应用实践
12. Flink Standalone、Flink on Yarn集群构建与应用场景
13. 轻量级日志收集工具Filebeat应用案例
14. 日志收集、分析过滤工具LoGTAh应用实战
15. Elaticearch应用架构的实现与调优
16. Kafka应用场景、集群容量规划、架构设计应用案例
17. 日均数据量30亿的Filebeat+Kafka+MirrormAKer跨机房实时日志传送案例
18. Filebeat+Kafka+Logtah+Elaticearch构建可视化日志分析系统
19. 通过Ganglia实现对HDFS、Yarn、Spark运行状态监控
20. Namenode、Datanode、Nodemanager等服务状态监控策略
21. 通过Kafka Eagle实现对Kafka消息队列的监控
22. Yarn资源调度FAIR Schedule与Capacity Scheduler配置选型
23. HDFS存储权限ACL控制策略以及与系统权限整合应用
24. Yarn、HDFS、Kafka内存调优策略以及性能瓶颈
25. Hadoop平台常见故障汇总以及操作系统性能调优
26. 大数据平台的硬件规划、网络调优、架构设计、节点规划等技能点进行了详细讲解。此外还介绍了Hadoop跨集群数据迁移应用实践。本课程旨在为大数据工程师提供一本全面的修炼手册,帮助他们在大数据运维领域不断进步。