admin管理员组

文章数量:1567915

目录

第一章 大数据基础篇

1.1 Linux 基础学习

1.2 SQL 基础学习

1.3 Java 与 Scala 基础学习

第二章 数据采集与存储技术

2.1 Hadoop 基础及实战

2.2 Hive 与 Hbase 技术

2.3 ETL 流程及原理

第三章 数据管理与查询技术

3.1 数据仓库体系搭建

3.2 数据治理体系方法论

3.3 OLAP 查询技术

第四章 大数据开发工具与平台

4.1 分布式协调工具 Zookeeper

4.2 消息队列 Kafka

4.3 任务调度工具 Azkaban

4.4 大数据平台工具 CDH

第五章 数据计算与分析技术

5.1 Spark 全体系原理及实战

5.2 Flink 全体系原理及实战

5.3 实时场景下的 Kafka 实战原理

第六章 数据可视化与数据分析扩展

6.1 数据可视化工具介绍

6.2 Python 数据分析基础

6.3 机器学习基础及应用


第一章 大数据基础篇

1.1 Linux 基础学习

在大数据开发的学习路径中,Linux 基础学习是一块至关重要的基石。Linux 作为一款开源、稳定、安全且灵活的操作系统,在服务器领域的应用极为广泛。对于投身大数据开发的人员而言,熟练驾驭 Linux 操作系统的各类基本命令和操作方法,是必备的核心技能。

Linux 操作系统提供了丰富多样的基本命令,涵盖文件操作、目录操作以及系统管理等多个领域。

文件操作命令:像ls(用于列出目录内容)、cd(切换工作目录)、pwd(显示当前工作目录的完整路径)、touch(创建新文件或更新文件的时间戳)等命令,是日常操作中频繁使用的工具。通过ls命令,我们能够详细

本文标签: 数据知识点最全万字保姆