关于hadoop的hdfs集群-kb88凯时官网登录

来自：网络

时间：2023-05-17

阅读：

每台计算机中的配置

hadoop 如何配置集群、不同的计算机里又应该有怎样的配置，这些问题是在学习中产生的。本章的配置中将会提供一个典型的示例，但 hadoop 复杂多样的配置项远超于此。

hdfs 命名节点对数据节点的远程控制是通过 ssh 来实现的，因此关键的配置项应该在命名节点被配置，非关键的节点配置要在各个数据节点配置。也就是说，数据节点与命名节点的配置可以不同，不同数据节点之间的配置也可以有所不同。

但是本章为了方便建立集群，将使用相同的配置文件通过 docker 镜像的形式同步到所有的集群节点，特做解释。

具体步骤

总体思路是这样的，我们先用一个包含 hadoop 的镜像进行配置，配置成集群中所有节点都可以共用的样子，然后再以它为原型生成若干个容器，构成一个集群。

配置原型

首先，我们将使用之前准备的 hadoop_proto 镜像启动为容器：

docker run -d --name=hadoop_temp --privileged hadoop_proto /usr/sbin/init

进入 hadoop 的配置文件目录：

cd $hadoop_home/etc/hadoop

现在对这里的文件的作用做简单的描述：

文件	作用
workers	记录所有的数据节点的主机名或 ip 地址
core-site.xml	hadoop 核心配置
hdfs-site.xml	hdfs 配置项
mapred-site.xml	mapreduce 配置项
yarn-site.xml	yarn 配置项

注：yarn 的作用是为 mapreduce 提供资源管理服务，此处暂时用不着。

我们现在设计这样一个简单的集群：

1 个命名节点 nn
2 个数据节点 dn1, dn2

首先编辑 workers ，更改文件内容为：

dn1
dn2

然后编辑 core-site.xml，在中添加以下配置项：


    fs.defaultfs
    hdfs://nn:9000


    hadoop.tmp.dir
    file:///home/hadoop/tmp

配置 hdfs-site.xml，在中添加以下配置项：


    dfs.replication
    2


    dfs.namenode.name.dir
    file:///home/hadoop/hdfs/name

最后需要配置一下 ssh ：

ssh-keygen -t rsa -p "" -f ~/.ssh/id_rsassh-copy-id -i ~/.ssh/id_rsa hadoop@localhost

到此为止，集群的原型就配置完毕了，可以退出容器并上传容器到新镜像 cluster_proto ：

docker stop hadoop_tempdocker commit hadoop_temp cluster_proto

此处如果有必要可以删除临时镜像 hadoop_temp 。

部署集群

接下来部署集群。

首先，要为 hadoop 集群建立专用网络 hnet ：

docker network create --subnet=172.20.0.0/16 hnet

接下来创建集群容器：

docker run -d --name=nn --hostname=nn --network=hnet --ip=172.20.1.0 --add-host=dn1:172.20.1.1 --add-host=dn2:172.20.1.2 --privileged cluster_proto /usr/sbin/init
docker run -d --name=dn1 --hostname=dn1 --network=hnet --ip=172.20.1.1 --add-host=nn:172.20.1.0 --add-host=dn2:172.20.1.2 --privileged cluster_proto /usr/sbin/init
docker run -d --name=dn2 --hostname=dn2 --network=hnet --ip=172.20.1.2 --add-host=nn:172.20.1.0 --add-host=dn1:172.20.1.1 --privileged cluster_proto /usr/sbin/init

进入命名节点：

docker exec -it nn su hadoop

格式化 hdfs：

hdfs namenode -format

如果没有出错，那么下一步就可以启动 hdfs：

start-dfs.sh

成功启动之后，jps 命令应该能查到 namenode 和 secondarynamenode 的存在。命名节点不存在 datanode 进程，因为这个进程在 dn1 和 dn2 中运行。

至此，你可以检测 hdfs 的运行，使用 hdfs 的方式也没有差别（命名节点代表整个集群）。

目录快速使用获取异步方法返回值注意事项本文带你快速了解@async注解的用法，包括异步方法无返回值、有返回值，最后总结了@async注解失效的几个坑。在 springboot 应用中，经

2023-05-26 00:50:56

一、旧世界的web后端（1）刚开始，web后端基本都是php写的，脚本化的语言，嵌入到html里面很方便。（2）然后java开始发力，jsp servlet成为主流。（3）发现java又臭又长，开始把一些常用的思路封

2023-05-26 00:30:33

目录介绍作用保证变量的可见性：禁止指令重排：不能保证原子性可见性、有序性、原子性不会导致线程阻塞使用场景实现原理happens-before局限性和 synchronized 关键字比较和 ato

2023-05-17 21:03:37

目录概述path 路径files 文件filesystems 文件系统watchservice 文件监控pathmatcher 文件匹配读文件内容小文件大文件总结概述在早期的 java 版本中，文件 io 操作功能一直相

2023-05-17 21:03:34

目录起源实现拦截器接口innerinterceptor修改sql常用的工具类起源最近公司要做多租户，mybatis-plus的多租户插件很好用，但是有一个场景是：字典表或者某些数据表，一些数据需要在

2023-05-17 21:03:32

目录什么是上下文切换上下文切换代码测试引起线程上下文切换的原因如何减少上下文切换什么是上下文切换即使是单核cpu也支持多线程执行代码，cpu通过给每个线程分配cpu时间片

2023-05-17 21:03:31

目录前言consumer整体介绍consumer实现类consumer消费类型defaultmqpushconsumer主要apidefaultmqpushconsumer关键属性consumer消费模式consumer消费策略consumer使用defau

2023-05-17 21:03:29

目录一. object简介1. 简介二. 常用方法1. clone()方法1.1 clone方法作用1.2 clone源码分析1.3 java的浅克隆与深克隆2. hashcode()方法2.1 简介2.2 hash值2.3 案例3. equal

2023-05-17 21:03:25

目录前言storecheckpoint介绍storecheckpoint时间戳更新时机storecheckpoint刷盘源码消息加载源码分析commitlog加载consumequeue加载indexfile加载consumequeue与indexfile

2023-05-17 21:03:20

目录1.mq概述1.1 rocketmq简介1.2 mq用途1.3 常见mq产品2.rocketmq 基本概念2.1 消息2.2 主题2.3 标签2.4 队列2.5 producer2.6 consumer2.7 nameserver2.8 broker2.9 rocke

2023-05-17 21:03:17

目录前言刷盘服务源码分析commitrealtimeservice刷盘源码分析flushrealtimeservice刷盘源码分析groupcommitservice刷盘源码分析总结前言上篇文章我们介绍了消息刷盘的四种

2023-05-17 21:03:10

目录前言角色介绍官方例子quartz如何分布式？跟着官方例子看源码trigger的处理结合起来总结前言前几篇介绍了单体架构的定时任务解决方式，但是现代软件架构由于业务复杂度高，业

2023-05-17 21:03:05

目录概述从 list 转换为 set使用原生 java 代码使用 guava使用 apache commons collections从 set 转换为 array使用原生 java使用 guava结论概述在本文章中，我们对如何在 ja

2023-05-17 21:02:59

hashset 基于 hashmap 来实现的，是一个不允许有重复元素的集合。hashset 实现了 set 接口。hashset 允许有 null 值。hashset 是无序的，即不会记录插入的顺序。hashset 不是线

2023-05-17 21:02:57

java迭代器（iterator）是 java 集合框架中的一种机制，它提供了一种在不暴露集合内部实现的情况下遍历集合元素的方法。java iterator（迭代器）不是一个集合，它是一种用于访问集合的

2023-05-17 21:02:55

目录一段看似平平无奇的代码报了异常将classroom是否为null单独拿出来判断一段看似平平无奇的代码classroom classroom = this.getone( wrappers.lambdaquery()

2023-05-17 21:02:53

目录介绍语法介绍try-with-resources是java中的环绕语句之一，旨在减轻开发人员释放try块中使用的资源的义务。它最初在java 7中引入，背后的全部想法是，开发人员无需担心仅在一

2023-05-17 21:02:51

目录前言broker消息清理机制简介broker与消息清理相关配置消息清理机制源码分析commitlog清理源码分析consumequeue和indexfile清理源码分析consumequeue文件清理indexfile

2023-05-17 21:02:49

目录一. 内部类简介1. 概念2. 优点3. 分类4. 内部类的特点5. java类的创建要求二. 成员内部类1. 概念2. 特点3. 语法4. 案例4.1 定义成员内部类4.2 定义测试类5. 访问方式小

2023-05-17 21:02:47

目录一、问题二、优化建议三、repository模式一、问题最近在做代码重构，代码工程采用了controller/service/dao分层架构，dao层使用了mybatis-plus框架。
在查看service层时发

2023-05-17 21:02:45

2023-05-17 21:02:43

目录object 类提供的方法方法实例clone() 方法equals() 方法finalize() 方法getclass() 方法hashcode() 方法wait() 方法notify() 与 notifyall() 方法tostring() 方法java

2023-05-17 21:02:41

目录一. instanceof关键字1. 简介2. 语法3. 案例二. 结语一. instanceof关键字1. 简介在上面学习类型转换时，跟大家讲过，在向下转型时，如果两个类型之间没有直接或间接的继承关

2023-05-17 21:02:38

目录项目结构：项目环境：问题：maven依赖原则：复习springcloud-alibaba的时候，在自己本地搭建好了环境并做了个测试没有发现异常，第二天在公司克隆代码下来之后服务器启动失败，在此记

2023-05-17 21:02:36

目录每台计算机中的配置具体步骤配置原型部署集群hdfs 集群是建立在 hadoop 集群之上的，由于 hdfs 是 hadoop 最主要的守护进程，所以 hdfs 集群的配置过程是 hadoop 集群配置

2023-05-17 21:02:30

目录线程组概念理解线程组实践线程组和线程池的区别线程组概念理解在java的多线程处理中有线程组threadgroup的概念，threadgroup是为了方便线程管理出现了，可以统一设定线程组

2023-05-17 21:02:26

目录一. string字符串简介1. 概述2. 与字符的区别3. 定义方式3.1 构造方法定义3.2 直接赋值定义二. 字符串实用方法1. 字符串的比较方法2. 判断字符串是否为空3. 判断相关的

2023-05-17 21:02:23

目录一. integer底层原理探究1. int和integer的区别2. 被final修饰的integer类3. integercache缓冲区4. 几个核心实验4.1 比较new出的两个integer对象4.2 integer对象和int

2023-05-17 21:02:21

目录前言consumequeue详解indexfile详解indexheaderslots槽位indexes索引数据实时更新consumequeue与indexfile源码分析commitlogdispatcherbuildconsumequeue源码分析commi

2023-05-17 21:02:15

目录前言filechannelfilechannel的创建randomaccessfile中的模式filechannel操作文件读文件操作写文件操作对文件的更新强制输出到底层存储设备通道之间数据传输mappedbyteb

2023-05-17 21:01:52

2021-02-06

2020-09-18

2020-12-12

2020-05-05

2020-11-20

2021-01-09

2020-09-25

2021-02-06

2021-03-07

2020-09-27

关于hadoop的hdfs集群-kb88凯时官网登录

目录

每台计算机中的配置

具体步骤

配置原型

部署集群

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道