kubernetes cni(container network inferface)-kb88凯时官网登录

来自：

时间：2024-04-21

阅读：

为什么需要 cni

在 kubernetes 中，pod 的网络是使用 network namespace 隔离的，但是我们有时又需要互相访问网络，这就需要一个网络插件来实现 pod 之间的网络通信。cni 就是为了解决这个问题而诞生的。cni 是 container network interface 的缩写，它是一个规范，定义了容器运行时如何配置网络。cni 插件是实现了 cni 规范的二进制文件，它可以被容器运行时调用，来配置容器的网络。

docker 网络

基础

计算机五层网络如下：

如果我们想把 pod 中的网络对外，首先想到的就是七层代理，比如nginx，但是我们并不知道 pod 里的网络一定是 http，甚至他可能不是tcp。所以我们像做一些网络操作，就不能在五层做了，只能在二三四层做。

docker 实验

当我们在物理机上启动 docker daemon 不需要启动任何容器的时候，使用 ip a 命令查看网卡，发现多了一个 docker0

4: docker0:  mtu 1500 qdisc noqueue state down group default
    link/ether 02:42:9b:65:e1:01 brd ff:ff:ff:ff:ff:ff
    inet 172.17.0.1/16 brd 172.17.255.255 scope global docker0
       valid_lft forever preferred_lft forever

docker0 是一个 linux bridge 设备，这个可以理解成一个虚拟的交换机，用来做二层网络的转发。当我们启动一个容器的时候，docker 会为这个容器创建一个 veth pair 设备，一个端口挂载在容器的 network namespace 中，另一个端口挂载在 docker0 上。这样容器就可以和 docker0 上的其他容器通信了。

docker run -d --rm -it ubuntu:22.04 sleep 3000

在物理机上查看 ip a

8: veth6bc75d9@if7:  mtu 1500 qdisc noqueue master docker0 state up group default
    link/ether d6:87:ca:5c:54:51 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet6 fe80::d487:caff:fe5c:5451/64 scope link
       valid_lft forever preferred_lft forever

docker 容器里面 ip a

7: eth0@if8:  mtu 1500 qdisc noqueue state up group default
    link/ether 02:42:ac:11:00:02 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.17.0.2/16 brd 172.17.255.255 scope global eth0
       valid_lft forever preferred_lft forever

再启动一个 docker

docker run --name test -d --rm -it ubuntu:22.04 sleep 3000
# ip a
9: eth0@if10:  mtu 1500 qdisc noqueue state up group default
    link/ether 02:42:ac:11:00:03 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.17.0.3/16 brd 172.17.255.255 scope global eth0
       valid_lft forever preferred_lft forever

这样两个容器就可以通过 docker0 通信了。

root@b19a3dc4b32d:/# ping  172.17.0.2
ping 172.17.0.2 (172.17.0.2) 56(84) bytes of data.
64 bytes from 172.17.0.2: icmp_seq=1 ttl=64 time=0.055 ms

通信方式

cni 网络

当两个 pod 在同一 node 上的时候，我们可以使用像上述 docker 的 bridge 的方式通信是没问题的。但是 kubernetes 是这个多节点的集群，当 pod 在不同的 node 上的时候，直接通信肯定不行了，这时候我们需要一些办法来解决这个问题。

udp 封包

当 pod 在不同节点上的时候，两个 pod 不可以直接通信，那最简单的方式就是通过 udp 封包，把整个网络包使用 udp 封包起来，然后第二个节点再解包，然后发给网桥。

整个过程就是 node1 上的 pod 把网络包封装，然后由于 process 再封装发给 node2，node2 再解包，然后发给 pod2。

process 是 cni 实现的进程，很多 cni 都实现 udp 封包的方式，比如 flannel,cailco 等。

至于我们怎么知道目标 ip （pod 的 ip）是在哪台上，这个就有很多中方式了，比如把每台机器发配 ip 分配不同的网段，甚至于把这些对应关系写到 etcd 中。

vxlan

上述的 udp 封包方式，是可以满足基本需求但是。cni 创建的 process 进程是一个用户态的进程，每个包要在 node1 上从内核态 copy 到用户态，然后再封包，再 copy 到内核态，再发给 node2，再从内核态 copy 到用户态，再解包，再 copy 到内核态，再发给 pod2。这样的方式效率很低。所以我们使用一种更加高效的方式，就是 vxlan。

vxlan 是什么?

vxlan（virtual extensible lan）是一种网络虚拟化技术，用于解决大规模云计算环境中的网络隔离、扩展性和灵活性问题。vxlan 允许网络工程师在现有的网络架构上创建一个逻辑网络层，这可以使得数据中心的网络设计变得更加灵活和可扩展。

为什么性能会高？

vxlan 是在内核态实现的，原理和 udp 封包一样，只不过是在内核态实现的，数据包不会在内核态和用户态之间 copy，所以效率会高很多。

ip 路由

就算是 vxlan，也是需要封包和解包的，这样的方式效率还是不够高，所以我们可以使用 ip 路由的方式。

ip 路由故名思意，就是使用路由表来实现 pod 之间的通信。这样的方式效率最高，但是配置比较复杂，需要配置路由表。

而且路由表跳转是二层网络实现的，所以又要要求所有 node 在同一个二层网络中。

查看 node1 上的 container 的是设备

ip a
2: eth0@if10:  mtu 1500 qdisc noqueue state up group default qlen 1000
    link/ether 66:5e:d8:8d:86:ba brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.10.184.69/32 scope global eth0
       valid_lft forever preferred_lft forever
    inet6 fe80::645e:d8ff:fe8d:86ba/64 scope link
       valid_lft forever preferred_lft forever

这个和主机上是对应的是一个 veth pair 设备，一个端口挂载在容器的 network namespace 中，一边挂载在主机上。

# 主机
ip a
10: calia78b8700057@if2:  mtu 1500 qdisc noqueue state up group default qlen 1000
    link/ether ee:ee:ee:ee:ee:ee brd ff:ff:ff:ff:ff:ff link-netns cni-0da431c8-dd8b-ca68-55e6-40b04acf78d6
    inet6 fe80::ecee:eeff:feee:eeee/64 scope link
       valid_lft forever preferred_lft forever

当 pod 中的数据包来到主机查看 node1 上的路由表会命中一下这条路由这条的意思是跳到192.168.229.102节点使用 ens33 设备

ip r
172.10.190.0/26 via 192.168.229.102 dev ens33 proto bird

当数据包来到 node2 上的时候我们看下 node2 的路由表

ip r
172.10.190.2 dev calie28ee63d6b0 scope link
ip a
7: calie28ee63d6b0@if2:  mtu 1500 qdisc noqueue state up group default qlen 1000
    link/ether ee:ee:ee:ee:ee:ee brd ff:ff:ff:ff:ff:ff link-netns cni-dd892c92-1826-f648-2b8c-d22618311ca9
    inet6 fe80::ecee:eeff:feee:eeee/64 scope link
       valid_lft forever preferred_lft forever

这个设备是 veth pair 设备，对应的容器内的

ip a
2: eth0@if7:  mtu 1500 qdisc noqueue state up group default qlen 1000
    link/ether fa:a6:2f:97:58:28 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.10.190.2/32 scope global eth0
       valid_lft forever preferred_lft forever
    inet6 fe80::f8a6:2fff:fe97:5828/64 scope link
       valid_lft forever preferred_lft forever

这样node2上的 172.10.190.2 pod 就可以收到数据包了。

路由跳转

路由跳转是怎么实现的？

路由跳转是通过路由表来实现的，它作用在二层上，所以当跳转的时候，直接修改数据包的目标 mac 地址（如果知道的话是使用 arp 协议获得）。

所以当我们访问百度的时候，获得百度的ip的时候，数据包会经过很多路由器，每个路由器都会修改数据包的目标 mac 地址，这样数据包就可以到达百度的了。

felix

那么主机上的路由表是怎么来的呢？

这个就是 cni 的实现了，cni 会调用 felix 这个进程，felix 会根据 cni 的配置来配置路由表。

bgp

那么 node1 怎么知道对应的 pod ip 在哪个 node 上呢？

这个就是 bgp 协议了，bgp 是一个路由协议，用来告诉 node1 对应的 pod ip 在哪个 node 上。

这个协议很重，之前都是用到互联网上，比如我们刚才距离的百度的时候，经过那么多路由器，每个路由器怎么知道要跳到哪，他们之间就是通过 bgp 协议来告诉对方自己的路由表，再经过一系列的学习优化。

ip in ip

刚才也说过了，ip 路由是最高效的，是因为它作用在二层网络上，这就需要保证所有的 node 在同一个二层网络上。但是有时候我们的 node 不在同一个二层网络上，这时候我们可以使用 ip in ip。

简单来说就是如果 node 之间在一个二层网络上，那么就直接使用 ip 路由，如果不在，那么就使用 ip in ip，把数据包封装起来，然后再发给对应的 node。

使用ollama anythingllm快速且简单的在本地部署llama3不多说，直接开始一、安装ollamaollamad88尊龙官网手机app官网：https://ollama.com/
下载地址：https://ollama.com/download打开以后注册并

2024-04-23 22:31:56

为什么需要 cni在 kubernetes 中，pod 的网络是使用 network namespace 隔离的，但是我们有时又需要互相访问网络，这就需要一个网络插件来实现 pod 之间的网络通信。cni 就是为了

2024-04-21 22:16:12

背景我是有个基于dom实现的简历编辑器项目的，因为暂时找不到可以用canvas实现的比较有意思的场景，所以才选择了继续做简历编辑器，最开始做简历编辑器就是因为很多简历网站都是

2024-04-15 11:46:07

前言在canvas2d中实现圆形的绘制比较简单，只要调用arc指令就能在canvas画布上绘制出一个圆形，类似的，在svg中我们也只需要一个标签就能在页面上绘制一个圆形。那么在we

2024-04-13 21:52:27

第一章：引言导言在当今数字化时代，数据安全和完整性变得至关重要。消息摘要算法是一种用于验证数据完整性和安全性的重要工具。在众多消息摘要算法中，md5（message
digest algori

2024-04-11 21:57:55

1.概述传统应用开发中，为了提升系统的查询性能，往往会在系统架构设计中加入缓存机制。在ai大模型领域，虽然功能非常强大，但是使用成本也是非常昂贵的，比如openai的gpt-4按照token

2024-03-31 22:20:53

目录简介架构 application 和组件简单入门示例先决条件创建项目编译库文件引用库文件运行项目界面交互示例创建项目编译库文件实现应用函数引

2024-03-26 11:54:50

目录简介 hello world 常用功能动态路径多个片段(segments) 静态文件服务器简单webapi示例添加依赖实现接口接口测试参考链接简介rust中最知名的两个web

2024-03-19 23:21:01

一、rabbitmq的集群模式主要有两种：普通集群模式和镜像队列模式。下面分别介绍这两种模式的原理：1.普通集群模式：在普通集群模式下，rabbitmq的集群节点之间主要同步元数据，而不

2024-03-19 23:07:45

0 前言在物联网领域中，mqtt消息一直是海量设备连接到平台的标配协议，而平台向移动端开放的操作接口往往是http协议，这就要求平台为两种协议作消息一一适配。在某些情况下，这些设

2024-03-19 23:04:15

目录前言 git rm 命令 git reset 命令 git rm 和 git reset 的比较不同用例的适用性比较对文件状态的影响比较 git update-index 命令 git clean 命令实际应用

2024-03-18 21:30:10

一、?=、?!、?＜=、?＜!、?:的解释1. 先看一下比较官方的解释 (?=pattern)：正向先行断言，表示匹配位置后面必须紧跟着满足 pattern 的字符串，但不包括这个字符串在匹配结果中。 (?!

2024-03-18 21:24:29

4）playbook4.1）playbook 介绍playbook 与 ad-hoc 相比，是一种完全不同的运用 ansible 的方式，类似与 saltstack 的 state 状态文件。ad-hoc 无法持久使用，playbook 可以持久使用

2024-03-17 23:18:56

尽管ggez提供了很多相关特性的demo供运行查看，但笔者第一次使用的时候还是有很多疑惑不解。经过仔细阅读demo代码并结合自己的实践，逐步了解了ggez在不同场景下的绘图方式，在此

2024-03-17 22:57:09

前言最近在学习 es，所以需要在服务器上装一个单节点的 es服务器环境：centos 7.9安装下载镜像目前最新版本是 8.12.2docker pull docker.elastic.co/elasticsearch/elasticsear

2024-03-15 20:55:15

md5算法起源：md5（message digest algorithm 5）算法是由mit的计算机科学家ronald rivest于1991年设计的一种消息摘要算法。md5算法最初被用于提供数据完整性和一致性的验证，后来

2024-03-15 20:51:05

1、概述node feature discovery（nfd）是由intel创建的项目，能够帮助kubernetes集群更智能地管理节点资源。它通过检测每个节点的特性能力（例如cpu型号、gpu型号、内存大小等）并将

2024-03-15 00:56:29

有网友问wpf中一些文字模糊是什么问题。之前我也没有认真思考过这个问题，只是大概知道和wpf的像素对齐（pixel snapping）、抗锯齿（anti-aliasing）有关，通过设置附加属性textoptions

2024-03-13 00:01:53

0. 前言在 kubernetes 架构中，controller manager 是一个永不休止的控制回路组件，其负责控制集群资源的状态。通过监控 kube-apiserver 的资源状态，比较当前资源状态和期望状态

2024-03-11 18:41:24

二者都是lua中内置的迭代器，可以对数组或table进行遍历。在正常的数组或table的遍历中，二者没有区别。tablenormal={"this","is","a","array"}--使用 pairs 遍历for key,val i

2024-03-08 22:34:40

lua调试的时候会用到debug.getinfo()函数，what的值文档给了解释： "lua" : lua function "c" : c function "main" : main part of a chunk (通过load函数等执行的语句）关于name

2024-02-28 16:24:33

1 前言 filament 是一个实时物理渲染引擎，用于 android、ios、linux、macos、windows 和 webgl 平台。该引擎旨在提供高效、实时的图形渲染，并被设计为在 android 平台上尽

2024-02-26 22:59:17

rag 评测数据集建设尚处于初期阶段，缺乏针对特定领域和场景的专业数据集。市面上常见的 ms-marco 和 beir 数据集覆盖范围有限，且在实际使用场景中效果可能与评测表现不符。目

2024-02-26 22:12:53

一.整体思路　　我们在用纹理增加细节那篇文章中提到过，要将图片渲染在屏幕上，首先要拿到图片的像素数组数据，然后将像素数组数据通过纹理单元传递到片段着色器中，最后通过纹理

2024-02-26 22:10:59

问题描述：通过documentformat.openxml解析pptx文件时遇到异常：“\b”(十六进制值 0x08)是无效的字符,查看文件发现存在乱码，乱码的十六进制值刚好时异常中提到的0x08

2024-01-31 21:50:28

curl_formadd 是用于在 libcurl 中添加表单数据的函数之一。它被用于 post 请求中，将表单字段和值添加到请求体中。以下是 curl_formadd 函数的基本语法： curlformcode curl_f

2024-01-24 19:42:23

什么是json schema ？json schema是一种声明式语言，它可以用来标识json的结构，数据类型和数据的具体限制，它提供了描述期望json结构的标准化方法。
利用json schema, 你可以定义j

2024-01-24 19:41:48

前言本文试图搞清楚cache几个操作：clean、invalidate与flush的含义。由于只用过arm和risc-v，所以是从arm和risc-v的角度来说明。cache linecache line是cache的基本访问单元。

2024-01-24 19:39:40

什么是 flutter flutter 是由 google 开发的开源框架 flutter 用于构建跨平台的移动应用程序 flutter 它允许开发者使用同一套代码来同时为 ios 和 android 平台开发应用程

2024-01-24 19:38:30

目录简介发展历史应用场景 jenkins 安装部署先决条件硬件要求软件包下载 war 包部署 linux 系统部署 mac 系统部署 windows 系统部署安装后基本配置

2024-01-24 19:35:24

2020-09-27

2018-09-21

2018-09-02

2021-03-15

2022-12-16

2019-08-24

2021-03-10

2020-09-16

2019-07-29