RolandMa1986 防火墙已经关了
coredns pod始终是ContainerCreating
RolandMa1986K零S
taorz1 如果用的云环境,也要关闭网络防火墙。 物理主机的话,检查一下是否有多块网卡。
RolandMa1986K零S
RolandMa1986 你的主机的网段是10.26.21.223? 这个掩码是多少位的, 检查一下是否于Calico 的10.233.64.0/18有重叠。
PodsCIDR 10.233.64.0/18
ServiceCIDR 10.233.0.0/18
部署在虚拟机上,虚拟地址网段10.26.21.0/24 之间没有重叠
网络配置如下,这个有问题吗
cali70cede9b535: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1440
ether ee:ee:ee:ee:ee:ee txqueuelen 0 (Ethernet)
RX packets 0 bytes 0 (0.0 B)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 0 bytes 0 (0.0 B)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0docker0: flags=4099<UP,BROADCAST,MULTICAST> mtu 1500
inet 172.17.0.1 netmask 255.255.0.0 broadcast 172.17.255.255
ether 02:42:ee:53:c8:18 txqueuelen 0 (Ethernet)
RX packets 0 bytes 0 (0.0 B)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 0 bytes 0 (0.0 B)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
inet 10.26.21.xxx netmask 255.255.255.0 broadcast 10.26.21.255
ether 52:54:00:ae:28:d4 txqueuelen 1000 (Ethernet)
RX packets 8399602 bytes 2465523254 (2.2 GiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 9063819 bytes 3462227865 (3.2 GiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0lo: flags=73<UP,LOOPBACK,RUNNING> mtu 65536
inet 127.0.0.1 netmask 255.0.0.0
loop txqueuelen 1000 (Local Loopback)
RX packets 124288873 bytes 78055595643 (72.6 GiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 124288873 bytes 78055595643 (72.6 GiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0tunl0: flags=193<UP,RUNNING,NOARP> mtu 1440
inet 10.233.105.0 netmask 255.255.255.255
tunnel txqueuelen 1000 (IPIP Tunnel)
RX packets 0 bytes 0 (0.0 B)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 0 bytes 0 (0.0 B)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
RolandMa1986K零S
taorz1 配置看起来没有问题,但是你node 上calico 建立的 tunl0 没有任何数据传输。所以pod之间连接失败。你可以将环境登录信息发送到官网邮箱,帮助你排查问题。
- 已编辑
RolandMa1986 这是内部网络还不太方便,可以帮忙提供思路,我来进行信息收集
附带一下路由信息
route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
0.0.0.0 10.26.21.1 0.0.0.0 UG 0 0 0 eth0
10.26.21.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
10.233.105.0 0.0.0.0 255.255.255.0 U 0 0 0 *
10.233.105.1 0.0.0.0 255.255.255.255 UH 0 0 0 cali70cede9b535
169.254.0.0 0.0.0.0 255.255.0.0 U 1002 0 0 eth0
172.17.0.0 0.0.0.0 255.255.0.0 U 0 0 0 docker0
RolandMa1986 另外请教个问题 tunl0是做什么的 跨主机通信是吗?在网络拓扑上处于一个什么位置?
RolandMa1986K零S
taorz1 可以百度一下啊-> calico IPIP 模式:https://blog.csdn.net/u010771890/article/details/103224004
RolandMa1986 ok 多谢
RolandMa1986 目前这个cluster是安装在3个vm上,一个master, 两个node.
目前从calico的架构拓扑图来看,两个node上好像是缺少Felix,bird,master上是有的. 安装过程是在sample yaml上改动集群信息,通过kk安装的,os 版本是CentOS Linux release 7.9.2009 (Core)。
这种状况正常吗? 如果不正常,怎样才能在两个node上也起来felix和bird?
另外还有一个问题,我看有的ip地址是ipv6, 这个会有影响吗?
RolandMa1986K零S
taorz1 排查步骤参考一下文章:
projectcalico/calico#3092
https://docs.projectcalico.org/getting-started/kubernetes/requirements
常见的问题一般就是:
- 防火墙未关闭
- 机器有多个网卡
- 网段冲突
- 缺少系统组件/内核原因
如果都不是,你可以尝试更为bgp模式,或者使用flannal