Docker Swarm: модуль узлов Calico неисправен

Подробности:

OS: RHEL 7.4

uname -r: 3.10.0-693.el7.x86_64

Версия Docker

Client: Docker Enterprise Edition (EE) 2.0
 Version:       17.06.2-ee-10
 API version:   1.30
 Go version:    go1.8.7
 Git commit:    66261a0
 Built: Fri Apr 27 00:38:41 2018
 OS/Arch:       linux/amd64

Server: Docker Enterprise Edition (EE) 2.0
 Engine:
  Version:      17.06.2-ee-10
  API version:  1.30 (minimum version 1.12)
  Go version:   go1.8.7
  Git commit:   66261a0
  Built:        Fri Apr 27 00:40:03 2018
  OS/Arch:      linux/amd64
  Experimental: false

Ошибка

Calico-node pod is unhealthy: %!s(<nil>)

Я пытаюсь присоединиться к узлу к кластеру docker swarm в качестве рабочего. Но я получаю сообщение об ошибке при проверке состояния здоровья. В результате узел не может присоединиться к кластеру swarm.

Желаемым результатом должно быть успешное добавление узла в кластер swarm.

С уважением Адитья


person CK5    schedule 02.08.2018    source источник
comment
У меня такая же проблема, и она на единственном запущенном узле (менеджере). Любое разрешение?   -  person thenakulchawla    schedule 16.01.2019
comment
@ nakulchawla09 Смотрите мой ответ ниже   -  person CK5    schedule 16.01.2019


Ответы (2)


Мне удалось решить проблему с cd по /proc/sys/net/ipv4/conf/all. Если rp_filter равно 2, измените значение на 1 или 0. Когда закончите, сделайте :wq.

Теперь узел должен без проблем подключиться к сети.

С Уважением

КрисТ

person CK5    schedule 16.01.2019
comment
У меня было установлено значение уже 1. Я переставил свой UCP с версии 3 на 2.2.6 и все стало работать корректно. - person thenakulchawla; 16.01.2019

Я столкнулся с той же проблемой в своей тестовой среде.

В моем случае оказалось, что у меня закончилось место на диске, когда я присоединил узел к рою.

Убедитесь, что у вас достаточно свободного места в /var/lib/docker на вашем хосте.

Вы сможете сказать, является ли это проблемой, если ucp-calico-cni "/install-cni.sh" запускается, а затем внезапно дает сбой.

Вы можете увидеть это, выполнив следующие действия:

  1. Удалить узел из роя:

    docker swarm leave
    
  2. Затем добавьте его со своим URL:

    docker swarm join --token SWMTKN-1-0le10al9t1coov7c23mg28gcviozrr1ggueqwlyjt51i7gpefd-5xxre29bwafxg0xud1abcdefg 192.168.0.191:2377
    
  3. Тогда сразу начинайте:

    watch "docker ps"
    

Вы должны увидеть процесс ucp-pause, а затем ucp-calico-cni.

Если он запускается, а затем терпит неудачу - возможно, у вас проблема с местом.

Успешный запуск должен выглядеть так:

34ed65e25213        docker/ucp-calico-cni        "/install-cni.sh"        8 seconds ago       Up 7 seconds
                          k8s_install-cni_calico-node-c2zd5_kube-system_ce6396d7-b16b-11e8-b3c7-0242ac11000b_0
21e1e3ff96f0        docker/ucp-calico-node       "start_runit"            14 seconds ago      Up 13 seconds
                          k8s_calico-node_calico-node-c2zd5_kube-system_ce6396d7-b16b-11e8-b3c7-0242ac11000b_0
a206f3242319        docker/ucp-pause:3.0.3       "/pause"                 29 seconds ago      Up 27 seconds
                          k8s_POD_calico-node-c2zd5_kube-system_ce6396d7-b16b-11e8-b3c7-0242ac11000b_0
840a48831f1b        docker/ucp-agent:3.0.3       "/bin/ucp-agent agent"   35 seconds ago      Up 29 seconds             2376/tcp
                          ucp-agent.u0a7uoqgrav90039vbvj43qt8.kdlov8fvojxjo291dph3ihcm2
74acd9eaabba        docker/ucp-hyperkube:3.0.3   "kubelet --allow-p..."   36 seconds ago      Up 35 seconds
                          ucp-kubelet
6f196e802795        docker/ucp-hyperkube:3.0.3   "kube-proxy --clus..."   36 seconds ago      Up 35 seconds
                          ucp-kube-proxy
1e695e3ac165        docker/ucp-agent:3.0.3       "/bin/ucp-agent pr..."   37 seconds ago      Up 36 seconds (healthy)   0.0.0.0:6444->6444/tcp, 0.0.0.0:12378->12378/tcp, 0.0.0.0:12376->2376/tcp   ucp-proxy
person bgercken    schedule 06.09.2018