Opendaylight - невозможно присоединиться к кластеру

Недавно мы перешли на Nitrogen-SR3 и настроили кластеризацию с 2 узлами. Когда мы перезапускаем узел (т. е. после восстановления после сбоя), мы наблюдаем следующее исключение в karaf.log, и узел не может присоединиться к кластеру. Любая помощь высоко ценится.

java.util.concurrent.TimeoutException: Connection attempt failed
        at org.opendaylight.controller.cluster.databroker.actors.dds.AbstractShardBackendResolver.wrap(AbstractShardBackendResolver.java:129)[505:org.opendaylight.controller.sal-distributed-datastore:1.6.3]
        at org.opendaylight.controller.cluster.databroker.actors.dds.AbstractShardBackendResolver.lambda$connectShard$2(AbstractShardBackendResolver.java:142)[505:org.opendaylight.controller.sal-distributed-datastore:1.6.3]
        at java.util.concurrent.CompletableFuture.uniWhenComplete(CompletableFuture.java:760)[:1.8.0_66]
        at java.util.concurrent.CompletableFuture$UniWhenComplete.tryFire(CompletableFuture.java:736)[:1.8.0_66]
        at java.util.concurrent.CompletableFuture$Completion.exec(CompletableFuture.java:443)[:1.8.0_66]
        at java.util.concurrent.ForkJoinTask.doExec(ForkJoinTask.java:289)[:1.8.0_66]
        at java.util.concurrent.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:1056)[:1.8.0_66]
        at java.util.concurrent.ForkJoinPool.runWorker(ForkJoinPool.java:1692)[:1.8.0_66]
        at java.util.concurrent.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:157)[:1.8.0_66]
Caused by: org.opendaylight.controller.cluster.access.concepts.RetiredGenerationException: Originating generation was superseded by 3
at org.opendaylight.controller.cluster.datastore.Shard.findFrontend(Shard.java:482)[505:org.opendaylight.controller.sal-distributed-datastore:1.6.3]
        at org.opendaylight.controller.cluster.datastore.Shard.handleConnectClient(Shard.java:522)[505:org.opendaylight.controller.sal-distributed-datastore:1.6.3]
        at org.opendaylight.controller.cluster.datastore.Shard.handleNonRaftCommand(Shard.java:325)[505:org.opendaylight.controller.sal-distributed-datastore:1.6.3]
        at org.opendaylight.controller.cluster.raft.RaftActor.handleCommand(RaftActor.java:270)[490:org.opendaylight.controller.sal-akka-raft:1.6.3]
        at org.opendaylight.controller.cluster.common.actor.AbstractUntypedPersistentActor.onReceiveCommand(AbstractUntypedPersistentActor.java:44)[498:org.opendaylight.controller.sal-clustering-commons:1.6.3]
        at akka.persistence.UntypedPersistentActor.onReceive(PersistentActor.scala:170)[321:com.typesafe.akka.persistence:2.4.20]

person satlearner    schedule 10.07.2018    source источник


Ответы (1)


Я думаю, вы столкнулись с этой ошибкой открытия.

person jamo    schedule 10.07.2018
comment
Мы также наблюдаем, что следующему пакету требуется больше времени для перехода из GracePeriod в активное состояние. (mdsal-eos-binding-adapter и mdsal-singleton-dom-impl) - person satlearner; 10.07.2018
comment
Мы наблюдаем некоторые изменения в коде, можем ли мы узнать, что является основной причиной этой проблемы. - person satlearner; 10.07.2018
comment
вы должны взаимодействовать с билетом jira, чтобы получить более подробную информацию, например, основную причину и т. д., просто опубликуйте комментарий/вопрос. - person jamo; 12.07.2018
comment
Мы наблюдаем, что пакеты Opendaylight находятся в состоянии GracePeriod в течение неопределенного времени, но для наших пакетов приложений мы замечаем, что пакеты переходят в состояние «Сбой» через 5 минут. Не могли бы вы сообщить нам, как увеличить время ожидания, аналогично пакетам ODL. - person satlearner; 14.07.2018