在刚开始学习SpringCloud时,可能会遇到下面这个错误。其实这个错误不必惊慌。下面我细说一下。
看到监控平台显示有两个服务,但是实际上helloworld服务现在已经下线了,并且报下面的红色错误:
EMERGENCY! EUREKA MAY BE INCORRECTLY CLAIMING INSTANCES ARE UP WHEN THEY’RE NOT. RENEWALS ARE LESSER THAN THRESHOLD AND HENCE THE INSTANCES ARE NOT BEING EXPIRED JUST TO BE SAFE.
其实,这个是eureka的自我保护的心跳机制导致的。
自我保护机制:
默认情况下,如果Eureka Server在一定时间内(默认90秒)没有接收到某个微服务实例的心跳,Eureka Server将会移除该实例。但是当网络分区故障发生时,微服务与Eureka Server之间无法正常通信,而微服务本身是正常运行的,此时不应该移除这个微服务,所以引入了自我保护机制。
??自我保护机制的工作机制是如果在15分钟内超过85%的客户端节点都没有正常的心跳,那么Eureka就认为客户端与注册中心出现了网络故障,Eureka Server自动进入自我保护机制,此时会出现以下几种情况:
1、Eureka Server不再从注册列表中移除因为长时间没收到心跳而应该过期的服务。
2、Eureka Server仍然能够接受新服务的注册和查询请求,但是不会被同步到其它节点上,保证当前节点依然可用。
3、当网络稳定时,当前Eureka Server新的注册信息会被同步到其它节点中
关于自我保护的两个重要参数renews和threshold
eureka默认心跳周期30s,即一分钟两次。
Renews threshold:心跳次数阈值
Renews (last min):过去一分钟eureka server收到的心跳数目
RenewalPercentThreshold:保护机制触发阈值,默认0.85
像我们现在这种情况,起了一个eureka server和一个client,eureka最小threashold是1(写死在eureka代码中),另client一分钟发两次心跳,那么threshold=1+2*1。
如果Renews < threashold * RenewalPercentThreshold则触发保护机制,不会移除服务,并报出错误。2 < 0.85*3,因此报错。
解决办法
注意,不建议在生存环境使用。了解即可。
1,修改配置,使触发条件不成立
比如修改心跳时间加入以下配置:
instance:
lease-renewal-interval-in-seconds: 1
lease-expiration-duration-in-seconds: 2
leaseRenewalIntervalInSeconds :Eureka客户端向服务端发送心跳的时间间隔,单位为秒 默认是30秒
leaseExpirationDurationInSeconds :Eureka服务端在收到最后一次心跳之后等待的时间上限,单位为秒。超过该时间之后服务端会将该服务实例从服务清单中剔除,从而禁止服务调用请求被发送到该实例上 默认是90秒
threshold=1 + 60 * 1 =61
60 > 61 * 0.85 所以不会触发自我保护机制
或者,把RenewalPercentThreshold的值调低,比如0.49
2,测试环境直接关闭自我保护机制。
eureka:
server:
enable-self-preservation: false
本文暂时没有评论,来添加一个吧(●'◡'●)