Spring Cloud Alibaba Nacos 的 2 种健康检查机制！-轻识

点击上方“服务端思维”，选择“设为星标”

回复”669“获取独家整理的精选资料集

回复”加群“加入全国服务端高端社群「后端圈」

作者 | 磊哥

出品 | Java中文社群

Spring Cloud Alibaba Nacos 作为注册中心不止提供了服务注册和服务发现功能，它还提供了服务可用性监测的机制。有了此机制之后，Nacos 才能感知服务的健康状态，从而为服务调用者提供健康的服务实例，最终保证了业务系统能够正常的执行。

两种健康检查机制

Nacos 中提供了两种健康检查机制：

客户端主动上报机制。
服务器端反向探测机制。

如何理解这两种机制呢？想象⼀下这么⼀个场景，你所在的地区突然发生地质灾害，你被掩盖在废墟下面，搜救队必须要知道你在废墟里面，那么才能对你进行施救。那有什么方法可以让救援队知道你在废墟下面？

第⼀种，你在废墟里面大喊 help! help! I am here! ，让搜救队知道你的位置和健康状态。
第二种，搜救队使用了他们的专业检查设备，探测到你正埋在废墟下面。

以上这两种方法和 Nacos 的两种健康检查机制类似，也就是客户端主动上报机制，是客户端每隔一段时间，主动向 Nacos 服务器端上报自己的健康状况，而服务器端反向探测机制是 Nacos 服务器端来检测客户端是否健康。

如何设置健康检查机制？

Nacos 中的健康检查机制不能主动设置，但健康检查机制是和 Nacos 的服务实例类型强相关的。也就是说 Nacos 中的两种服务实例分别对应了两种健康检查机制：

临时实例（也可以叫做非持久化实例）：对应的是客户端主动上报机制。
永久实例（也可以叫做持久化实例）：服务端反向探测机制。

为什么需要两种服务实例呢？以淘宝为例，双十一大促期间，流量会比平常高出很多，此时服务肯定需要增加更多实例来应对高并发，而这些实例在双十一之后就无需继续使用了，采用临时实例比较合适。而对于服务的一些常备实例，则使用永久实例更合适。

客户端主动上报机制

临时实例每隔 5 秒会主动上报一次自己的健康状况，发送的数据包叫做心跳包，发送心跳包的机制叫做心跳机制。如果心跳包的间隔时间超过了 15 秒，那么 Nacos 服务器端就会将此服务实例标记为非健康实例，如果心跳包超过了 30s 秒，那么 Nacos 服务器端将会把此服务实例从服务列表中删除掉。运行 Nacos 项目时，可以看到客户端主动上报心跳包的日志，如下图所示：从上述图片可以看出，Nacos 客户端会以每 5s 一次的频率来上报自己的健康情况，请求信息如下：

/nacos/v1/ns/instance/beat?app=unknown&namespaceId=public&port=8081&clusterName=DEFAULT&ip=192.168.3.72&serviceName=DEFAULT_GROUP@@spring-cloud-nacos-producer2

服务端反向探测机制

永久实例使用的服务器端反向探测的方式实现健康检查的，它的探测周期是 2000 毫秒 + 随机数（5000 毫秒以内），如果检测异常会将此服务实例，标记为非健康实例，但不会把服务实例向临时实例那样进行删除。Nacos 服务器反向探测目前内置了 3 种探测协议：HTTP 探测、TCP 探测和 MySQL 探测。⼀般而言 HTTP 和 TCP 探测已经可以涵盖绝大多数的健康检查场景，MySQL 主要用于特殊的业务场景，例如数据库的主备需要通过服务名对外提供访问，需要确定当前访问数据库是否为主库时，那么我们此时的健康检查接口，是⼀个检查数据库是否为主库的 MySQL 命令。

TCP 探测

默认情况下，永久实例使用的是 TCP 探测，这点可以在 Nacos 控制台观察到，如下图所示：默认会使用 IP端口来检查，如下图所示：TCP 探测的大体逻辑是通过与注册实例建立 channel，不断 ping 注册实例的端口，来判断实例是否健康。

HTTP 探测

HTTP 探测需要在 Nacos 控制台手动配置，如下图所示：我们在服务实例中添加探测接口的实现代码：此时我们重新启动服务实例，在服务详情中可以看到我们配置的 HTTP 探测已经生效了，可以检查出实例是健康的，如下图所示：Nacos 服务器端通过检查 HTTP 的接口是否返回 200 状态码，来判断实例是否为健康状态。

集群下的健康检查机制

集群下的健康检查机制可以用一句话来概括，那就是“各司其职”。每个服务对应了一个主注册中心，当注册中心接收到临时实例的心跳包之后，将健康状态同步给其他注册中心。而永久实例也是类似的，每个服务对应了一个主注册中心，当负责的注册中心探测到服务实例的健康状态发生改变时，再会将实例的健康状况同步到其他注册中心，从而实现了集群下的健康检查机制。

总结

Nacos 中提供了两种健康检查机制：临时实例的客户端主动上报机制和永久实例的服务端反向探测机制。临时实例每隔 5s 发送一个心跳包给 Nacos 服务器端，服务器端接收到心跳包之后再将健康状况同步给其他注册中心。永久实例支持 3 种探测协议，TCP、HTTP 和 MySQL，默认探测协议为 TCP，也就是通过不断 ping 的方式来判断实例是否健康。

— 本文结束 —

● 漫谈设计模式在 Spring 框架中的良好实践

● 颠覆微服务认知：深入思考微服务的七个主流观点

● 人人都是 API 设计者

● 一文讲透微服务下如何保证事务的一致性

● 要黑盒测试微服务内部服务间调用，我该如何实现？

关注我，回复「加群」加入各种主题讨论群。

对「服务端思维」有期待，请在文末点个在看

喜欢这篇文章，欢迎转发、分享朋友圈

在看点这里