服务器挂了如何实现 DNS 自动切换？聊聊几种高可用低成本方案

在折腾建站或者跑项目的路上，最怕的不是流量大，而是服务器突然“抽风”。尤其是在只有一台单机部署的情况下，一旦机器宕机、带宽被墙或者母鸡炸机，只能干瞪眼等着 DNS 解析生效（通常还得很久）。

最近看到有朋友在问，有没有什么程序能在网站故障时自动更换 DNS 解析？其实这个需求在运维圈属于“高可用（HA）”的基础操作。今天就来聊聊几种不同成本和技术门槛的实现方案，让你也能轻松搞定自动切换。

如果你使用的大型云厂商（如阿里云、腾讯云、AWS、Cloudflare 等）的 DNS 服务，它们通常都自带了非常成熟的故障转移功能。

原理： DNS 服务商会有探测节点定期访问你的服务器 IP（比如每 30 秒一次）。如果发现你的主服务器（如 VPS A）挂了，或者响应超时，系统会自动把解析切换到备用服务器（如 VPS B）。

DNS 故障转移与健康检查原理示意图

DNS 故障转移原理示意：探测节点定期检查服务器健康状态，异常时自动切换解析。

优点：

缺点：

既然提到了云厂商，必须得安利一下 Cloudflare（CF）。如果你的域名托管在 CF 上，那你有两种玩法：土豪版和折腾版。

土豪版（Pro 版及以上）： CF 自带 Load Balancing 功能，可以直接设置源站 IP 的健康检查，挂了自动切走。不过这个功能价格不菲，不适合个人小项目。
折腾版（免费版）： 这就要用到脚本了。我们可以利用免费的监控服务（如 UptimeRobot、StatusCake）或者自己写一个 Cron 脚本去检测网站状态。一旦发现返回码不是 200，就立刻调用 Cloudflare 的 API，把 A 记录修改为备用服务器的 IP。

Nginx 反向代理与 Keepalived 架构图

Nginx + Keepalived 架构示意：利用 VRRP 协议争抢虚拟 IP，实现内网高可用。

网上有很多现成的开源脚本（GitHub 上搜 cloudflare api ddns 或 failover 之类的关键词），基本逻辑就是：

优点： 免费、灵活、可控性强。 缺点： 需要一点点折腾能力，且依赖于执行脚本的机器稳定性（最好在第三方云函数或不同地区的 VPS 上跑）。

如果你的痛点是“单机故障”但所有机器都在同一个局域网或内网环境，其实不用折腾 DNS，直接用 ** Keepalived ** 搭建虚拟 IP（VIP）才是正解。

原理： 两台服务器都安装 Nginx 和 Keepalived，通过 VRRP 协议争抢同一个虚拟 IP。主节点活着的时候，VIP 也就是它；主节点挂了，备用节点瞬间接管 VIP。客户端根本感觉不到 IP 变了。

优点： 毫秒级切换，完全不依赖外部 DNS。 缺点： 要求服务器在同一二层网络下，普通的异地多 VPS 做不到。

对于大多数手里有几台烂大街 VPS、想做个人站点的朋友，我最推荐的方案其实是 方案 1 和 方案 2 的结合：

总结： 不要指望有什么“一键安装”的魔法软件能把所有环境都搞定。理解 DNS 轮询、健康检查和 API 自动化的原理，搭配手头的资源，才是稳定运行的关键。如果你只是想从“挂了不能马上发现”变成“挂了自动切备用 IP”，那搞个简单的 API 调用脚本足矣。