
1.1 托管(云/机房)通常由服务商负责物理网络、机房连通、BGP/骨干;客户负责应用与配置。
1.2 本地部署(公司机房)由客户完整负责机房网络、电力、路由与安全设备,服务商可能仅提供硬件或支持。
1.3 理解差异有助于在菲律宾服(Philippines region)出现“连接不到服务器”时快速判断责任方。
2.1 DNS解析问题:域名解析到错误IP或TTL未生效,先用nslookup或dig确认。
2.2 路由/链路问题:国际/本地ISP间丢包、BGP路径变化或黑洞路由,使用traceroute/mtr排查。
2.3 防火墙/端口被阻断:端口未开放、ACL或主机防火墙(iptables/ufw/Windows Firewall)拦截。
2.4 应用/服务故障:后端进程down、监听端口错配、证书过期或应用异常崩溃。
3.1 本地/远端连通性:在客户端运行 ping <服务器IP> 与 traceroute -n
3.2 DNS检查:nslookup 域名 或 dig +short 域名,确认解析IP是否正确。
3.3 端口可达性:telnet
3.4 服务状态与日志:systemctl status <服务>;journalctl -u <服务> -n 200;tail -n 200 /var/log/nginx/error.log。
4.1 检查云/机房状态页:登录服务商控制台查看网络事件与维护公告。
4.2 控制台网卡与安全组:确认实例私/公网IP、子网、Security Group(或ACL)放通目标端口(如80/443)。
4.3 流量镜像与抓包:在云主机上用 tcpdump -i eth0 port 443 -w /tmp/cap.pcap;下载分析或用在线支持请求。
4.4 负载均衡与健康检查:检查LB健康检测配置(路径、端口、超时),并手动curl探测后端IP。
5.1 物理链路与设备:检查交换机端口状态、光模块、SFP指示灯,重启有疑问的交换机端口。
5.2 路由与NAT:查看路由表 ip route show;确认SNAT/DNAT规则 iptables -t nat -L -n。
5.3 防火墙规则核对:iptables -L -n;ufw status;Windows:netsh advfirewall firewall show rule name=all。
5.4 ISP与对端连通:用 mtr -rw <目标IP> 观察丢包在哪一跳,若在ISP侧需联系ISP并提供mtr/traceroute输出。
6.1 若问题在物理链路、骨干路由或机房交换/防护设备,通常由托管服务商或ISP负责。
6.2 若问题在实例内进程、应用配置、主机防火墙或DNS记录错误,属于客户责任。
6.3 收集证据流程:1)截图控制台错误/事件;2)保存traceroute、mtr、ping、tcpdump输出;3)将这些证据提交给对方支持以界定责任。
7.1 答:第一步看问题类型:若是域名解析或应用报错,先报给应用/运维团队;若是从多个外网都无法达通并且traceroute显示在ISP/机房跳点丢包,应立即联系托管商或ISP,并提供traceroute与mtr结果。
8.1 答:快速四步:1) nslookup/ dig 确认DNS;2) traceroute/tracert 到IP看丢包跳点;3) curl/telnet 测端口;4) 登录主机看服务进程与日志。若第2步在ISP/机房跳点终止,多半是托管/ISP责任。
9.1 答:建议:使用多地区或CDN(靠近PH的POP),配置健康检查与自动回滚;在托管合同写明连通SLA与故障响应;做好监控(ping/MTR告警)、定期演练故障切换并保留traceroute历史以便快速定位。