mobile wallpaper 1mobile wallpaper 2mobile wallpaper 3mobile wallpaper 4
840 字
2 分钟
分布式系统系列导读
2025-05-19

2024 年双十一,某电商平台在零点高峰期每秒处理超过 50 万笔订单。这些订单涉及库存扣减、支付结算、物流调度等多个服务,它们部署在上千台机器上,跨越多个数据中心。当其中一台机器宕机时,用户甚至毫无感知——这正是分布式系统的日常。

本系列从真实工程场景出发,系统梳理分布式系统的核心知识体系,涵盖共识算法、分布式事务、服务治理、可观测性等关键主题。

一、共识与一致性#

分布式系统最根本的挑战:多节点如何就某个值达成一致?

  • CAP 定理:一致性(Consistency)、可用性(Availability)、分区容错性(Partition Tolerance)三者不可兼得,是分布式设计的理论基石
  • Raft 算法:以易理解著称的共识算法,通过 Leader 选举和日志复制实现强一致性,是 etcd、Consul 等系统的核心
  • Paxos 协议:理论最优的共识协议,虽然理解门槛高,但仍是分布式共识的学术标杆
  • 一致性级别:从强一致性到最终一致性,不同场景需要不同的一致性保证

二、分布式事务#

跨服务的数据一致性是微服务架构的核心难题:

  • 2PC 与 3PC:两阶段提交和三阶段提交是分布式事务的协议基础,理解其阻塞和单点问题至关重要
  • TCC 模式:Try-Confirm-Cancel 模式通过业务层面的补偿实现最终一致性,是电商场景的常用方案
  • Saga 模式:长事务的编排方案,通过正向操作与补偿操作配对,适合跨服务业务流程

三、服务治理#

微服务架构下,服务间的通信与治理是工程实践的重点:

  • 服务发现:从 DNS 到注册中心,服务实例的动态注册与发现是微服务通信的基础
  • API 网关:作为系统统一入口,承担路由、限流、认证等横切关注点
  • Istio:基于 Sidecar 代理的服务网格实现,将流量管理、安全策略从业务代码中解耦

四、可观测性与容量#

系统上线只是开始,运行时的洞察与规划同样关键:

  • 分布式追踪:在跨服务调用链中定位性能瓶颈,是排查分布式系统问题的利器
  • 容量规划:从 QPS 估算到资源预留,科学的容量规划是系统稳定性的保障

阅读建议#

如果你是分布式系统初学者,建议按顺序阅读,从共识算法建立理论基础,再到事务和服务治理理解工程实践。如果你有一定经验,可以直接跳到感兴趣的章节,每篇文章都尽量做到自包含。

每个主题都从真实的工程场景切入,避免纯理论堆砌,力求让抽象概念落地。

支持与分享

如果这篇文章对你有帮助,欢迎支持作者或分享给更多人

分布式系统系列导读
https://blog.souloss.com/posts/distributed/distributed-series-guide/
作者
Souloss
发布于
2025-05-19
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时