840 字
2 分钟
分布式系统系列导读
2024 年双十一,某电商平台在零点高峰期每秒处理超过 50 万笔订单。这些订单涉及库存扣减、支付结算、物流调度等多个服务,它们部署在上千台机器上,跨越多个数据中心。当其中一台机器宕机时,用户甚至毫无感知——这正是分布式系统的日常。
本系列从真实工程场景出发,系统梳理分布式系统的核心知识体系,涵盖共识算法、分布式事务、服务治理、可观测性等关键主题。
一、共识与一致性
分布式系统最根本的挑战:多节点如何就某个值达成一致?
- CAP 定理:一致性(Consistency)、可用性(Availability)、分区容错性(Partition Tolerance)三者不可兼得,是分布式设计的理论基石
- Raft 算法:以易理解著称的共识算法,通过 Leader 选举和日志复制实现强一致性,是 etcd、Consul 等系统的核心
- Paxos 协议:理论最优的共识协议,虽然理解门槛高,但仍是分布式共识的学术标杆
- 一致性级别:从强一致性到最终一致性,不同场景需要不同的一致性保证
二、分布式事务
跨服务的数据一致性是微服务架构的核心难题:
- 2PC 与 3PC:两阶段提交和三阶段提交是分布式事务的协议基础,理解其阻塞和单点问题至关重要
- TCC 模式:Try-Confirm-Cancel 模式通过业务层面的补偿实现最终一致性,是电商场景的常用方案
- Saga 模式:长事务的编排方案,通过正向操作与补偿操作配对,适合跨服务业务流程
三、服务治理
微服务架构下,服务间的通信与治理是工程实践的重点:
- 服务发现:从 DNS 到注册中心,服务实例的动态注册与发现是微服务通信的基础
- API 网关:作为系统统一入口,承担路由、限流、认证等横切关注点
- Istio:基于 Sidecar 代理的服务网格实现,将流量管理、安全策略从业务代码中解耦
四、可观测性与容量
系统上线只是开始,运行时的洞察与规划同样关键:
- 分布式追踪:在跨服务调用链中定位性能瓶颈,是排查分布式系统问题的利器
- 容量规划:从 QPS 估算到资源预留,科学的容量规划是系统稳定性的保障
阅读建议
如果你是分布式系统初学者,建议按顺序阅读,从共识算法建立理论基础,再到事务和服务治理理解工程实践。如果你有一定经验,可以直接跳到感兴趣的章节,每篇文章都尽量做到自包含。
每个主题都从真实的工程场景切入,避免纯理论堆砌,力求让抽象概念落地。
支持与分享
如果这篇文章对你有帮助,欢迎支持作者或分享给更多人
部分信息可能已经过时
相关文章 智能推荐
1
Istio:服务网格的工程实践
分布式系统深入 深入解析 Istio 服务网格——Sidecar 代理、流量管理、安全策略与可观测性的工程实践
2
服务发现:微服务通信的基础设施
分布式系统深入 深入理解服务发现机制——从 DNS 到注册中心,客户端发现与服务端发现的差异与工程实践
3
CAP 定理:分布式系统的不可能三角
分布式系统深入 深入理解 CAP 定理——一致性、可用性与分区容错性为何不可兼得,以及工程实践中的取舍策略
4
分布式追踪:定位跨服务性能瓶颈
分布式系统深入 深入解析分布式追踪——OpenTelemetry 标准、Span 与 Trace 模型、采样策略与 Jaeger 工程实践
5
什么是微服务?
技术科普 微服务架构深度解析——从定义、特征、与单体架构对比,到服务拆分策略、通信机制、治理模式,全面理解微服务的本质。






