SplitFed • Jeefy's Blog

1 min read 64 words Updated May 08, 2026 Created Jun 17, 2026

其设计核心十分简单：

Server 端：不断接收 FP 到某一层的数据，然后继续 FP 出最终答案，然后计算损失，BP 回到某一层，将误差项 $\delta$ 传回去，方便计算梯度。
Client 端：不断更新，取数据，FP 一半，先来个 DP 保护隐私，再继续 FP 到目标层，然后传到 Server 端，等待梯度，更新本地部分的数据。

但需要注意的一点设计：

将完整的网络拆分了一段和二段计算。
双服务器，实际上有两个服务器：
- MainServer：负责二段 FP 计算，并且回传二段 BP 梯度。
- FedServer：负责聚合边缘一段模型，并分发模型。
两个变种：
- SFLV1：Main Server 对每个客户端的数据独立跑完 FP/BP 后，按样本量加权平均梯度更新全局二段模型。客户端侧仍由 Fed Server 聚合一段模型。
- SFLV2：Main Server 按照随机顺序串行 smashed data，处理完就直接更新二段模型。
隐私部分使用了 DP 梯度扰动和 PixelDP 输入扰动。不是学习重点，暂略。
- 切分模型，其实也带来了模型隐私保护，非常棒！
PixelDP