1 min read 64 words Updated May 08, 2026 Created Jun 17, 2026

其设计核心十分简单:

  • Server 端:不断接收 FP 到某一层的数据,然后继续 FP 出最终答案,然后计算损失,BP 回到某一层,将误差项 $\delta$ 传回去,方便计算梯度。
  • Client 端:不断更新,取数据,FP 一半,先来个 DP 保护隐私,再继续 FP 到目标层,然后传到 Server 端,等待梯度,更新本地部分的数据。

但需要注意的一点设计:

  • 将完整的网络拆分了一段和二段计算。

  • 双服务器,实际上有两个服务器:

    • MainServer:负责二段 FP 计算,并且回传二段 BP 梯度。
    • FedServer:负责聚合边缘一段模型,并分发模型。
  • 两个变种:

    • SFLV1:Main Server 对每个客户端的数据独立跑完 FP/BP 后,按样本量加权平均梯度更新全局二段模型​ 。客户端侧仍由 Fed Server 聚合一段模型。
    • SFLV2:Main Server 按照随机顺序串行 smashed data,处理完就直接更新二段模型。
  • 隐私部分使用了 DP 梯度扰动和 PixelDP 输入扰动。不是学习重点,暂略。

    • 切分模型,其实也带来了模型隐私保护,非常棒!
  • PixelDP