[ 代码和诗 ]

Joint Local Relational Augmentation and Global Nash Equilibrium for Federated Learning with Non-IID Data

2025-07-16

这篇blog用于记录我学习一篇有关运用Nash博弈解决联邦学习有关问题的论文时，学习到的相关知识基础概念Federated Learning基本架构联邦学习的基本架构是Server和Clients Server通常没有数据，可以有一些用于评估模型的数据，但是在普通联邦学习中Server没有任何数据 Clients持有实际的训练数据，Clients的数量取决于有多少分布式的数据要参与训练。Clients会在各自的本地数据集上进行实际训练。服务器和客户端都拥有自己的模型副本，前者的称为全局模型，后者的称为局部模型。训练过程服务器初始化全局模型参数将...

Reforcement learning入门

2025-07-13

这篇blog用于记录我进行强化学习入门时学习到的基础知识基本概念一些基本要素： Agent：进行“学习”的主体，会通过学习到的经验与环境交互，并在与环境交互的过程中进一步学习。 Environment：Agent交互的对象，客观存在，例如智能驾驶捕捉到的一张图片 State：Agent观察当前自己所处环境，获取到的局部环境信息 Action：Agent根据State结合自己以往的经验做出的行动，行动会改变Environment（Action可能是离散值，也可能是连续值，处理方法是不同的） Reward：Agent执行Action改变Environmen...

Fairness-Aware Meta-Learning via Nash Bargaining

2025-07-06

这篇blog用于记录我阅读的一篇将传统的Game中的方法应用到学习中的论文论文理解思路：经典的Meta-learning的框架 Meta-learning在learning with fairness中的运用（框架、典型的方法）经典方法中存在的问题 & 使用 NBS的改进 Meta-learning的框架在解决机器学习的过程中对于不同group的公平性问题的时候，会使用sensitive-attributed validation set来训练调整模型的参数，这个过程与常规的训练过程相结合通常被套入一个meta-learning frame...

拜占庭将军问题与计算机系统的一致性

2025-05-25

拜占庭将军问题是什么（它阐述了什么）？对于n个将军，将一个视为指挥将军，其它n-1个视作它的副将，指挥将军会向所有副将发送命令。在此基础上，拜占庭将军问题就是考虑一种算法，确保1）所有忠诚的副将将遵守相同的命令；2）如果指挥将军是忠诚的，则每个忠诚的副将都必须遵循他发送的命令。如何确保忠诚的将军能够达成一致的行动计划？对于只能使用口头消息的时候，在叛徒数少于总数的三分之一的时候，忠诚的将军能够按照下面的方法达成一致的行动：我们将第一个发送决策值的将军看错指挥官；在0个叛徒时，指挥官将决策值传递给副将，副将根据接收到的消息，或默认的撤退，直接做出对应的决...

分布式的原子性与一致性

2025-05-25

一次计算机系统工程导论的习题问题一选择：A 因为小明的客户端到S3之间的网络经常停止工作，每次几分钟，而根据伪代码，在更新S3服务器上的信息的时候，while循环会一直尝试直到rpc_OK被置为true为止。所以CLENTWRITE通常需要花费几分钟（S3导致的）或更长的时间（可能不排除S1、S2也有出问题的可能性），去更新服务器。问题二返回：Breakfast 因为在系统没有故障的时候，该分布式系统的一致性是有得到保障的，根据题目中串行执行的代码，读取到的内容会是最后一次写入的内容，对应为Breakfast。问题三选择：AB 对于A，如果客户端计...

毛概复习

2025-05-18

用于记录我线上练习时遇到的知识点，以供日后复习的时候对照书本查看毛概与习概的复习思路都是先线上练习，记录知识点，期末的时候对照书本查看小题，同时背诵大题复习的时候要注意可能的题目变形第二阶段题库二十届三中全会1 2024年7月15至18日，二十届三中全会在北京举行。全会指出，到2029年，完成《决定》提出的改革任务。 2 二十届三中全会提出，要健全因地制宜发展新质生产力体制机制，推动技术革命性突破，生产要素创新性配置和产业深度转型升级。（没有实体经济数字化，可以想想，确实实体经济难道一定要数字化吗？有的经济可能本身就不适合数字化…） 3 党的二十届三中...

Nash-MTL（代码实现）

2025-05-16

这篇blog用于记录我阅读Nash-MTL算法基于python的implemention，其中存在大量使用pytorch、tensorflow的地方，这些是我之前几乎没有接触过的东西，所以同时我也会进行相关的记录，进行学习。 Readme整篇blog从Nash-MTL开源项目的Readme文档开始，可以帮助我了解整个项目的文件组织结构。 conda在Python中，conda 是一个开源的包管理器和环境管理器，它主要用于安装和管理Python包以及创建和管理虚拟环境。什么是包管理器和环境管理器通过查阅资料，我现在通俗的理解是：包/库，项目开...

分布式计算框架MapReduce

2025-05-15

这篇blog用于记录我在学习计算机系统工程导论时所做的一次实验。我阅读了一篇论文，其介绍了一种名为MapReduce的模型，它通过键值对来拆解任务同时并行地处理子任务，达到了提高数据吞吐率从而降低时延提高性能的效果。实验目的主要实验目的如下：通过实验，理解MapReduce框架的基本原理，掌握MapReduce框架的Map阶段和Reduce阶段的执行流程，以及数据的划分、传输和聚合过程，具备使用MapReduce进行简单的分布式数据处理，并能通过进一步自学进行更为复杂的分布式数据处理，从而掌握使用MapReduce进行大数据处理的基本系统设计能力。 ...

MapReduce

2025-05-11

这篇blog用于记录，我在学习计算机系统工程导论，有关性能的章节时，阅读的一篇叫做MapReduce的论文工程师提出MapReduce的编程模型和实现，他们的性能目标是什么？他们的性能目标是通过MapReduce实现大规模数据专用计算的自动并行化，使得缺少并行与分布式系统经验的程序员可以轻松利用大规模分布式系统资源，从而突破数据处理的时延这一性能瓶颈。 Google是怎么通过实现去满足这些目标的？MapReduce程序主要有用户部分和库部分，前者根据用户的业务逻辑需要在后者的基础上进行编写，而相关的并行化、容错、本地优化和负载均衡的细节被隐藏在后者中。...

六级词汇

2025-05-06

这篇博客用于记录我在备考英语六级时所做的词汇准备，目前我已经完成了核心词汇的记忆，我会在这里为这些词汇补充一些例句。目前的打算是每天20个词语，此外我会开始着手阅读、听力以及写译的准备，这篇blog中也会用于记录相应的内容词汇2025.05.061 stabilize “How can I stabilize the colour of our love, my dear.” 2 manipulate “Your mean is that you can manipualte such a monster machine.” 3 ambiguous “...