论文笔记 - GRAD-MATCH: A Gradient Matching Based Data Subset Selection For Efficient Learning

Analysis

Coreset 是带有权重的数据子集，目的是在某个方面模拟完整数据的表现（例如损失函数的梯度，既可以是在训练数据上的损失，也可以是在验证数据上的损失）；

给出优化目标的定义：

$w^t$ 是 t 轮得到的 coreset 权重，$X_t$ 是 t 轮得到的 coreset，$L$ 既可以是在训练数据上的损失，也可以是在验证数据上的损失，$L_T$ 是在 coreset 上的损失函数，$\theta_t$ 是 t 轮得到模型参数；

最小化 ERR 来使 Coreset 最好地模拟损失函数（训练集或验证集）的梯度。

如何优化这个问题

将其转化为次模函数：

之后可以用贪心算法快速解决。

Tricks

只计算最后一层的梯度；
现在完整的数据集上跑几个 epoch，获得一个较为靠近的模型权重（类似于 warm-up 和 pre-training）；
每过 R 个 epoch 再更新 coreset。

论文 笔记 - GRAD-MATCH: A Gradient Matching Based Data Subset Selection For Efficient Learning的相关教程结束。

《论文笔记 - GRAD-MATCH: A Gradient Matching Based Data Subset Selection For Efficient Learning.doc》

下载本文的Word格式文档，以方便收藏与打印。

相关推荐

Programming abstractions in C阅读笔记:p91-p106

《Programming Abstractions In C》学习第45天，p91-p102，完成第二章内容学习。总结如下：一、技术总结 1.垃圾回收 p91，"Some language, including Java support a system for dynamic allocation that active...
2023-08-11编程代码abstractions,笔记,阅读
论文解读（AAD）《Knowledge distillation for BERT unsupervised domain adaptation》

Note：[ wechat：Y466551 | 可加勿骚扰，付费咨询 ] 论文信息论文标题：Knowledge distillation for BERT unsupervised domain adaptation论文作者：Minho Ryu、Geonseok Lee、Kichun Lee论文来源：2022 aRxiv...
2023-08-07编程代码Knowledge,解读,论文
论文解读（DWL）《Dynamic Weighted Learning for Unsupervised Domain Adaptation》

[ Wechat：Y466551 | 付费咨询，非诚勿扰 ] 论文信息论文标题：Dynamic Weighted Learning for Unsupervised Domain Adaptation 论文作者：Jihong Ouyang、Zhengjie Zhang、Qingyi Meng论文来源：2023 aRxiv论...
2023-08-05编程代码dynamic,解读,论文
论文解读（APCA）《Adaptive prototype and consistency alignment for semi-supervised domain adaptation》

[ Wechat：Y466551 | 付费咨询，非诚勿扰 ] 论文信息论文标题：Adaptive prototype and consistency alignment for semi-supervised domain adaptation论文作者：Jihong Ouyang、Zhengjie Zhang、Qingyi Meng论...
2023-08-03编程代码Adaptive,解读,论文
【Python笔记】第一章Python基本语法

嗨你好，我是AllenMi，这是我学习北京理工大学的《Python语言程序设计》第一张笔记。写笔记的目的一方面在于记录自己一步一步学习Python的内容，另一方面也希望能够帮助到他人，快乐自己。让我们开始吧~ 编...
2023-08-01编程代码python,笔记,语法
Django笔记三十三之缓存操作

本文首发于公众号：Hunter后端原文链接：Django笔记三十三之缓存操作这一节介绍一下如何在 Django 中使用 redis 做缓存操作。在 Django 中可以有很多种方式做缓存，比如数据库，比如服务器文件，或者内存，...
2023-07-31编程代码操作,笔记,缓存
UpSetR 关联的 venneuler 包安装笔记

本文章已经设置了最低额度的付费阅读，如果您觉得文章对您有用，且手头宽裕，欢迎请作者喝杯热茶。本文章付费部分内容并不影响您对文章的阅读和理解，只是作者对付费阅读的一次尝试，感谢。背景 R 语言中的 ve...
2023-07-31编程代码关联,安装,笔记
《Generative Adversarial Nets》论文精读

论文精读《Generative Adversarial Nets》　　导言：生成模型是目前爆火的一个研究方向，据Microsoft对于ChatGPT-4的研究称“ChatGPT-4可以看成是通用型人工智能(AGI)的早期版本；其独特的推理能力和理解语义能力...
2023-07-30编程代码Generative,精读,论文