pytorch有关 Dataset和 DataLoader的心得

先来看看官方文档的说法：https://pytorch.org/docs/stable/data.html

DataLoader支持两种数据集：map-style datasets 和 iterable-style datasets.

一般我们用的最多的是map-style datasets，因此这里只讲map类型的，还有我到目前为止也没用过iterable类型的。（无知导致无能，很抱歉，这部分我不知道~）

我们要使用map-style datasets，要实现两种方法__getitem__()和__len__(),这里我拿出我最近写的一个demo

class myDataset(Dataset):
    def __init__(self, data, label):
        self.data_list = data
        self.label_list = label
    def __getitem__(self, index):
        data_idx = []
        data_idx.append(word2idx.transform(self.data_list[index].split(), max_len=max_len))
        text = torch.LongTensor(data_idx)
        label = torch.LongTensor([self.label_list[index]])
        return text, label
    def __len__(self):
        return len(self.data_list)

dataset = myDataset(data_list, label_list)
data_loader = DataLoader(dataset, batch_size=128, shuffle=True)

注意点：

1、__getitem__(self,index)里面每次的返回值，是一对数据，即文本和标签，我们通过参数index来确定返回哪个数据。

（我之前是返回的一批数据直接导致内存爆了，真的是无知者无畏啊，给大家看看爆的多少，一百多G的GPU）

本文地址：https://blog.csdn.net/qq_40819945/article/details/109622591

《pytorch有关 Dataset和 DataLoader的心得.doc》

下载本文的Word格式文档，以方便收藏与打印。

相关推荐

如何在anaconda中安装pytorch1.7.1

这篇文章给大家介绍如何在anaconda中安装pytorch1.7.1，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。 1. 创建一个新的环境打开Anaconda Navigator，找不到的win10左下角输入一下就能找...
2024-03-14编程代码Anaconda,pytorch
pytorch学习笔记——timm库

　　当使用ChatGPT帮我们工作的时候，确实很大一部分人就会失业，当然也有很大一部分人收益其中。我今天继续使用其帮我了解新的内容，也就是timm库。毫不夸张的说，Chat GPT比百分之80的博客讲的更清楚更好，仅次...
2023-07-29编程代码pytorch,timm,学习笔记
[Pytorch框架] 4.2.1 使用Visdom在 PyTorch 中进行可视化

文章目录 4.2.1 使用Visdom在 PyTorch 中进行可视化安装坑基本概念 Environments Panes VIEW 可视化接口使用绘制简单的图形更新损失函数 import torch import math import numpy as np from visdom import ...
2023-07-29编程代码pytorch,可视化,框架
[Pytorch框架] 5.1 kaggle介绍

文章目录 5.1 kaggle介绍 5.1.1 Kaggle 平台简介比赛介绍 5.1.2 Kaggle板块介绍 Data Rules Team Kernels Discussion Leaderboard 5.1.3 Kaggle竞赛的排名机制 5.1.4 Kaggle薅羊毛指南 5.1.5 其他的一些数据竞赛...
2023-07-12编程代码pytorch,介绍,框架
[Pytorch框架] 1.4 Autograd：自动求导

文章目录 Autograd: 自动求导机制张量（Tensor）梯度 Autograd: 自动求导机制 PyTorch 中所有神经网络的核心是 autograd 包。我们先简单介绍一下这个包，然后训练第一个简单的神经网络。 autograd包为张量上的...
2023-07-11编程代码pytorch,框架,求导
Pytorch中怎么使用TensorBoard

本文小编为大家详细介绍“Pytorch中怎么使用TensorBoard”，内容详细，步骤清晰，细节处理妥当，希望这篇“Pytorch中怎么使用TensorBoard”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习新知识吧...
2023-06-28编程教程pytorch,Tensorboard
如何使用pytorch预训练层

这期内容当中小编将会给大家带来有关如何使用pytorch预训练层，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。 pytorch 预训练层的使用方法将其他地方训练好的网络，用到新...
2023-06-26编程教程pytorch
PyTorch预训练的实现

前言最近使用PyTorch感觉妙不可言，有种当初使用Keras的快感，而且速度还不慢。各种设计直接简洁，方便研究，比tensorflow的臃肿好多了。今天让我们来谈谈PyTorch的预训练，主要是自己写代码的经验以及论坛PyTo...
2023-06-26编程教程pytorch,tor,预训练