Spaces:

uthurumella
/

assi1

Configuration error

App Files Files Community

assi1 / ELR_plus /data_loader /webvision.py

uthurumella

Upload 69 files

72fc481 verified 5 months ago

raw

history blame

5.01 kB

	import sys
	import os
	import numpy as np
	from PIL import Image
	import torchvision
	from torch.utils.data.dataset import Subset
	from sklearn.metrics.pairwise import cosine_similarity, euclidean_distances
	import torch
	import torch.nn.functional as F
	import random

	def get_webvision(root, cfg_trainer, num_samples=0, train=True,
	transform_train=None, transform_val=None, num_class = 50):

	if train:
	train_dataset = Webvision(root, cfg_trainer, num_samples=num_samples, train=train, transform=transform_train, num_class = num_class)
	val_dataset = Webvision(root, cfg_trainer, num_samples=num_samples, val=train, transform=transform_val, num_class = num_class)
	print(f"Train: {len(train_dataset)} WebVision Val: {len(val_dataset)}")

	else:
	train_dataset = []
	val_dataset = ImagenetVal(root, transform=transform_val, num_class = num_class)
	print(f"Imagnet Val: {len(val_dataset)}")

	return train_dataset, val_dataset



	class ImagenetVal(torch.utils.data.Dataset):
	def __init__(self, root, transform, num_class):
	self.root = root+'imagenet/'
	self.transform = transform


	with open(self.root+'imagenet_val.txt') as f:
	lines=f.readlines()
	self.val_imgs = []
	self.val_labels = {}
	for line in lines:
	img, target = line.split()
	target = int(target)
	if target<num_class:
	self.val_imgs.append(img)
	self.val_labels[img]=target

	def __getitem__(self, index):

	img_path = self.val_imgs[index]
	target = self.val_labels[img_path]
	image = Image.open(self.root+'val/'+img_path).convert('RGB')
	img = self.transform(image)

	return img, target, index, target


	def __len__(self):
	return len(self.val_imgs)


	class Webvision(torch.utils.data.Dataset):

	def __init__(self, root, cfg_trainer, num_samples=0, train=False, val=False, test=False, transform=None, num_class = 50):
	self.cfg_trainer = cfg_trainer
	self.root = root
	self.transform = transform
	self.train_labels = {}
	self.test_labels = {}
	self.val_labels = {}

	self.train = train
	self.val = val
	self.test = test

	if self.val:
	with open(self.root+'info/val_filelist.txt') as f:
	lines=f.readlines()
	self.val_imgs = []
	self.val_labels = {}
	for line in lines:
	img, target = line.split()
	target = int(target)
	if target<num_class:
	self.val_imgs.append(img)
	self.val_labels[img]=target
	elif self.test:
	with open(self.root+'info/val_filelist.txt') as f:
	lines=f.readlines()
	self.test_imgs = []
	self.test_labels = {}
	for line in lines:
	img, target = line.split()
	target = int(target)
	if target<num_class:
	self.test_imgs.append(img)
	self.test_labels[img]=target
	else:
	with open(self.root+'info/train_filelist_google.txt') as f:
	lines=f.readlines()
	train_imgs = []
	self.train_labels = {}
	for line in lines:
	img, target = line.split()
	target = int(target)
	if target<num_class:
	train_imgs.append(img)
	self.train_labels[img]=target

	self.train_imgs = train_imgs

	def __getitem__(self, index):

	if self.train:
	img_path = self.train_imgs[index]
	target = self.train_labels[img_path]
	image = Image.open(self.root+img_path)
	img0 = image.convert('RGB')
	img0 = self.transform(img0)
	return img0, target, index, target
	elif self.val:
	img_path = self.val_imgs[index]
	target = self.val_labels[img_path]
	image = Image.open(self.root+'val_images_256/'+img_path).convert('RGB')
	img = self.transform(image)
	return img, target, index, target
	elif self.test:
	img_path = self.test_imgs[index]
	target = self.test_labels[img_path]
	image = Image.open(self.root+'val_images_256/'+img_path).convert('RGB')
	img = self.transform(image)
	return img, target, index, target



	def __len__(self):
	if self.test:
	return len(self.test_imgs)
	if self.val:
	return len(self.val_imgs)
	else:
	return len(self.train_imgs)