File size: 3,054 Bytes
d7b8a56
 
37e4317
d7b8a56
 
 
 
 
 
 
 
 
48a434d
74394f3
ef5ff70
 
37e4317
5571720
 
0252488
5571720
48a434d
 
 
ca56df3
37e4317
8e22859
 
 
ca56df3
8e22859
 
ca56df3
8e22859
 
48a434d
f6f6779
 
 
 
 
 
 
 
 
 
 
 
409d336
48a434d
409d336
48a434d
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
---
title: Proyecto Stable Diffusion
emoji: 
colorFrom: pink
colorTo: blue
sdk: streamlit
sdk_version: 1.19.0
app_file: app.py
pinned: false
license: mit
---

## Construcción del modelo

Este es un modelo basado en StableDiffusion concretamente en `stabilityai/stable-diffusion-2`, donde se usó la tecnica de inversión textual que consiste en un proceso de enseñar a un generador de imágenes un concepto visual específico mediante el uso de ajuste fino.
Conceptualmente, la inversión textual funciona aprendiendo un token embedding para un nuevo token de texto, manteniendo congelados los componentes restantes de StableDiffusion.

El modelo fue subido directamente a huggingface el cual se encuentra en: https://huggingface.co/lfernandopg/mach-5-model-v1

El notebook donde fue entrenado y desarrollado el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Stable-Diffusion/blob/main/train.ipynb


## Características

Para este modelo se utilizó como concepto el famoso auto de carreras  `Mach 5`  el cual aparece en la serie animada  `Meteoro`. 

<img src="https://2.bp.blogspot.com/-nyehVQ3iULQ/TvO0rEvEuuI/AAAAAAAAAYw/SvuWWyS95es/s1600/mach%2B51.jpg" width="50%">

Para usar este modelo se debe especificar una entrada de texto en el idioma ingles que contenga el token  `<mach-5>`  el cual hace referencia al objeto que se desea representar, un ejemplo de esto puede ser:

`A <mach-5> in the outer space with stars, galaxies and asteroids`

Lo cual generará una salida con un conjunto de 4 imagenes referentes al concepto descrito en la entrada de texto.

<img src="https://huggingface.co/lfernandopg/mach-5-model-v1/resolve/main/exmple.png" width="50%">

## Fuente de Datos

Para las fuentes de datos se realizó un dataset a base de cinco fotos de un carrito de juguete del Mach 5

<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/0/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/1/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/2/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/3/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/4/image/image.jpg" width="50%">

Dataset: https://huggingface.co/datasets/lfernandopg/mach-5-car

## Propuesta de valor

Este tipo de modelos puede ser de utilidad para empresas o personas que deseen recrear un producto u objeto en ciertas situaciones o condiciones para tener un referencia y punto de vista de como se representaría visualmente este producto u objeto en dichas situaciones y poder realizar una toma de decisión, tambien puede ser usado para generar imagenes con fines artisticos y para creación de recursos visuales.