Spaces:
Runtime error
Runtime error
File size: 3,054 Bytes
d7b8a56 37e4317 d7b8a56 48a434d 74394f3 ef5ff70 37e4317 5571720 0252488 5571720 48a434d ca56df3 37e4317 8e22859 ca56df3 8e22859 ca56df3 8e22859 48a434d f6f6779 409d336 48a434d 409d336 48a434d |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 |
---
title: Proyecto Stable Diffusion
emoji: ⚡
colorFrom: pink
colorTo: blue
sdk: streamlit
sdk_version: 1.19.0
app_file: app.py
pinned: false
license: mit
---
## Construcción del modelo
Este es un modelo basado en StableDiffusion concretamente en `stabilityai/stable-diffusion-2`, donde se usó la tecnica de inversión textual que consiste en un proceso de enseñar a un generador de imágenes un concepto visual específico mediante el uso de ajuste fino.
Conceptualmente, la inversión textual funciona aprendiendo un token embedding para un nuevo token de texto, manteniendo congelados los componentes restantes de StableDiffusion.
El modelo fue subido directamente a huggingface el cual se encuentra en: https://huggingface.co/lfernandopg/mach-5-model-v1
El notebook donde fue entrenado y desarrollado el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Stable-Diffusion/blob/main/train.ipynb
## Características
Para este modelo se utilizó como concepto el famoso auto de carreras `Mach 5` el cual aparece en la serie animada `Meteoro`.
<img src="https://2.bp.blogspot.com/-nyehVQ3iULQ/TvO0rEvEuuI/AAAAAAAAAYw/SvuWWyS95es/s1600/mach%2B51.jpg" width="50%">
Para usar este modelo se debe especificar una entrada de texto en el idioma ingles que contenga el token `<mach-5>` el cual hace referencia al objeto que se desea representar, un ejemplo de esto puede ser:
`A <mach-5> in the outer space with stars, galaxies and asteroids`
Lo cual generará una salida con un conjunto de 4 imagenes referentes al concepto descrito en la entrada de texto.
<img src="https://huggingface.co/lfernandopg/mach-5-model-v1/resolve/main/exmple.png" width="50%">
## Fuente de Datos
Para las fuentes de datos se realizó un dataset a base de cinco fotos de un carrito de juguete del Mach 5
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/0/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/1/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/2/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/3/image/image.jpg" width="50%">
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/4/image/image.jpg" width="50%">
Dataset: https://huggingface.co/datasets/lfernandopg/mach-5-car
## Propuesta de valor
Este tipo de modelos puede ser de utilidad para empresas o personas que deseen recrear un producto u objeto en ciertas situaciones o condiciones para tener un referencia y punto de vista de como se representaría visualmente este producto u objeto en dichas situaciones y poder realizar una toma de decisión, tambien puede ser usado para generar imagenes con fines artisticos y para creación de recursos visuales.
|