Spaces:
Runtime error
Runtime error
title: Proyecto Stable Diffusion | |
emoji: ⚡ | |
colorFrom: pink | |
colorTo: blue | |
sdk: streamlit | |
sdk_version: 1.19.0 | |
app_file: app.py | |
pinned: false | |
license: mit | |
## Construcción del modelo | |
Este es un modelo basado en StableDiffusion concretamente en `stabilityai/stable-diffusion-2`, donde se usó la tecnica de inversión textual que consiste en un proceso de enseñar a un generador de imágenes un concepto visual específico mediante el uso de ajuste fino. | |
Conceptualmente, la inversión textual funciona aprendiendo un token embedding para un nuevo token de texto, manteniendo congelados los componentes restantes de StableDiffusion. | |
El modelo fue subido directamente a huggingface el cual se encuentra en: https://huggingface.co/lfernandopg/mach-5-model-v1 | |
El notebook donde fue entrenado y desarrollado el modelo es el siguiente: https://huggingface.co/spaces/lfernandopg/Proyecto-Stable-Diffusion/blob/main/train.ipynb | |
## Características | |
Para este modelo se utilizó como concepto el famoso auto de carreras `Mach 5` el cual aparece en la serie animada `Meteoro`. | |
<img src="https://2.bp.blogspot.com/-nyehVQ3iULQ/TvO0rEvEuuI/AAAAAAAAAYw/SvuWWyS95es/s1600/mach%2B51.jpg" width="50%"> | |
Para usar este modelo se debe especificar una entrada de texto en el idioma ingles que contenga el token `<mach-5>` el cual hace referencia al objeto que se desea representar, un ejemplo de esto puede ser: | |
`A <mach-5> in the outer space with stars, galaxies and asteroids` | |
Lo cual generará una salida con un conjunto de 4 imagenes referentes al concepto descrito en la entrada de texto. | |
<img src="https://huggingface.co/lfernandopg/mach-5-model-v1/resolve/main/exmple.png" width="50%"> | |
## Fuente de Datos | |
Para las fuentes de datos se realizó un dataset a base de cinco fotos de un carrito de juguete del Mach 5 | |
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/0/image/image.jpg" width="50%"> | |
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/1/image/image.jpg" width="50%"> | |
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/2/image/image.jpg" width="50%"> | |
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/3/image/image.jpg" width="50%"> | |
<img src="https://datasets-server.huggingface.co/assets/lfernandopg/mach-5-car/--/lfernandopg--mach-5-car/train/4/image/image.jpg" width="50%"> | |
Dataset: https://huggingface.co/datasets/lfernandopg/mach-5-car | |
## Propuesta de valor | |
Este tipo de modelos puede ser de utilidad para empresas o personas que deseen recrear un producto u objeto en ciertas situaciones o condiciones para tener un referencia y punto de vista de como se representaría visualmente este producto u objeto en dichas situaciones y poder realizar una toma de decisión, tambien puede ser usado para generar imagenes con fines artisticos y para creación de recursos visuales. | |