Clasificación de Imágenes con Redes Neuronales y Modelos Preentrenados

Descripción

Este proyecto se centra en la clasificación de imágenes en diferentes categorías utilizando enfoques de aprendizaje profundo. Incluye el uso de:

Clasificadores lineales para tareas iniciales de clasificación.
Redes Neuronales Convolucionales (CNNs) diseñadas desde cero.
Modelos preentrenados como EfficientNet, ajustados para el conjunto de datos utilizado.

El sistema fue entrenado y evaluado con el conjunto de datos SUN20, que incluye 20 categorías de imágenes balanceadas.

🚀 Estructura del Proyecto

1. Clasificación Lineal:

Implementación de un clasificador lineal simple.
Entrenamiento utilizando Stochastic Gradient Descent (SGD).
Visualización de resultados iniciales.

2. Redes Neuronales Convolucionales (CNN):

Definición de arquitecturas convolucionales personalizadas.
Entrenamiento y evaluación en PyTorch.

3. Transfer Learning:

Ajuste de modelos preentrenados, como EfficientNet.
Optimizaciones para mejorar la precisión en el conjunto de datos SUN20.

4. Exploración y Visualización de Datos:

Uso de transformaciones en las imágenes.
Visualización de categorías y resultados en cuadrículas.

🛠 Tecnologías Utilizadas

Lenguaje de programación:
Bibliotecas principales:
- PyTorch → Para la construcción y entrenamiento de modelos.
- Torchvision → Para el manejo de datos de imagen.
- Matplotlib y PIL → Para la visualización y manipulación de imágenes.
- LivLossPlot → Para el monitoreo visual de las curvas de pérdida y precisión durante el entrenamiento.

⚙️ Configuración del Entorno

Requisitos previos

Python 3.8 o superior.
Instalar las dependencias del proyecto:

pip install torch torchvision matplotlib livelossplot

Estructura del Dataset

El proyecto utiliza el conjunto de datos SUN20, que contiene 20 categorías balanceadas. Para preparar el conjunto de datos:

Descarga los archivos del conjunto de datos:

wget http://www.cs.rice.edu/~vo9/deep-vislang/SUN20-train-sm.tar.gz
wget http://www.cs.rice.edu/~vo9/deep-vislang/SUN20-val.tar.gz

Extrae los archivos:

tar -xzf SUN20-train-sm.tar.gz
tar -xzf SUN20-val.tar.gz

Organiza las carpetas siguiendo la estructura SUN20/<split>/<categoría>/.

🔥 Ejecución del Proyecto

Entrenamiento de Clasificadores Lineales

Configura el dataset y las transformaciones necesarias.
Define el modelo lineal en PyTorch:

class LinearClassifier(nn.Module):
    def __init__(self, input_size, num_classes):
        super(LinearClassifier, self).__init__()
        self.linear = nn.Linear(input_size, num_classes)

    def forward(self, x):
        return self.linear(x)

Entrena el modelo utilizando SGD y analiza las curvas de aprendizaje.

Redes Neuronales Convolucionales (CNNs)

Diseña una arquitectura CNN personalizada:

class ConvnetClassifier(torch.nn.Module):
    def __init__(self):
        super(ConvnetClassifier, self).__init__()
        self.conv1 = torch.nn.Conv2d(3, 128, (5, 5))
        self.conv2 = torch.nn.Conv2d(128, 128, (3, 3))
        self.linear1 = torch.nn.Linear(128 * 10 * 10, 256)
        self.linear2 = torch.nn.Linear(256, 20)

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), (2, 2)))
        x = F.relu(F.max_pool2d(self.conv2(x), (2, 2)))
        x = x.view(x.size(0), -1)
        x = F.relu(self.linear1(x))
        return self.linear2(x)

Entrena el modelo con funciones de pérdida y optimizadores adecuados.

Transfer Learning con EfficientNet

Carga un modelo preentrenado y ajusta la última capa para adaptarlo al dataset:

from torchvision import models
model = models.efficientnet_v2_m(pretrained=True)
num_ftrs = model.classifier[1].in_features
model.classifier[1] = torch.nn.Linear(num_ftrs, 20)

Entrena el modelo ajustado y evalúa su rendimiento.

📊 Resultados

Clasificadores Lineales: Precisión inicial aproximada del 25%.
Redes Neuronales Convolucionales: Mejoras en la precisión con arquitecturas personalizadas.
Transfer Learning con EfficientNet: Precisión final de hasta el 91.5% después de 7 épocas.

Visualización de Resultados

📈 Gráficos de pérdida y precisión durante el entrenamiento.
📸 Visualización de predicciones con imágenes correctamente clasificadas (en verde) y mal clasificadas (en rojo).

👤 Autor

Joanna Alexandra Carrión Pérez

🎓 Bachiller de Ingeniería Electrónica
💡 Apasionada por la Ciencia de Datos y la Inteligencia Artificial
🔗 LinkedIn

📩 Contacto

Para cualquier duda o sugerencia, contáctame a través de joannacarrion14@gmail.com.

💡 Contribuciones

¡Contribuciones son bienvenidas! Si tienes ideas o mejoras, no dudes en hacer un fork del repositorio y enviar un pull request. 🚀

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
README.md		README.md
image_classification_project.ipynb		image_classification_project.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Clasificación de Imágenes con Redes Neuronales y Modelos Preentrenados

Descripción

🚀 Estructura del Proyecto

1. Clasificación Lineal:

2. Redes Neuronales Convolucionales (CNN):

3. Transfer Learning:

4. Exploración y Visualización de Datos:

🛠 Tecnologías Utilizadas

⚙️ Configuración del Entorno

Requisitos previos

Estructura del Dataset

🔥 Ejecución del Proyecto

Entrenamiento de Clasificadores Lineales

Redes Neuronales Convolucionales (CNNs)

Transfer Learning con EfficientNet

📊 Resultados

Visualización de Resultados

👤 Autor

📩 Contacto

💡 Contribuciones

About

Uh oh!

Releases

Packages

Languages

Joanna20Carrion/Clasificacion-de-Imagenes-con-Redes-Neuronales-y-Modelos-Preentrenados

Folders and files

Latest commit

History

Repository files navigation

Clasificación de Imágenes con Redes Neuronales y Modelos Preentrenados

Descripción

🚀 Estructura del Proyecto

1. Clasificación Lineal:

2. Redes Neuronales Convolucionales (CNN):

3. Transfer Learning:

4. Exploración y Visualización de Datos:

🛠 Tecnologías Utilizadas

⚙️ Configuración del Entorno

Requisitos previos

Estructura del Dataset

🔥 Ejecución del Proyecto

Entrenamiento de Clasificadores Lineales

Redes Neuronales Convolucionales (CNNs)

Transfer Learning con EfficientNet

📊 Resultados

Visualización de Resultados

👤 Autor

📩 Contacto

💡 Contribuciones

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages