# Redes perceptr√≥n y multicapa


Bienvenidos al notebook de redes perceptr√≥n y multicapa.

En este notebook aprenderemos los conceptos fundamentales detr√°s de las redes neuronales, comenzando desde el modelo m√°s b√°sico conocido como el perceptr√≥n, hasta extendernos a las redes neuronales multicapa (MLP). Las redes neuronales son uno de los pilares en el aprendizaje profundo y tienen aplicaciones en diversas √°reas como la clasificaci√≥n de datos, predicci√≥n de comportamientos, procesamiento de im√°genes, y m√°s. A trav√©s de este material, explicaremos desde los conceptos b√°sicos y las f√≥rmulas matem√°ticas, hasta la implementaci√≥n de ejemplos pr√°cticos en Python.

A lo largo del notebook:

1. Conocer√°s qu√© es un perceptr√≥n y c√≥mo funciona.

2. Aprender√°s a entrenar un modelo de perceptr√≥n para resolver problemas de clasificaci√≥n binaria.

3. Entender√°s el concepto de redes neuronales multicapa (MLP) y c√≥mo se utilizan para resolver problemas m√°s complejos.

4. Practicar√°s con ejemplos pr√°cticos y ejercicios dise√±ados para que puedas aplicar los conocimientos adquiridos.

Comencemos.

#1. Conceptos b√°sicos y el perceptr√≥n:
###1. ¬øQu√© es un perceptr√≥n?
Un perceptr√≥n es el modelo m√°s simple de una neurona artificial. Imita el comportamiento de una neurona biol√≥gica y toma decisiones basadas en las entradas que recibe. En t√©rminos simples, un perceptr√≥n toma varias entradas, realiza algunos c√°lculos y da una salida, que puede ser 0 o 1.

###2. ¬øQu√© es un peso (weight)?
Un peso es un valor num√©rico que indica la importancia de cada entrada. Si una entrada tiene un peso alto, significa que esa entrada tiene un gran impacto en la salida del perceptr√≥n. Si el peso es bajo, la entrada tiene menos impacto.

Por ejemplo, si estamos evaluando a un estudiante basado en su asistencia y su calificaci√≥n, podr√≠amos darle m√°s importancia (mayor peso) a la calificaci√≥n si creemos que es m√°s relevante para decidir si aprueba o no.

###3. ¬øQu√© es el sesgo (bias)?
El sesgo es otro valor num√©rico que se a√±ade para ajustar la salida del perceptr√≥n. Permite que el perceptr√≥n decida correctamente incluso si todas las entradas son 0. En otras palabras, el sesgo permite desplazar la funci√≥n de activaci√≥n y hacerla m√°s flexible.

###4. ¬øQu√© es una suma ponderada?
Una suma ponderada es una operaci√≥n en la que cada entrada se multiplica por su peso y luego se suman todos esos valores, junto con el sesgo:
$$\text{suma ponderada} = w_1 \cdot x_1 + w_2 \cdot x_2 + ... + b$$

Donde:

$ùë§_1$, $ùë§_2$ son los pesos de las entradas,

$ùë•_1$, $ùë•_2$ son las entradas,

ùëè es el sesgo.

Usamos esta suma ponderada para calcular qu√© tan fuerte debe ser la salida.

###5. ¬øQu√© es una funci√≥n de activaci√≥n?
La funci√≥n de activaci√≥n toma la suma ponderada y decide la salida final del perceptr√≥n. En este ejemplo, usaremos la funci√≥n escal√≥n.

###¬øQu√© es la funci√≥n escal√≥n?
La funci√≥n escal√≥n es una funci√≥n muy simple que devuelve 1 si la entrada es mayor o igual a 0, y devuelve 0 si la entrada es menor que 0:
$$
f(x) =
\begin{cases}
1 & \text{si } x \geq 0 \\
0 & \text{si } x < 0
\end{cases}
$$

Usamos esta funci√≥n para decidir si el estudiante aprueba (1) o no (0), bas√°ndonos en la suma ponderada de sus calificaciones y asistencia.

###6. ¬øQu√© es la l√≥gica AND?
La l√≥gica AND es una operaci√≥n en la que el resultado es verdadero (1) solo si ambas condiciones son verdaderas. Por ejemplo, si estamos evaluando la asistencia (A) y la calificaci√≥n (C):

A = 1 (buena asistencia) y C = 1 (buena calificaci√≥n) ‚ûî Resultado: 1 (aprueba)
A = 0 o C = 0 ‚ûî Resultado: 0 (no aprueba)
Ahora que conocemos estos conceptos, vamos a aplicar todo en un c√≥digo simple.

In [1]:
import numpy as np

# Funci√≥n de activaci√≥n Escal√≥n
def step_function(x):
    """
    La funci√≥n escal√≥n devuelve 1 si x es mayor o igual a 0,
    de lo contrario devuelve 0.
    """
    return 1 if x >= 0 else 0

# Clase Perceptr√≥n Simple
class Perceptron:
    def __init__(self, weights, bias):
        """
        Inicializa el perceptr√≥n con pesos y sesgo.
        - weights: Lista de pesos para las entradas.
        - bias: Valor del sesgo.
        """
        self.weights = weights  # Asignamos los pesos a cada entrada
        self.bias = bias        # Asignamos el sesgo para ajustar la salida

    def predict(self, inputs):
        """
        Predice el resultado usando los pesos, el sesgo y la funci√≥n de activaci√≥n.
        - inputs: Lista de entradas [x1, x2].
        """
        # Calcula la suma ponderada de las entradas m√°s el sesgo
        total = np.dot(self.weights, inputs) + self.bias
        # Aplica la funci√≥n escal√≥n para determinar la salida
        return step_function(total)

# Definimos los pesos y el sesgo
# Ambos pesos iguales para dar la misma importancia a las entradas, sesgo negativo para ajustar la salida
weights = np.array([1, 1])  # Pesos de las entradas (asistencia y calificaci√≥n)
bias = -1.5                 # Sesgo para desplazar la funci√≥n

# Crear el perceptr√≥n
perceptron = Perceptron(weights, bias)

# Pruebas con los datos de entrada (asistencia y calificaci√≥n)
test_inputs = [
    (0, 0),  # No asisti√≥ lo suficiente y no aprob√≥ el examen
    (0, 1),  # No asisti√≥ lo suficiente pero aprob√≥ el examen
    (1, 0),  # Asisti√≥ lo suficiente pero no aprob√≥ el examen
    (1, 1)   # Asisti√≥ lo suficiente y aprob√≥ el examen
]

# Salidas esperadas para la l√≥gica AND: [0, 0, 0, 1]
for inputs in test_inputs:
    result = perceptron.predict(np.array(inputs))
    print(f"Entradas: {inputs}, Resultado: {result}")

Entradas: (0, 0), Resultado: 0
Entradas: (0, 1), Resultado: 0
Entradas: (1, 0), Resultado: 0
Entradas: (1, 1), Resultado: 1


##Clases, instancias y m√©todos en python
Para entender c√≥mo funciona el perceptr√≥n en el c√≥digo, es importante aclarar algunos conceptos fundamentales de la programaci√≥n orientada a objetos (OOP), un paradigma que organiza el c√≥digo en torno a objetos que representan entidades del mundo real o conceptos abstractos.

###¬øQu√© es una clase?
Una clase es como un plano o plantilla para crear objetos. Define las propiedades (variables) y los comportamientos (funciones o m√©todos) que los objetos creados a partir de esa clase tendr√°n.

Por ejemplo, si queremos modelar un "Perceptr√≥n", la clase Perceptron ser√≠a el plano que define c√≥mo funciona un perceptr√≥n y qu√© datos necesita manejar.

**Analog√≠a**: Piensa en una clase como el plano de un coche. El plano indica que los coches deben tener ruedas, motor y volante, y tambi√©n explica c√≥mo se encienden o se conducen. Pero el plano no es el coche en s√≠.

###¬øQu√© es una instancia?
Una instancia es un objeto creado a partir de una clase. Si la clase es el plano, entonces una instancia es el coche real que construimos a partir de ese plano.

En el contexto del perceptr√≥n, cuando escribimos:
`mi_perceptron = Perceptron()`

Estamos creando una instancia del perceptr√≥n. Esa instancia mi_perceptron es un objeto que tiene sus propios datos y puede utilizar los m√©todos definidos en la clase Perceptron.

**Analog√≠a**: Si la clase es el plano de un coche, entonces la instancia es el coche espec√≠fico que has construido bas√°ndote en ese plano.

###¬øQu√© son los m√©todos?
Los m√©todos son funciones que se definen dentro de una clase y que describen el comportamiento de las instancias de esa clase. Los m√©todos pueden manipular datos que pertenecen a la instancia, y para hacer esto, utilizan self, que representa la propia instancia.

Por ejemplo:

`class Perceptron:`

    def entrenar(self, datos, etiquetas):
        # Aqu√≠ `entrenar` es un m√©todo que usa `self` para operar en la instancia
        # `self` permite acceder a los datos que pertenecen a esta instancia particular


En el c√≥digo del perceptr√≥n, los m√©todos definen c√≥mo el perceptr√≥n se entrena y realiza predicciones. Cada vez que se llama a un m√©todo en un objeto, como mi_perceptron.entrenar(datos, etiquetas), ese m√©todo act√∫a sobre la instancia espec√≠fica de mi_perceptron.

**Analog√≠a**: Volviendo a la idea del coche, un m√©todo ser√≠a la funci√≥n para "arrancar" el coche. Todos los coches (instancias) tienen la capacidad de arrancar, pero cada coche espec√≠fico puede arrancar independientemente del otro.

###¬øQu√© es self?
En Python, self es una referencia a la instancia actual de la clase. Cuando definimos m√©todos dentro de una clase, el primer par√°metro siempre es self, y se utiliza para acceder a las variables y m√©todos de la propia instancia. Es como si dij√©ramos: "Usa el valor o m√©todo que pertenece a este objeto en particular."

Por ejemplo, si tenemos:

`class Perceptron:`

    def __init__(self):

        self.peso = 0.5

##¬øC√≥mo funciona esto como perceptr√≥n?
La principal tarea del perceptron es clasificar datos binarios bas√°ndose en una combinaci√≥n lineal de entradas.

###Entradas y pesos (weights y inputs):

Las entradas (x1, x2, etc.) son valores que se pasan al perceptr√≥n.
Los pesos (w1, w2, etc.) son valores que indican la importancia de cada entrada. Por ejemplo, si una entrada es m√°s relevante que otra, su peso ser√° mayor.

###Suma ponderada (weighted sum):

El perceptr√≥n toma las entradas y multiplica cada una por su peso correspondiente, luego suma esos valores y agrega un sesgo (bias). Esto se llama "suma ponderada":
$$\text{suma ponderada} = w_1 \cdot x_1 + w_2 \cdot x_2 + ... + b$$

###Funci√≥n de activaci√≥n:

Despu√©s de calcular la suma ponderada, el perceptr√≥n pasa el resultado a trav√©s de una funci√≥n de activaci√≥n, que decide si la salida ser√° 1 (verdadero) o 0 (falso). En el ejemplo anterior, la funci√≥n de activaci√≥n era una funci√≥n escal√≥n, que devuelve 1 si la suma es mayor o igual a 0, y 0 si es menor.
Clasificaci√≥n:

Bas√°ndose en la salida de la funci√≥n de activaci√≥n, el perceptr√≥n decide si clasificar las entradas como una categor√≠a u otra.


#2. Redes neuronales multicapa (MLP)
Ahora que hemos visto el perceptr√≥n simple, es momento de introducir una estructura m√°s compleja y potente: las Redes Neuronales Multicapa o MLP (Multilayer Perceptrons). Estas redes son una extensi√≥n del perceptr√≥n simple, donde en lugar de tener una sola capa de neuronas, tenemos m√∫ltiples capas que permiten aprender patrones m√°s complejos.

##¬øQu√© es una red neuronal multicapa?
Una Red Neuronal Multicapa (MLP) consiste en:

Una capa de entrada: Recibe los datos de entrada.
Una o m√°s capas ocultas: Estas capas est√°n "escondidas" entre la entrada y la salida. Cada capa oculta est√° formada por m√∫ltiples neuronas (perceptrones) que procesan la informaci√≥n y la pasan a la siguiente capa.
Una capa de salida: Produce el resultado final, que puede ser una clasificaci√≥n, una regresi√≥n, etc.
Analog√≠a: Imagina que tienes que decidir qu√© ropa ponerte en la ma√±ana. Primero miras el clima (entrada), luego piensas en qu√© ropa es adecuada para ese clima (capa oculta), y finalmente decides qu√© ponerte (salida). La capa oculta procesa la informaci√≥n de entrada para ayudarte a tomar una decisi√≥n.

###Funcionamiento de las MLP
El flujo de informaci√≥n en una MLP se da de la siguiente manera:

1. La capa de entrada recibe los datos. Cada dato pasa a trav√©s de la red, comenzando en esta capa.
2. La informaci√≥n fluye hacia adelante, desde la capa de entrada, a trav√©s de las capas ocultas, hasta llegar a la capa de salida. Este proceso se llama feedforward.
3. Cada neurona realiza una operaci√≥n matem√°tica (similar a la del perceptr√≥n) que involucra multiplicar los valores de entrada por pesos, sumar un sesgo y aplicar una funci√≥n de activaci√≥n.
4. Aprendizaje: Los pesos y sesgos de la red se ajustan durante el proceso de entrenamiento para que la red pueda hacer mejores predicciones. Este ajuste se realiza mediante algoritmos de optimizaci√≥n que minimizan el error entre la salida de la red y los valores reales.

###F√≥rmula b√°sica de una red neuronal multicapa
En una MLP, cada neurona realiza una operaci√≥n como la siguiente:
$$y = f\left(\sum_{i=1}^{n} w_i \cdot x_i + b\right)$$

donde:

ùë¶ es la salida de la neurona,

ùëì es la funci√≥n de activaci√≥n,

ùë§ùëñ son los pesos asociados a cada entrada ùë•ùëñ,

ùëè es el sesgo.

###La funci√≥n sigmoide
La funci√≥n sigmoide es una funci√≥n matem√°tica que transforma cualquier valor real en un n√∫mero entre 0 y 1. Se utiliza en redes neuronales porque puede interpretar los resultados como probabilidades. La f√≥rmula de la funci√≥n sigmoide es:
$$\sigma(x) = \frac{1}{1 + e^{-x}}$$
Esta funci√≥n nos permite decidir si una neurona se "activa" o no, similar a c√≥mo el cuerpo humano decide si ciertos m√∫sculos se contraen en respuesta a est√≠mulos.

###¬øPor qu√© usamos una red neuronal multicapa (MLP)?
A diferencia del perceptr√≥n simple que puede resolver problemas sencillos, como la l√≥gica AND/OR, las redes multicapa pueden manejar situaciones m√°s complejas gracias a las capas ocultas. Estas capas ayudan a descubrir patrones m√°s profundos en los datos, permitiendo que la red sea capaz de resolver problemas m√°s dif√≠ciles, como clasificar tipos de flores o predecir si un cliente comprar√° un producto.

###Tasa de aprendizaje
La tasa de aprendizaje (learning rate) es un par√°metro que determina el tama√±o de los pasos que la red da al ajustar los pesos durante el proceso de entrenamiento. En cada iteraci√≥n, la red ajusta los pesos para minimizar el error, y la tasa de aprendizaje define cu√°nto se ajustan los pesos en cada paso.

**Ejemplo**: Imagina que est√°s ajustando el volumen de una radio. Si haces ajustes grandes, podr√≠as pasar de un volumen muy bajo a uno muy alto r√°pidamente. En cambio, si haces ajustes peque√±os, puedes encontrar el volumen perfecto poco a poco. En este caso, la tasa de aprendizaje ser√≠a el tama√±o de esos ajustes.

###√âpocas
Una √©poca se refiere a un ciclo completo en el que el modelo de red neuronal ve todos los ejemplos del conjunto de datos una vez. Durante el entrenamiento, la red necesita pasar por varias √©pocas para ajustar sus pesos correctamente.

**Ejemplo**: Si tienes 100 im√°genes para entrenar a una red a reconocer perros, una √©poca ser√≠a cuando la red ha visto esas 100 im√°genes una vez. Si repites este proceso 10 veces, habr√°s completado 10 √©pocas.

###Backpropagation
Backpropagation (retropropagaci√≥n) es el algoritmo que se utiliza para ajustar los pesos de la red neuronal durante el entrenamiento. Funciona calculando el error en la salida (la diferencia entre el resultado esperado y el resultado actual), y luego retropropaga ese error a trav√©s de la red para ajustar los pesos y reducir el error.

**C√°lculo del Error**: El algoritmo mide la diferencia entre la salida esperada y la salida actual.

**Derivadas Parciales**: Utiliza derivadas parciales para calcular c√≥mo afecta cada peso al error.

**Ajuste de Pesos**: Ajusta los pesos de la red para reducir el error la pr√≥xima vez que se procese un dato similar.

###Ajuste de pesos y sesgos
Durante el entrenamiento, la red ajusta los pesos y sesgos para minimizar el error. Los pesos determinan la importancia que tiene cada entrada en la red, mientras que el sesgo act√∫a como un ajuste adicional que ayuda a desplazar la funci√≥n de activaci√≥n.

**Pesos**: Si un peso es alto, significa que la entrada asociada tiene un impacto significativo en la salida.

**Sesgos**: Ayudan a que la red pueda ajustar las funciones de activaci√≥n para que el modelo aprenda patrones complejos.

###Entrenar la red
Entrenar una red significa permitirle ajustar sus pesos y sesgos para que pueda aprender a producir las salidas correctas a partir de las entradas dadas. Durante el entrenamiento, el modelo se presenta con datos, ajusta los pesos y sesgos utilizando backpropagation, y repite este proceso durante muchas √©pocas.

Es decir, el entrenamiento es el proceso de aprendizaje en el que la red se ajusta a los datos que se le dan para poder predecir o clasificar nuevos datos con precisi√≥n en el futuro.

##Ejemplo: Clasificaci√≥n de tipos de flores
Imaginemos que tenemos un peque√±o jard√≠n con dos tipos de flores: rosas y girasoles. Queremos que nuestra red neuronal pueda identificar qu√© flor es cu√°l bas√°ndose en caracter√≠sticas simples como el tama√±o de los p√©talos y el color.

In [2]:
import numpy as np

# Definimos la funci√≥n sigmoide y su derivada
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivada(x):
    return x * (1 - x)

# Creamos una clase para la red neuronal multicapa
class RedNeuronal:
    def __init__(self, entrada_neuronas, ocultas_neuronas, salida_neuronas):
        # Inicializamos los pesos aleatoriamente
        self.pesos_entrada_oculta = np.random.rand(entrada_neuronas, ocultas_neuronas)
        self.pesos_oculta_salida = np.random.rand(ocultas_neuronas, salida_neuronas)

        # Inicializamos los sesgos aleatoriamente
        self.sesgo_oculta = np.random.rand(ocultas_neuronas)
        self.sesgo_salida = np.random.rand(salida_neuronas)

    def feedforward(self, x):
        # Paso 1: Multiplicamos entradas por los pesos y sumamos el sesgo, aplicando la funci√≥n sigmoide
        self.capa_oculta = sigmoid(np.dot(x, self.pesos_entrada_oculta) + self.sesgo_oculta)

        # Paso 2: Repetimos para la capa de salida
        self.salida = sigmoid(np.dot(self.capa_oculta, self.pesos_oculta_salida) + self.sesgo_salida)
        return self.salida

    def entrenar(self, x, y, tasa_aprendizaje=0.1, epocas=10000):
        for _ in range(epocas):
            # Alimentamos la red
            salida_predicha = self.feedforward(x)

            # Calculamos el error
            error = y - salida_predicha

            # Backpropagation para ajustar los pesos
            ajuste_salida = error * sigmoid_derivada(salida_predicha)
            error_oculta = ajuste_salida.dot(self.pesos_oculta_salida.T)
            ajuste_oculta = error_oculta * sigmoid_derivada(self.capa_oculta)

            # Ajustamos los pesos y sesgos
            self.pesos_oculta_salida += self.capa_oculta.T.dot(ajuste_salida) * tasa_aprendizaje
            self.pesos_entrada_oculta += x.T.dot(ajuste_oculta) * tasa_aprendizaje
            self.sesgo_salida += np.sum(ajuste_salida, axis=0) * tasa_aprendizaje
            self.sesgo_oculta += np.sum(ajuste_oculta, axis=0) * tasa_aprendizaje

# Datos de entrada (por ejemplo, tama√±o del p√©talo, color en valores normalizados)
x = np.array([[0.3, 0.7], [0.6, 0.1], [0.8, 0.3], [0.2, 0.8]])
# Salidas esperadas (1 = rosa, 0 = girasol)
y = np.array([[1], [0], [0], [1]])

# Creaci√≥n de la red neuronal con 2 neuronas de entrada, 2 ocultas, 1 de salida
mlp = RedNeuronal(entrada_neuronas=2, ocultas_neuronas=2, salida_neuronas=1)

# Entrenamos la red
mlp.entrenar(x, y)

# Predicciones para las mismas entradas de entrenamiento
for flor in x:
    prediccion = mlp.feedforward(flor)
    print(f"Entrada: {flor} - Predicci√≥n: {prediccion}")

Entrada: [0.3 0.7] - Predicci√≥n: [0.96976808]
Entrada: [0.6 0.1] - Predicci√≥n: [0.02280046]
Entrada: [0.8 0.3] - Predicci√≥n: [0.02699387]
Entrada: [0.2 0.8] - Predicci√≥n: [0.98691131]


##Interpretaci√≥n de los resultados
En el c√≥digo que se ha ejecutado, hemos entrenado una red neuronal multicapa para clasificar diferentes tipos de flores seg√∫n ciertas caracter√≠sticas de entrada. Vamos a explicar qu√© significan los resultados obtenidos para que veamos c√≥mo la red est√° funcionando:

###Datos de entrada
Los datos de entrada representan caracter√≠sticas de las flores que queremos clasificar. En nuestro ejemplo, cada entrada tiene dos valores:

Ejemplos:

`[0.3, 0.7]`: Supongamos que representa caracter√≠sticas como el tama√±o del p√©talo y el color.

`[0.6, 0.1]`, `[0.8, 0.3]`, `[0.2, 0.8]`: Son otras combinaciones de caracter√≠sticas que describen distintas flores.

**Salidas esperadas**: Las salidas esperadas definen las etiquetas que queremos que la red aprenda a predecir:

1 (rosa) y 0 (girasol): Hemos asignado 1 para identificar una rosa y 0 para un girasol.

**Predicciones de la red**: Despu√©s de entrenar la red, se realiza la predicci√≥n para las mismas entradas que se usaron para entrenar. Los resultados obtenidos son valores que indican la "certeza" de la red de que la entrada corresponde a una rosa (1) o un girasol (0):

Interpretaci√≥n de resultados:

- Entrada `[0.3, 0.7]`: Predicci√≥n: `0.9697`

Esto significa que la red est√° muy segura de que esta combinaci√≥n de caracter√≠sticas corresponde a una rosa, ya que el valor est√° cerca de 1.

- Entrada `[0.6, 0.1]`: Predicci√≥n: `0.0228`

Aqu√≠, la red est√° segura de que esta flor no es una rosa, sino un girasol, porque la predicci√≥n es cercana a 0.

- Entrada `[0.8, 0.3]`: Predicci√≥n: `0.0260`

Al igual que en el caso anterior, la red indica que esta flor es un girasol.

- Entrada `[0.2, 0.8]`: Predicci√≥n: `0.9869`

Esta entrada tambi√©n es clasificada como una rosa con un alto grado de certeza.

#3. Ejemplos aplicados.
##Perceptr√≥n: Detecci√≥n de celdas solares da√±adas
**Contexto**: Imagina que trabajas en una empresa de energ√≠a renovable que utiliza paneles solares para generar electricidad. Uno de los problemas que enfrentan es detectar celdas solares da√±adas r√°pidamente para que puedan ser reemplazadas sin afectar la producci√≥n de energ√≠a. Para hacer esto, puedes usar un perceptr√≥n que ayude a clasificar si una celda solar est√° funcionando correctamente o si est√° da√±ada, bas√°ndose en ciertas mediciones de corriente y voltaje.

Explicaci√≥n del problema:

Entrada (x1, x2):

- x1: Corriente generada por la celda solar.

- x2: Voltaje de la celda solar.

Salida (y):

- 1: La celda est√° funcionando correctamente.

- 0: La celda est√° da√±ada.

Para simplificar, podemos asumir que si la corriente y el voltaje son bajos, la celda probablemente est√© da√±ada, y si ambos son altos, la celda est√° funcionando correctamente. El perceptr√≥n ayudar√° a clasificar estas entradas en dos categor√≠as: funcionando o da√±ada.

In [3]:
import numpy as np

class Perceptron:
    def __init__(self, tasa_aprendizaje=0.1, epocas=10):
        self.tasa_aprendizaje = tasa_aprendizaje
        self.epocas = epocas
        self.pesos = None
        self.sesgo = None

    def funcion_activacion(self, suma_ponderada):
        # Funci√≥n Escal√≥n
        return 1 if suma_ponderada >= 0 else 0

    def predecir(self, entrada):
        suma_ponderada = np.dot(entrada, self.pesos) + self.sesgo
        return self.funcion_activacion(suma_ponderada)

    def entrenar(self, entradas, salidas_esperadas):
        num_entradas = entradas.shape[1]
        self.pesos = np.zeros(num_entradas)
        self.sesgo = 0

        for _ in range(self.epocas):
            for entrada, salida in zip(entradas, salidas_esperadas):
                prediccion = self.predecir(entrada)
                error = salida - prediccion
                # Ajuste de pesos y sesgo
                self.pesos += self.tasa_aprendizaje * error * entrada
                self.sesgo += self.tasa_aprendizaje * error

# Ejemplos de datos de celdas solares
entradas = np.array([
    [0.5, 0.7],  # Celda funcionando bien
    [0.2, 0.1],  # Celda da√±ada
    [0.6, 0.9],  # Celda funcionando bien
    [0.1, 0.3]   # Celda da√±ada
])

# Salidas esperadas: 1 para funcionando, 0 para da√±ada
salidas_esperadas = np.array([1, 0, 1, 0])

# Creaci√≥n y entrenamiento del perceptr√≥n
perceptron = Perceptron()
perceptron.entrenar(entradas, salidas_esperadas)

# Prueba
nueva_entrada = np.array([0.4, 0.6])  # Celda potencialmente buena
prediccion = perceptron.predecir(nueva_entrada)
print(f"La predicci√≥n para la celda con entrada {nueva_entrada} es: {'Funciona correctamente' if prediccion == 1 else 'Est√° da√±ada'}")

La predicci√≥n para la celda con entrada [0.4 0.6] es: Est√° da√±ada


##MLP: Predicci√≥n de tipo de clima
Contexto: En meteorolog√≠a, es importante predecir el clima a partir de datos como la temperatura, la humedad y la velocidad del viento. Vamos a construir una Red Neuronal Multicapa (MLP) que pueda predecir si el clima ser√° "soleado", "nublado" o "lluvioso" bas√°ndose en estas entradas.

Explicaci√≥n del problema:

Entradas (x1, x2, x3):

1. x1: Temperatura.
2. x2: Humedad.
3. x3: Velocidad del viento.

Salidas (y):

- 0: Soleado.
- 1: Nublado.
- 2: Lluvioso.

En este ejemplo, la red neuronal aprender√° a reconocer patrones en los datos de entrada para hacer predicciones sobre el clima.

In [4]:
import numpy as np

class RedNeuronal:
    def __init__(self, entrada_neuronas, ocultas_neuronas, salida_neuronas, tasa_aprendizaje=0.1):
        self.tasa_aprendizaje = tasa_aprendizaje

        # Inicializaci√≥n de pesos
        self.pesos_entrada_oculta = np.random.rand(entrada_neuronas, ocultas_neuronas)
        self.pesos_oculta_salida = np.random.rand(ocultas_neuronas, salida_neuronas)

    def sigmoid(self, x):
        return 1 / (1 + np.exp(-x))

    def derivada_sigmoid(self, x):
        return x * (1 - x)

    def feedforward(self, x):
        self.capa_oculta = self.sigmoid(np.dot(x, self.pesos_entrada_oculta))
        salida = self.sigmoid(np.dot(self.capa_oculta, self.pesos_oculta_salida))
        return salida

    def backprop(self, x, y, salida):
        error = y - salida
        ajuste_salida = error * self.derivada_sigmoid(salida)

        # Ajuste de pesos
        error_oculta = ajuste_salida.dot(self.pesos_oculta_salida.T)
        ajuste_oculta = error_oculta * self.derivada_sigmoid(self.capa_oculta)

        self.pesos_oculta_salida += self.capa_oculta.T.dot(ajuste_salida) * self.tasa_aprendizaje
        self.pesos_entrada_oculta += x.T.dot(ajuste_oculta) * self.tasa_aprendizaje

    def entrenar(self, x, y, epocas=10000):
        for _ in range(epocas):
            salida = self.feedforward(x)
            self.backprop(x, y, salida)

# Datos de entrenamiento (temperatura, humedad, velocidad del viento)
x = np.array([
    [30, 40, 10],  # Soleado
    [20, 70, 20],  # Nublado
    [18, 90, 15],  # Lluvioso
    [25, 50, 5],   # Soleado
])

# Salidas esperadas en formato one-hot: 0 = Soleado, 1 = Nublado, 2 = Lluvioso
y = np.array([
    [1, 0, 0],  # Soleado
    [0, 1, 0],  # Nublado
    [0, 0, 1],  # Lluvioso
    [1, 0, 0],  # Soleado
])

# Creaci√≥n y entrenamiento de la red neuronal
mlp = RedNeuronal(entrada_neuronas=3, ocultas_neuronas=4, salida_neuronas=3)
mlp.entrenar(x, y)

# Prueba de predicci√≥n con nuevos datos
nuevo_clima = np.array([22, 65, 10])  # Clima potencialmente nublado
prediccion = mlp.feedforward(nuevo_clima)
print(f"Predicci√≥n del clima: {prediccion}")

Predicci√≥n del clima: [0.49999973 0.24999977 0.24999986]


**Actividad**: Interpreta los resultados de la predicci√≥n de la MLP.

#Ejercicios de pr√°ctica
##Ejercicio 1: Clasificaci√≥n binaria con perceptr√≥n - detecci√≥n de correo spam
**Contexto**: Imagina que est√°s desarrollando un sistema b√°sico de detecci√≥n de correos electr√≥nicos para clasificar si un mensaje es "spam" o "no spam".

Tienes algunas caracter√≠sticas simples que puedes usar:

Entrada (x1, x2):

1. x1: N√∫mero de enlaces en el correo.
2. x2: Cantidad de palabras en may√∫sculas.

Salida (y):
- 1: Spam.
- 0: No Spam.

**Objetivo**: Construir el perceptr√≥n y entrenarlo con algunos ejemplos b√°sicos, luego probar con nuevos correos para ver si el sistema puede detectar correctamente si son spam o no.

###Pseudoc√≥digo
1. Inicializar los pesos y el sesgo.
2. Definir la funci√≥n de activaci√≥n (funci√≥n escal√≥n).
3. Entrenar el perceptr√≥n con ejemplos de correos (n√∫mero de enlaces y palabras en may√∫sculas):
4. Ajustar los pesos y el sesgo seg√∫n los errores.
5. Probar con nuevos datos para ver si el perceptr√≥n clasifica correctamente.

Ejemplo de Entradas:
- Entrada 1: [5 enlaces, 8 may√∫sculas] -> Spam (1)
- Entrada 2: [1 enlace, 2 may√∫sculas] -> No Spam (0)

In [5]:
_____ Perceptron:
    def __init__(self, tasa_aprendizaje=0.1, e___s=10):
        self.tasa_aprendizaje = tasa_aprendizaje
        ____.epocas = epocas
        self._____ = None  # Pesos iniciales (se deben inicializar en el entrenamiento)
        self.sesgo = None  # Sesgo inicial (se debe inicializar en el entrenamiento)

    ___ funcion_activacion(self, suma_ponderada):
        # Aqu√≠ estamos usando la funci√≥n escal√≥n
        return 1 if suma_ponderada >= 0 else 0

    def predecir(self, entrada):
        # Aqu√≠ calculamos la suma ponderada para una entrada espec√≠fica
        suma_ponderada = sum([w * x for w, x in zip(self.pesos, entrada)]) + self.sesgo
        return self.funcion_activacion(suma_ponderada)

    def entrenar(self, e______s, salidas_esperadas):
        # Inicializar pesos y sesgo en 0
        self.pesos = [0 for _ in range(len(entradas[0]))]
        self.sesgo = 0

        for _ in range(self.epocas):
            for entrada, salida_esperada in zip(entradas, salidas_esperadas):
                # Calcular la predicci√≥n y el error
                prediccion = self.predecir(entrada)
                e____ = salida_esperada - prediccion

                # Ajustar pesos y sesgo
                ___ i in range(len(self.pesos)):
                    self.pesos[i] += self.tasa_aprendizaje * error * entrada[i]
                self.sesgo += self.tasa_aprendizaje * error

# EJEMPLOS DE ENTRENAMIENTO Y PRUEBA
________ = [[5, 8], [1, 2], [7, 3], [0, 0]]  # Datos de ejemplo para clasificar como spam o no
salidas = [1, 0, 1, 0]  # Salidas esperadas

# Crear y entrenar el perceptr√≥n
perceptron = Perceptron(tasa_aprendizaje=0._, epocas=__)
p________n.entrenar(entradas, salidas)

# Probar con nuevas entradas
nuevas_entradas = [[_, _], [_, _]]
for entrada __ nuevas_entradas:
    prediccion = perceptron.predecir(entrada)
    print(f"Entrada: {entrada} - Predicci√≥n: {prediccion}")

Entrada: [4, 6] - Predicci√≥n: 1
Entrada: [2, 0] - Predicci√≥n: 1


##Ejercicio 2: Red neuronal mlticapa (MLP) - Predicci√≥n de enfermedades en plantas
**Contexto**: En la agricultura, es importante detectar signos tempranos de enfermedades en las plantas para actuar a tiempo. Supongamos que se han recogido tres caracter√≠sticas clave de las hojas de las plantas:

1. x1: √çndice de color verde (m√°s bajo indica hojas amarillas).
2. x2: Tama√±o de manchas en las hojas.
3. x3: N√∫mero de hojas afectadas.

Vamos a construir una red neuronal multicapa que pueda predecir si la planta tiene "ninguna enfermedad", "enfermedad leve" o "enfermedad grave" basada en estos valores.

Salidas (y):
- 0: Ninguna enfermedad.
- 1: Enfermedad leve.
- 2: Enfermedad grave.


###Pseudoc√≥digo
1. Inicializar los pesos de las capas (entrada-oculta y oculta-salida).
2. Definir funciones:
  - Funci√≥n de activaci√≥n (sigmoide).
  -  Derivada de la funci√≥n de activaci√≥n.
3. Entrenamiento:
  - Hacer feedforward para calcular las predicciones.
  - Usar backpropagation para ajustar los pesos.
4. Probar con nuevos datos para verificar la predicci√≥n de la red.

Ejemplo de Entradas:

- Entrada 1: `[70 (verde intenso), 1 (manchas peque√±as), 0 (ninguna hoja afectada)]` -> `Ninguna enfermedad (0)`
- Entrada 2: `[30 (amarillenta), 3 (manchas grandes), 10 (m√∫ltiples hojas afectadas)]` -> `Enfermedad grave (2)`

In [None]:
class RedNeuronal:
    def __init__(self, entrada_neuronas, ocultas_neuronas, salida_neuronas, tasa_aprendizaje=0.1):
        # INICIALIZAR LOS PESOS

    def sigmoid(self, x):
        # DEFINIR FUNCI√ìN SIGMOIDE

    def derivada_sigmoid(self, x):
        # DEFINIR DERIVADA SIGMOIDE

    def feedforward(self, x):
        # COMPLETAR FEEDFORWARD

    def backprop(self, x, y, salida):
        # COMPLETAR BACKPROPAGATION

    def entrenar(self, x, y, epocas=10000):
        # ENTRENAMIENTO: COMPLETAR

# EJEMPLOS DE ENTRENAMIENTO Y PRUEBA: COMPLETAR

#Conclusi√≥n
En este notebook, hemos cubierto los fundamentos de las Redes Perceptr√≥n y Multicapa. Comenzamos explicando los conceptos b√°sicos detr√°s de un perceptr√≥n y c√≥mo este puede ser utilizado para problemas simples de clasificaci√≥n. Luego, exploramos c√≥mo las redes neuronales multicapa (MLP) pueden resolver problemas m√°s complejos gracias a su capacidad para aprender representaciones m√°s profundas y no lineales de los datos.

Hemos aprendido:

- La importancia de los pesos, sesgos y funciones de activaci√≥n en las redes neuronales.

- C√≥mo ajustar los pesos y sesgos a trav√©s del entrenamiento para que el modelo mejore su rendimiento.

- Los conceptos clave como la tasa de aprendizaje, √©pocas y el algoritmo de backpropagation que permiten a las redes aprender de los datos.

- Implementaciones pr√°cticas que nos muestran c√≥mo las redes pueden ser aplicadas a situaciones reales, como clasificar flores seg√∫n sus caracter√≠sticas.

Esperamos que este material haya proporcionado una base s√≥lida para entender las redes neuronales. ¬°Sigue practicando, experimenta con diferentes par√°metros, y no dudes en explorar m√°s all√° para descubrir el poder del aprendizaje profundo!