Machine Learning


¿Que es el Machine Learning?


El machine learning es un subconjunto de la inteligencia artificial (IA). Se enfoca en enseñar a las computadoras para que aprendan de los datos y mejoren con la experiencia –en lugar de ser explícitamente programadas para hacerlo.




LA LIBRERIA "SCIKIT-LEARN"


Es un conjunto de herramientas para Python especializado en aprendizaje automático (Machine Learning), proporcionando recursos efectivos y accesibles para el análisis de datos y la creación de modelos predictivos. Se trata de un recurso de código abierto que goza de una considerable popularidad entre los científicos de datos y profesionales de machine learning


Scikit-Learn es una de estas librerías gratuitas para Python. Cuenta con algoritmos de clasificación, regresión, clustering y reducción de dimensionalidad. Además, presenta la compatibilidad con otras librerías de Python como NumPy, SciPy y matplotlib.

La gran variedad de algoritmos y utilidades de Scikit-learn la convierten en la herramienta básica para empezar a programar y estructurar los sistemas de análisis datos y modelado estadístico. Los algoritmos de Scikit-Learn se combinan y depuran con otras estructuras de datos y aplicaciones externas como Pandas o PyBrain.

La ventaja de la programación en Python, y Scikit-Learn en concreto, es la variedad de módulos y algoritmos que facilitan el aprendizaje y trabajo del científico de datos en las primeras fases de su desarrollo. La formación de un Máster en Data Science hace hincapié en estas ventajas, pero también prepara a sus alumnos para trabajar en otros lenguajes. La versatilidad y formación es la clave en el campo tecnológico.

EJEMPLO

EN ESTE EJEMPLO, EL MODELO UTILIZA LA ALTURA Y EL PESO PARA PREDECIR LA TALLA DE ROPA (PEQUEÑA, MEDIANA, GRANDE

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report

# Crear un conjunto de datos hipotético sobre tallas de ropa
np.random.seed(42)
altura = np.random.uniform(150, 190, 100)  # Altura en centímetros
peso = np.random.uniform(50, 90, 100)  # Peso en kilogramos
tallas = np.random.choice(['Pequeña', 'Mediana', 'Grande'], 100)

# Crear un DataFrame
data = pd.DataFrame({'Altura': altura, 'Peso': peso, 'Talla': tallas})

# Dividir el conjunto de datos en conjuntos de entrenamiento y prueba
X = data[['Altura', 'Peso']]
y = data['Talla']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Entrenar un modelo (Random Forest en este caso)
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_train, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = clf.predict(X_test)

# Evaluar el rendimiento del modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Precisión del modelo: {accuracy:.2f}")

# Mostrar informe de clasificación
print("\nInforme de clasificación:")
print(classification_report(y_test, y_pred))

EL RESULTADO SERIA



Comentarios

Entradas populares de este blog

MICRO SERVICIO PHYTON

LIBRERIA DE BASE DE DATOS DE PHYTON