Recently Published
CASO 1: ANALISIS FINANCIERO ADIDAS
Juan Manuel Jimenez V., Jose Miguel Silva P.
2025-11-15
metopen
y
Miniproyecto: Clasificación Multiclase de Hongos con Naive Bayes Categórico | Análisis del Dataset Mushroom
Este análisis clasifica hongos como comestibles o venenosos en el dataset Mushroom de UCI (8.124 observaciones, 23 variables categóricas) usando Naive Bayes Categórico en R.
Aspectos clave:
Descarga automática y limpieza (manejo de valores faltantes "?").
Análisis exploratorio: distribución de clases y poder discriminativo de variables (destacando odor).
Modelado Naive Bayes: comparación entre modelo simple (solo odor) y completo (todas las variables).
Validación con 10-fold CV y partición train/test.
Comparación con KNN (one-hot encoding y optimización de k).
Visualizaciones y métricas clave (Accuracy, matriz de confusión, falsos negativos).
Hallazgos principales:
Naive Bayes solo con odor logra 98.89% accuracy en test y 98.52% en CV, superando al modelo completo (95.01%).
Evidencia de dilución de señal por variables redundantes.
KNN alcanza hasta 100% accuracy con k óptimo, pero exige más preprocesamiento y pierde interpretabilidad.
Confirmación del principio de parsimonia: la simplicidad prevalece.