Recently Published
Demo Análisis de Twitter Mincultura
Este demo no representa la calidad final del producto.
Se hace conteo de tweets, retweets y replies, palabras frecuentes, palabras destacadas (TF-IDF), análisis de tópicos o temas, emociones y su propagación, evolución de las emociones y de los temas en el tiempo.
Covid19 en Colombia
Este tablero del Coronavirus: el caso de Colombia provee una visión general de la nueva epidemia coronavirus COVID-19 (2019-nCoV) para colombia y algunos países de Sudamérica. Los datos que alimentan este tablero es el conjunto de datos disponibles en el paquete de datos de R [`{coronavirus}`](https://github.com/RamiKrispin/coronavirus){target="_blank"}.
Asegúrese de descargar la versión de desarrollador del paquete para poder obtener una versión actualizada de los datos.
kickstarter:modelo lingüístico con 66% de precisión y word embeddings en 2D y 3D
A partir de las descripciones de los projectos en inglés corridos durante 2017 en kickstarter se desarrolla con Keras en R Studio un modelo que predice el resultado final con 66% de precisión. Y al final de grafican en 2d y 3D los embeddings obtenidos a través de esta tarea.
Obtención, limpieza, ordenado y acceso a datos de proyectos kickstarter
Contiene todos los pasos para obtener los datos de 215513 proyectos corridos en kickstarter durante 2017, así como el link para descargar el resultado final en csv
Kickstarter: Análisis exploratorio de datos y modelo lingüístico base
A partir de las descripciones de los proyectos en kickstarter se desarrolla un modelo que predice con 66% de precisión si un proyecto va a ser exitoso o no.
Datos de +250k proyectos de kickstarter
Obtención, limpieza y ordenado de datos de +250k datos de proyectos de kickstarter.
Analizando datos capturados desde rtweet (twitter) con h2o
Los datos de Twiter obtenidos a través de rtweet son analizados con una red de dos capas para generar un modelo que prediga la popularidad que un tweet tendrá. El modelo lo entrenamos con h2o, tratando de reproducir lo hecho antes con kerasformula.
Analizando datos capturados desde rtweet (twitter) con kerasformula
Los tweets obtenidos con rtweet y analizados con kerasformula, usando variables de los tweets y modelos multicapas parametrizables.
Uso de modelos pre entrenados con Keras en R Studio
Se usa un ResNet50 pre entrenado con ImageNet para clasificación de imágenes. Todo siguiendo el fabuloso tuto de R Studio.
Text prediction shiny app
This app is the Final Capstone for the Coursera & Johns Hopkins University specialization. I've developed an app which predicts the three more probables next words from the text you have inputted. The app implements the stupid back off model, but over all, the cleaning, tidying, tokenizing and counts of an big amount of text from the web previously collected.
Notebook IEFCIC 2: Endeudamiento no hipotecario
En esta segunda notebook abordamos los datos de endeudamiento no hipotecario para esbozar un modelo regresivo que permita, más que predecir, establecer la importancia preliminar de las variables: pasando de 50 a 7 a hacemos realizable la labor y obtenemos alguna información relevante.
Introducción al análisis exploratorio de datos de comportamiento y educación financiera en Colombia
Hemos desarrollado una notebook para faciliar el acceso a los datos y los ejercicios adelantados a manera de introducción los vídeos https://www.youtube.com/watch?v=6ULCP7NsITY y en https://www.youtube.com/watch?v=5wCkW6y36DA
DSS First Milestone
This is an advancement of my work on the final capstone of the Coursera Data Science specialization.
Here I'm showing the getting data, cleaning, exploration and the first milestone of the model I'm deploying.
Football stats
This is the pitch of an Shiny app which shows you some basics stats about the previous clashes between two teams of the English Premier League since the 93-94 to the 2015-2016 seasons: wins and draws and goal differences.
Harmfulness of the weather events to human kind in The United States of North America
Some weather events has caused both public health and economic damages to communities and municipalities. By exploring the U.S. National Oceanic and Atmospheric Administration’s (NOAA) storm database we can establish historically which events has caused more harm to human health (injuries and fatalities) and which ones has caused more material loses (damage to properties and crops). By arrive to that point, first it’s necessary to trade out with some issues about the reports that embody the dataset across the time and its circumstances. In this way, it is possible to contribute to the make of decision about which weather events is more efficient to invest in avoid negative consequences and the correlation between them self.