Recently Published
Manipulação de Dados em Formato JSON e Paralelismo para Validação do Modelo
Neste case trago uma alternativa para manipulação de Dados em Formato JSON e utilização de Paralelismo para Validação do Modelo, através de um Estudo de Caso Sobre a Previsão do Preço de Venda dos Imóveis na Cidade de São Paulo
Destrinchando a Mineração de Texto: Extraindo Insights via Análise Gráfica de Dados do Twitter
A mineração de texto permite que os pesquisadores encontrem mais informações e de maneira mais rápida e eficiente. Assim, faço uso de um conjunto de dados reais que contém uma avaliação sobre o “sentimento” dos usuários do Twitter ao escrever um post para expor um "guia" de procedimentos básicos que permitam extrair insights desses dados.
Como a Aprendizagem via Stacking pode melhorar os resultados preditivos?
Neste post, apresento o algoritmo Stacking, combinando alguns modelos interessantes como: Elastic NET, LASSO, Ridge, SVR, Spam e Floresta Aleatória.
Case sobre a Predição do Grupo Alimentar
Modelagem em Duas Fases: Clusterização e Aprendizagem Supervisionada.
Case sobre a Predição de Usuários Casuais de Bicicletas Alugadas
A Nova Mobilidade tem mudado a maneira como nos deslocamos pelas cidades. Estamos falando de serviços de transporte A Nova Mobilidade tem mudado a maneira como nos deslocamos pelas cidades. Estamos falando de serviços de transporte sob demanda (como Uber, 99 e Cabify), veículos elétricos e aplicativos de planejamento de rotas, mas, também, das bicicletas. Novas empresas apostam na bicicleta como meio para atender às necessidades de transporte nas áreas urbanas e os programas de compartilhamento, públicos ou privados, mudam a maneira como enxergamos as bikes: de opção de lazer a meio de transporte e até mesmo instrumento de trabalho.
Os programas de bicicleta compartilhada evoluíram e hoje são meio de transporte e até instrumento de trabalho. Atualmente, existem mais de 500 programas de compartilhamento de bicicletas em todo o mundo, com serviço para os cidadãos locais. Buscando mais adeptos, alguns programas permitem o chamado "uso casual". Esses usuários, podem utilizar as bicicletas sem a necessidade de se registrar à empresa. Neste sentido, é de grande interesse prever a taxa de utilização casual dessas bicicletas, uma vez que o aumento de demanda, poderia refletir em uma baixa qualidade no atendimento dos usuários registrados. De acordo com especialistas da própria empresa, nos períodos em que o percentual de clientes casuais supera 20% se faz necessário a aquisição de novas bicicletas a serem ofertadas, evitando assim filas e descontentamento dos clientes registrados.
Neste case, utilizei dados reais de uma empresa privada da Inglaterra que fornece o serviço de aluguel de bicicleta em diferentes cidades. Para uma previsão de qualidade, conceitos aprendizagem estatística de máquina, implementados à diferentes modelos, bem como noções descritivas e exploratória dos dados, são aplicados. Os modelos comparados foram: Regressão Logística, KNN, KDB, Naive Bayes, LDA e Árvore de Decisão.