Linear regression é um método estatístico para encontrar relacionamentos entre variáveis. Neste exemplo usaremos alguns conceitos básicos, como feature selection utilizando correlação, colinearidade e variação para prever o valor de uma casa. Utilizaremos também o conceito de ordinary least squares estimation (OLS). Porém ele é executado de forma automática quando …
Read More »Pandas get_dummies x Sklearn DictVectorizer
Em machine learning, uma das partes mais importantes é a feature engineering. Este post tratará da conversão de categorias com classes string para numérico (colunas texto para números inteiros), já que os algoritmos de ML trabalham com números. Para cada classe da feature (ou a cada categoria de uma coluna), …
Read More »Normalizando dados com sklearn
Quando trabalhamos com algoritmos de machine learning, existe sempre a recomendação de que todos os dados a serem trabalhados sejam numéricos. Porém no mundo real isto raramente acontece, pois nossos dados muitas vezes possuem categorias descritivas (string). Neste exemplo vemos que o atributo neighborhood é um texto, logo precisamos converte-lo …
Read More »