Home / BIG DATA / Utilizando a VM Cloudera

Utilizando a VM Cloudera

A Cloudera, Inc. é uma empresa de software com sede nos EUA que fornece uma plataforma de software para engenharia de dados, data warehousing, aprendizado de máquina e análise que é executada na nuvem ou nas instalações.

A Cloudera foi fundada em 2008 por três engenheiros do Google, Yahoo! e o Facebook (Christophe Bisciglia, Amr Awadallah e Jeff Hammerbacher, respectivamente) juntaram-se a um ex-executivo da Oracle (Mike Olson) para formar a Cloudera em 2008.

no site oficial da Cloudera (https://www.cloudera.com), é possível baixar na sessão Downloads uma máquina virtual “Quick Start” que vem toda configurada e com vários módulos já instalados para big data, análise de dados e etc. Selecione a versão para VirtualBox e faça o download.

Para isso, vamos utilizar o Oracle VirtualBox para rodar esta vm. Você pode encontrá-lo em https://www.virtualbox.org/

A documentação oficial da cloudera recomendo um mínimo de 4gb de ram para rodar a VM.

Após baixar tudo, instale o VirtualBox. Em seguida descompacte o arquivo baixado no site da Cloudera e de um duplo clique no arquivo de extensão *.ovf. Será importada a VM para o VirtualBox. Após a conclusão, ligue a VM e pronto

Check Also

Pandas get_dummies x Sklearn DictVectorizer

Em machine learning, uma das partes mais importantes é a feature engineering. Este post tratará …

Leave a Reply

Your email address will not be published. Required fields are marked *