A Cloudera, Inc. é uma empresa de software com sede nos EUA que fornece uma plataforma de software para engenharia de dados, data warehousing, aprendizado de máquina e análise que é executada na nuvem ou nas instalações.
A Cloudera foi fundada em 2008 por três engenheiros do Google, Yahoo! e o Facebook (Christophe Bisciglia, Amr Awadallah e Jeff Hammerbacher, respectivamente) juntaram-se a um ex-executivo da Oracle (Mike Olson) para formar a Cloudera em 2008.
no site oficial da Cloudera (https://www.cloudera.com), é possível baixar na sessão Downloads uma máquina virtual “Quick Start” que vem toda configurada e com vários módulos já instalados para big data, análise de dados e etc. Selecione a versão para VirtualBox e faça o download.
Para isso, vamos utilizar o Oracle VirtualBox para rodar esta vm. Você pode encontrá-lo em https://www.virtualbox.org/
A documentação oficial da cloudera recomendo um mínimo de 4gb de ram para rodar a VM.
Após baixar tudo, instale o VirtualBox. Em seguida descompacte o arquivo baixado no site da Cloudera e de um duplo clique no arquivo de extensão *.ovf. Será importada a VM para o VirtualBox. Após a conclusão, ligue a VM e pronto