Atacando o Custo do Databricks!

Databricks Não é Caro, Você que Não está Sabendo Configurar e Usar!

7 min readMay 17, 2024

--

Em minha jornada profissional, me encontro trilhando o caminho de engenheiro de plataforma de dados e recentemente estou tendo a oportunidade de atuar com Databricks, uma plataforma multi-cloud, composta de soluções para engenharia e ciência de dados.

Nessa caminhada na área de dados, observei algumas práticas para melhor gestão do ambiente, evitando situações aonde qualquer execução gere uma conta surreal e onde as soluções de dados criadas com a utilização do Databricks realmente gerem valor e impacto ao negócio.

Os ponto que vou aborda de forma breve nesse texto, refletem apenas minha experiência, estudos e pesquisas sobre, antes de sair aplicando no seu ambiente, peço que sejam verificado as documentações que vou deixar como referência e de forma alguma tome esse texto como uma verdade absoluta!

Vamos à luta! :)

Liberdade tem consequências!

Deixar os usuários criaram infraestrutura a rodo pode desencadear o mau uso, provisionamento de clusters mau dimensionados e altos custo em seu ambiente, parar esse caso pode ser criado uma “police” definindo o ranger de possíveis tipos de clusters, o máximo de DBU a serem utilizadas e muitas…

--

--

Josue Luzardo Gebrim

As a platform engineer, ecosystems, and data solutions, I'm sharing my opinion and what little I know from time to time here.