Photo by Kevin Kelly on Unsplash

Apache Pinot: O Vinho que Faltava no Cenários de Dados!

Apache Pinot: Open Source Realtime Distributed OLAP Datastore!

Josue Luzardo Gebrim
7 min readApr 21

--

Nos tempos modernos, o gerenciamento eficiente de dados é crucial para o sucesso de qualquer negócio. A capacidade de armazenar, analisar e extrair informações valiosas de grandes volumes de dados em tempo real é uma habilidade indispensável para impulsionar a tomada de decisões e garantir a competitividade no mercado. Neste contexto, o Apache Pinot surge como uma ferramenta poderosa e escalável, projetada especificamente para lidar com as demandas do processamento de dados em tempo real.

O Apache Pinot é um sistema de armazenamento de dados em colunas distribuídas e de código aberto, criado pelo LinkedIn e posteriormente doado à Apache Software Foundation. Ele foi desenvolvido para fornecer análises rápidas e eficientes de grandes volumes de dados, permitindo consultas em tempo real e com baixa latência. Graças à sua arquitetura flexível e escalonável, o Apache Pinot é adequado para uma ampla gama de aplicações, incluindo análise de séries temporais, análise de eventos em tempo real, painéis de controle e muito mais.

Nesse post vamos aborda sua arquitetura, alguns casos de uso, alguns exemplos de instalação e ingestão.

Arquitetura

O Apache Pinot é dividido em quatro componentes principais:

https://1197296286-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LtH6nl58DdnZnelPdTc%2F-M1pSGleddLn2q1vYEeM%2F-M1pvo4yOL0qNSjSS5nc%2FPinot-architecture%20(1).svg?alt=media&token=b0d011d8-4457-4bea-b29d-55d409eae7df

Controller: condutor do estado geral e da integridade do cluster. Por causa de sua função como participante e espectador do Helix, que orienta o estado de outros componentes, é o primeiro componente normalmente iniciado após o Zookeeper.

O Apache Helix, uma estrutura genérica de gerenciamento de cluster para gerenciar partições e réplicas em um sistema distribuído, gerencia todos os servidores e agentes Pinot.

O Helix usa o Zookeeper para manter o estado do cluster. Cada componente em um cluster Pinot usa um endereço…

--

--

Josue Luzardo Gebrim

As a platform engineer, ecosystems, and data solutions, I'm sharing my opinion and what little I know from time to time here.

Recommended from Medium

Lists