Alternativas LLM Open Source!!!
Descubra LLM (Large Language Model) de Código Aberto!!!
Para quem tem acompanhado o mundo de ciência de dados nesses últimos tempos(Agost/2023), estamos lidando com um crescente surgimento de alternativas de modelos LLM totalmente open-source, já pré-treinados e quase prontos para uso.
Para quem ainda não sabe sobre:
“Um LLM, ou Large Language Model, é um tipo de modelo de linguagem de alta capacidade que utiliza algoritmos avançados de processamento de linguagem natural (NLP) para entender e gerar texto. Esses modelos são treinados em grandes quantidades de dados textuais, como livros, artigos, sites e muito mais, a fim de aprender a estrutura da linguagem e as relações semânticas entre palavras e frases.” Alex Souza
Esse post vai ser uma lista resumida de algumas possibilidades de modelos de código aberto que encontrei em meus estudos, vamos a lista:
- Guanaco
É um LLM popular desenvolvido por pesquisadores da Universidade de Washington, foi baseado no modelo LLaMA da Meta, mas é muito mais eficiente para treinar e executar, pode ser treinado em uma única GPU em um dia, exigindo apenas 5 GB de GPU RAM. Isso o torna muito mais acessível para pesquisadores e desenvolvedores que não têm acesso a grandes clusters computacionais.