Hey Listen!

Aqui você encontrará notícias e informações relacionadas a inteligência artificial diariamente em nosso Blog. Além disso, informações sobre nossas pesquisas acadêmicas, os produtos de software que desenvolvemos, nossos livros e nosso podcast.

LlM shell

Conversando com modelos LLM diversos

Existem softwares específicos para utilizar modelos de LLM Locais, ou mesmo acessar vários modelos de LLM on-line mas por uma única interface.

Entre eles o GPT4ALL, o JEN, o LLMStudio e o exclente Msty.

GPT4ALL

GPT4All é uma plataforma que permite que você execute Modelos de Linguagem Grande (LLMs) em hardware de consumo, incluindo CPUs e GPUs [1]. Esta plataforma é compatível com Mac M Series chips, AMD e NVIDIA GPUs, tornando-a acessível para muitos [1]. Além disso, é possível operar o GPT4All em desktops e laptops comuns, sem a necessidade de chamadas de API ou GPUs [3].

[Saiba mais]

IA Notícias 23/11/2024

Notícias do dia 23/11/2024

Amazon Dobra Investimento na Startup de IA Anthropic

A Amazon ampliou seu investimento na startup de inteligência artificial Anthropic, adicionando mais US$ 4 bilhões. Com isso, a Amazon mantém sua posição como investidora minoritária e principal parceira de treinamento da Anthropic, que desenvolve o chatbot Claude. Este movimento intensifica a competição da Amazon com Microsoft e Google no fornecimento de ferramentas baseadas em IA na computação em nuvem. [1]

Perplexity AI Introduz Recursos de Compras

[Saiba mais]

Groq vs Grok

Qual a diferença entre o Groq e o Grok?

Groq e Grok são coisas distintas e desenvolvidas por empresas diferentes, com características e finalidades específicas.

Geralmente quando nos referimos ao Groq (com Q), estamos nos referindo a uma fornecedora de infraestrutura para inferência em modelos de LLM diversos. Esta empresa vende um serviço de inferência mais rápida do que seus concorrentes para modelos disponíveis abertamente, como Llama da Meta, o Gemma do Google, ou o Mixtral da Mixtral AI. Já o Grok é comumente utilizado em referência ao chatbot da empresa X (twitter).

[Saiba mais]

CodeGPT Primeiro Contato

Uma ferramenta de LLM para auxiliar o desenvolvimento

CodeGPT revoluciona o desenvolvimento de software com IA avançada

O CodeGPT se tornou um dos assistentes de codificação mais populares, integrando-se a IDEs como Visual Studio Code e JetBrains. Desde seu lançamento em março de 2023, acumulou mais de 1,4 milhão de downloads e está presente em mais de 180 países, ajudando desenvolvedores a aumentar sua produtividade em 30% ou mais.

A integração com o modelo de linguagem Llama, da Meta, foi um divisor de águas para a plataforma. Com a adoção do Llama 3.2 (90B), o CodeGPT evoluiu de gerador de código para uma solução completa de assistência, capaz de:

[Saiba mais]

Nemotron LLM 70B Um primeiro contato

Um novo LLM da Nvidia

Em julho de 2024, a Meta lançou um modelo de linguagem (LLM) open-source, o Llama-3.1-70B. Um pouco depois, em setembro a empresa NVIDIA lançou um derivado deste, o Llama 3.1-Nemotron-51B-Instruct. E em outubro lançou finalmente um modelo de 70b, o Llama 3.1 nemotron-70b-instruct.

O nemotron-70b performou melhor, em alguns testes comparativos, do que o GPT-4o. Nos testes, ele liderou em desempenho geral e também se destacou nas categorias chat (chat score) e raciocínio (reasoning score). Veja na Tabela 1 os dados comparativos com mais detalhes.

[Saiba mais]
llm  ia 

Uma breve introdução sobre redes neurais

As redes neurais são utilizadas em diversas aplicações. De forma resumida elas são compostas por diversos nós interconectados e organizados em camadas. Elas funcionam como um meio de aprendizado a partir da análise de exemplos de treinamento, permitindo a realização de tarefas complexas. Sendo Redes Neurais uma sub-área da aprendizagem de máquina, grande parte dos conceitos de aprendizagem de máquina são equivalentes na aplicação de uma rede neural. Veja na Figura 1 um simples esquema dos conceitos.

[Saiba mais]

Regressão Linear Primeiro Contato

Uma introdução breve a regressão linear

A Regressão linear é um método estatístico utilizado para avaliar a relação causal e quantitativa entre duas variáveis, chamada de variável dependente e variável independente, respectivamente. O modelo de regressão linear tem a seguinte forma: y = a + bx + e, onde y é a variável dependente, x é a variável independente, a é o intercepto, b é a reta inclinada e e é o erro. Com a regressão podemos encontrar um modelo matemático que melhor descreva a relação entre as variáveis (x) e (y).

[Saiba mais]

Aprendizagem de Máquina Um Primeiro Contato

Uma introdução a aprendizagem de máquina

A aprendizagem de máquina (ou machine learning) é uma subárea da inteligência artificial (IA) que permite que sistemas de computadores aprendam a partir de dados e façam previsões ou tomem decisões sem serem explicitamente programados para isso. Em vez de seguir instruções rígidas, os algoritmos de aprendizagem de máquina analisam grandes volumes de dados, identificam padrões e ajustam seus comportamentos com base nas informações adquiridas.

Ela foi motivada pelo desenvolvimento de softwares mais independentes da intervenção humana para extração do conhecimento. Geralmente aplicações de AM utilizam heurísticas (também chamadas de regras do dedão) que buscam por modelos capazes de representar o conhecimento existente nos dados.

[Saiba mais]

StreamLit Primeiro Contato

Um framework para desenvolvimento de aplicações Web com Python

Streamlit é uma biblioteca de código aberto em Python que facilita a criação de aplicativos web interativos e de visualização de dados de forma rápida e simples. É amplamente utilizada por cientistas de dados, analistas e desenvolvedores que desejam transformar seus scripts de Python em aplicações web interativas sem a necessidade de conhecimentos avançados em desenvolvimento web.

As principais características do Streamlit são:

  • Facilidade de Uso: Permite criar interfaces de usuário com poucas linhas de código, utilizando uma sintaxe intuitiva e fácil de aprender.

    [Saiba mais]