Argonalyst

Avaliação de Modelos de Linguagem em Evolução Rápida

Argonalyst
8 June 2025

Recentemente, o cenário dos Modelos de Linguagem de Grande Escala (LLMs) tem evoluído de forma impressionante. Inicialmente, eu havia planejado uma sessão intitulada "O último ano em LLMs", mas com o ritmo acelerado das inovações, cobrir apenas os últimos seis meses já se tornou um desafio considerável.

Nos últimos seis meses, mais de 30 modelos significativos foram lançados, todos merecendo a atenção de quem atua nesse campo. Este crescimento vertiginoso levanta questões sobre como avaliar adequadamente esses modelos e determinar quais são os mais eficazes.

Embora existam diversos benchmarks repletos de dados, pessoalmente, não vejo grande utilidade nesses números. Além disso, as tabelas de liderança, que costumavam ser uma referência, têm perdido minha confiança ao longo do tempo.

Diante desse cenário, percebo que cada profissional deve desenvolver seu próprio sistema de avaliação. O meu, que começou como uma brincadeira, está se mostrando surpreendentemente útil para entender melhor os modelos disponíveis.

Últimos vídeos

Confira os últimos vídeos publicados no canal

Argonalyst

O plano SECRETO das Big Techs para cobrar MUITO mais pela IA

Argonalyst

BOLHA da IA ou NOVA era de crescimento EXPONENCIAL? O mercado está dividido

Argonalyst

Nova IA da OpenAI traduz em TEMPO REAL e pode mudar o mundo dos negócios

Argonalyst

Spec Driven Development (SDD): a habilidade que vai separar quem SOBREVIVE à IA

Argonalyst

DeepSeek V4: o Open Source que está AMEAÇANDO GPT 5.5 e Opus 4.7

Argonalyst

Prometeram Renda Universal… mas só veio desemprego?

Argonalyst

Mythos Preview: o começo da AGI ou só mais hype?

Argonalyst

Ele automatizou TUDO com IA… e pode virar bilionário sozinho

Argonalyst

Programadores foram só o começo… agora a IA quer o topo

Argonalyst

Multi-agentes, memória e IA eterna: o vazamento que mudou tudo

Argonalyst

VIBE CODING vai acabar… e o que vem agora é muito mais SINISTRO

Argonalyst

IA na Guerra: estamos criando algo mais PERIGOSO que a Bomba Atômica?

Argonalyst

O dinheiro vai desaparecer? A era da IA pode mudar tudo

Argonalyst

O Apocalipse do SaaS: Como a IA pode DESTRUIR o modelo bilionário do software

Argonalyst

Bitcoin é software… e o software está morrendo (isso explica a queda?)