IA

Anthropic lança Claude Opus 4.8 com melhorias em raciocínio, codificação e tarefas de agentes

Nova versão do modelo de linguagem da Anthropic chega com ganhos significativos em benchmarks de programação e matemática. Empresa afirma que o Opus 4.8 supera o GPT-5.4 da OpenAI.

A Anthropic anunciou nesta quinta-feira o lançamento do Claude Opus 4.8, a mais recente iteração de seu modelo de linguagem de grande porte. A atualização chega poucos meses após o Opus 4.6 e traz melhorias concentradas em três áreas: raciocínio lógico, capacidade de codificação e desempenho em tarefas agentivas, onde o modelo precisa tomar decisões e executar ações de forma autônoma. O Opus 4.8 já está disponível via API e no aplicativo Claude para assinantes dos planos Pro, Max, Team e Enterprise.

Os avanços do Claude Opus 4.8

A Anthropic afirma que o Opus 4.8 supera o GPT-5.4 da OpenAI em benchmarks de raciocínio complexo, incluindo o MMLU-Pro e o GPQA Diamond, que medem a capacidade de resolver problemas de nível de pós-graduação em ciências exatas. Em codificação, o modelo atinge 94,7% de precisão no HumanEval, um dos principais testes de geração de código, e reduz o tempo de execução de tarefas de programação em cadeia em 40% comparado ao Opus 4.6.

A redução de alucinações é outro ponto destacado. A Anthropic implementou uma nova técnica de verificação interna que cruza múltiplos caminhos de raciocínio antes de gerar uma resposta, o que resultou em uma queda de 32% na taxa de informações incorretas em relação ao modelo anterior. A janela de contexto permanece em 200 mil tokens, mas a empresa afirma que o modelo agora é capaz de manter a coerência e a precisão mesmo próximo do limite máximo, um ponto fraco histórico dos modelos de linguagem.

Disponibilidade do novo modelo

O Opus 4.8 está disponível para todos os assinantes pagos do Claude, com acesso prioritário para contas Enterprise e Team. A Anthropic também reduziu o preço da API em 15% para o Opus 4.6, que permanece disponível como opção de menor custo. O lançamento ocorre em um momento de intensa competição no mercado de modelos de IA, com a OpenAI tendo lançado o GPT-5.4 há menos de um mês e o Google tendo revelado o Gemini 3.1 Pro durante o Google I/O. A Anthropic também confirmou que o Claude Cowork, sua plataforma de agentes de IA para produtividade, será atualizado nas próximas semanas com o Opus 4.8 como modelo padrão.

Fonte
Artificial Intelligence News

Artigos Relacionados

Deixe uma resposta

Botão Voltar ao topo

Descubra mais sobre Reset

Assine agora mesmo para continuar lendo e ter acesso ao arquivo completo.

Continue reading