LexVeritas vs ChatGPT vs Claude vs Gemini: 4 IAs, 1 Acórdão, Resultados Opostos

Para este estudo, seleccionámos um acórdão proferido este ano do Tribunal da Relação de Lisboa com características linguísticas que nos pareceram relevantes para testar. Submetemo-lo às quatro principais ferramentas de IA disponíveis com a mesma pergunta.

O protocolo foi simples e rigoroso: todas as ferramentas receberam exactamente o mesmo texto e a mesma pergunta — "Este texto foi escrito por um ser humano ou por inteligência artificial? Justifica a tua resposta com indicadores concretos." O LexVeritas foi usado no modo Análise Judicial com tribunal preenchido, como seria feito por qualquer utilizador profissional.

Os resultados

⚖ LexVeritas

IA Detectada

85% confiança · 6 indicadores quantificados

Coesão artificial 85/100, marcadores formulaicos 88/100, uniformidade sintáctica 80/100. Relatório PDF com referência única [referência interna].

💬 ChatGPT

Provável IA

Sem percentagem · Análise qualitativa

Identificou redundância argumentativa, metadiscurso excessivo e hipertrofia verbal. 19 páginas de análise em texto livre, sem estrutura forense.

🤖 Claude

Autoria Humana

Alta confiança · Análise qualitativa

Considerou a sofisticação jurídica como indicador de autoria humana. Destacou o voto de vencida como prova de deliberação humana.

✦ Gemini

Autoria Humana

Alta confiança · Análise qualitativa

Identificou a complexidade do raciocínio e as referências jurisprudenciais como evidência de autoria humana especializada.

⚠ O Problema Central

Duas ferramentas disseram IA com alta confiança. Duas disseram humano com alta confiança. Se um advogado usar o Claude para verificar um acórdão suspeito, fica convicto de que é humano. Se usar o ChatGPT, fica convicto de que é IA. As ferramentas genéricas chegam a conclusões opostas sobre o mesmo documento — o que as torna inúteis para fins profissionais.

A tabela comparativa

Ferramenta	Veredicto	Confiança	Indicadores	Calibração PT	Relatório
LexVeritas	IA Detectada	85%	6 quantificados	✅ Sim	PDF profissional
ChatGPT	Provável IA	Não indica	Qualitativos	❌ Não	Texto livre
Claude	Humano	Alta (sem %)	Qualitativos	❌ Não	Texto livre
Gemini	Humano	Alta (sem %)	Qualitativos	❌ Não	Texto livre

Porque é que as ferramentas genéricas falham

O Claude e o Gemini ficaram impressionados com a qualidade jurídica do texto — a articulação correcta dos artigos 48.º, 50.º, 285.º e 358.º do CPP, o domínio do AUJ n.º 9/2024, a ausência de erros jurídicos grosseiros. E concluíram: isto é humano. Mas este raciocínio é exactamente o erro que uma ferramenta calibrada para o contexto jurídico português não comete.

A qualidade jurídica do conteúdo é irrelevante para a detecção de IA. Um modelo de linguagem usado por um jurista experiente com instruções detalhadas produz texto juridicamente correcto. O que revela a autoria artificial não é o erro — é a uniformidade, a ausência de fricção humana, a regularidade mecânica dos parágrafos, os marcadores formulaicos distribuídos com precisão de metrónomo.

Conclusão Forense

"A qualidade jurídica do raciocínio é genuinamente elevada, o que sugere uso de IA por jurista com domínio da matéria, possivelmente com revisão posterior, mas a assinatura estilística da geração automática é clara." — Relatório LexVeritas [referência interna]

O ChatGPT chegou à conclusão certa mas pelo caminho errado — produziu 19 páginas de análise em texto livre que nenhum advogado pode juntar como suporte processual. Identificou os mesmos marcadores que o LexVeritas mas sem estrutura, sem percentagem, sem referência única, sem PDF.

O que diferencia uma ferramenta forense

Há três diferenças fundamentais entre o LexVeritas e uma ferramenta de IA genérica para esta tarefa:

Calibração para Portugal. Os indicadores do LexVeritas foram desenvolvidos especificamente para o registo jurídico português — a jurisprudência dos tribunais, os padrões estilísticos dos relatores, os marcadores formulaicos do português jurídico formal. Uma IA genérica foi treinada em texto de todo o mundo.

Quantificação. "Provável IA" não é suficiente para fins profissionais. 85% de confiança, com coesão artificial a 85/100 e marcadores formulaicos a 88/100, é. A diferença entre uma opinião e um indicador mensurável é a diferença entre uma impressão e uma prova.

Formato profissional. Um relatório PDF com referência única, tribunal, relator, indicadores visuais e disclaimers legais adequados pode ser junto como suporte processual. Texto copiado de uma conversa com o ChatGPT não pode.

O que isto significa para a advocacia portuguesa

O caso do CSM de Fevereiro de 2025 — em que foi aberto um processo de averiguação sobre um acórdão do TRL com jurisprudência inexistente — mostrou que o problema já chegou aos tribunais portugueses. A questão não é se a IA está a ser usada na redacção de decisões judiciais. A questão é como verificar quando isso acontece.

Este teste demonstra que as ferramentas genéricas não são solução — são ruído. Chegam a conclusões opostas, não quantificam, não produzem documentação utilizável. Para fins profissionais, a verificação de IA em documentos judiciais portugueses exige uma ferramenta calibrada para esse fim específico.

LexVeritas — Análise Gratuita

Teste com o próximo acórdão que receber

Cinco análises por mês sem custos. Relatório PDF profissional. Resultado em segundos.

Começar a Analisar →

⚖ 6 indicadores forenses · Verificação de citações · Calibrado para Portugal

4 IAs analisaram o mesmo acórdão do TRL.Chegaram a conclusões opostas.