Atribuição de autoria em documentos litigiosos: combinação de traços estilométricos, marcas linguísticas e indicadores de geração por LLM

Authors

  • Paulo R. N. M. de Vasconcellos ISCTE – Instituto Universitário de Lisboa (Doutoramento em Ciências e Tecnologias da Informação), Portugal; Meira de Vasconcellos Forensic Experts, Rio de Janeiro, Brasil

DOI:

https://doi.org/10.51126/revsalus.v8iSupII.46646

Keywords:

Autoria; Estilometria; LLM; Deteção de texto gerado; Linguística forense

Abstract

Introdução: Disputas judiciais sobre autoria textual multiplicaram-se com o uso de modelos de linguagem de grande escala (LLMs). Métodos tradicionais de estilometria precisam ser combinados com detectores por geração para avaliação adequada (Stamatatos, 2009; Kestemont, 2014).

Objetivo: Propor e descrever um pipeline híbrido para apoio à atribuição de autoria que integre traços estilométricos, sinais linguísticos indicativos de geração automática e verificações baseadas em perplexidade/marcadores.

Material e Métodos: Extração de n-gramas de caracteres e palavras-funcionais, métricas de complexidade e pontuação; aplicação de GLTR (Gehrmann et al., 2019) e DetectGPT (Mitchell et al., 2023); avaliação comparativa em corpora de controlo (humanos vs. LLM) com classificadores calibrados; elaboração de relatório pericial com estimativas de incerteza e limitações.

Resultados: Apresenta‑se um fluxo reproduzível com pontos de decisão, requisitos de tamanho amostral e exemplos anonimizados; discute‑se desempenho relativo de combinações de traços e impacto de parafraseamento.

Discussão: Debatem‑se riscos de falsos positivos, transferência entre modelos e degradação com edição humana; argumenta‑se pela interpretação cautelosa e contextual, preferindo‑se conclusões graduadas em vez de rótulos binários.

Conclusões: A integração de estilometria, detectors e sinais de geração por LLM oferece suporte mais sólido à inferência de autoria quando acompanhada de documentação completa e validação por pares (Kirchenbauer et al., 2023).

Published

2026-05-06

How to Cite

de Vasconcellos, P. R. N. M. (2026). Atribuição de autoria em documentos litigiosos: combinação de traços estilométricos, marcas linguísticas e indicadores de geração por LLM. RevSALUS - International Scientific Journal of the Academic Network of Health Sciences of Lusophone, 8(SupII). https://doi.org/10.51126/revsalus.v8iSupII.46646