Atribuição de autoria em documentos litigiosos: combinação de traços estilométricos, marcas linguísticas e indicadores de geração por LLM
DOI:
https://doi.org/10.51126/revsalus.v8iSupII.46646Keywords:
Autoria; Estilometria; LLM; Deteção de texto gerado; Linguística forenseAbstract
Introdução: Disputas judiciais sobre autoria textual multiplicaram-se com o uso de modelos de linguagem de grande escala (LLMs). Métodos tradicionais de estilometria precisam ser combinados com detectores por geração para avaliação adequada (Stamatatos, 2009; Kestemont, 2014).
Objetivo: Propor e descrever um pipeline híbrido para apoio à atribuição de autoria que integre traços estilométricos, sinais linguísticos indicativos de geração automática e verificações baseadas em perplexidade/marcadores.
Material e Métodos: Extração de n-gramas de caracteres e palavras-funcionais, métricas de complexidade e pontuação; aplicação de GLTR (Gehrmann et al., 2019) e DetectGPT (Mitchell et al., 2023); avaliação comparativa em corpora de controlo (humanos vs. LLM) com classificadores calibrados; elaboração de relatório pericial com estimativas de incerteza e limitações.
Resultados: Apresenta‑se um fluxo reproduzível com pontos de decisão, requisitos de tamanho amostral e exemplos anonimizados; discute‑se desempenho relativo de combinações de traços e impacto de parafraseamento.
Discussão: Debatem‑se riscos de falsos positivos, transferência entre modelos e degradação com edição humana; argumenta‑se pela interpretação cautelosa e contextual, preferindo‑se conclusões graduadas em vez de rótulos binários.
Conclusões: A integração de estilometria, detectors e sinais de geração por LLM oferece suporte mais sólido à inferência de autoria quando acompanhada de documentação completa e validação por pares (Kirchenbauer et al., 2023).
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 RevSALUS - International Scientific Journal of the Academic Network of Health Sciences of Lusophone

This work is licensed under a Creative Commons Attribution 4.0 International License.







