Humanidades

A pontuação na literatura das principais línguas é intrigantemente matemática
Um momento de hesitação... Sim, um ponto final aqui — mas não deveria haver uma vírgula aí? Ou um hífen seria melhor? A pontuação pode ser um incômodo; muitas vezes é simplesmente negligenciado. Errado! As análises estatísticas mais recentes
Por Instituto Henryk Niewodniczanski de Física Nuclear Academia Polonesa de Ciências - 21/04/2023


As funções de risco representam a probabilidade de usar um sinal de pontuação em função do comprimento da sequência sem esses sinais. Em termos de pontuação, o mais 'translinguístico' é o alemão (tabela verde). Crédito: Fonte: IFJ PAN

Um momento de hesitação... Sim, um ponto final aqui — mas não deveria haver uma vírgula aí? Ou um hífen seria melhor? A pontuação pode ser um incômodo; muitas vezes é simplesmente negligenciado. Errado! As análises estatísticas mais recentes pintam um quadro diferente: a pontuação parece "surgir" dos fundamentos compartilhados por todas as línguas (examinadas), e suas características estão longe de ser triviais.

Para muitos, a pontuação aparece como um mal necessário, a ser alegremente ignorado sempre que possível. Análises recentes da literatura escrita nas principais línguas atuais do mundo exigem que alteremos essa opinião. Na verdade, as mesmas características estatísticas dos padrões de uso da pontuação foram observadas em várias centenas de obras escritas em sete idiomas, principalmente ocidentais.

A pontuação, cujos dez representantes podem ser encontrados na introdução deste texto, revela-se um complemento universal e indispensável à perfeição matemática de cada língua estudada. Uma conclusão tão notável sobre o papel de meras vírgulas, pontos de exclamação ou pontos finais vem de um artigo de cientistas do Instituto de Física Nuclear da Academia Polonesa de Ciências (IFJ PAN) em Cracóvia, publicado na revista Chaos, Solitons & Fractals .

"As presentes análises são uma extensão de nossos resultados anteriores sobre as características multifractais da variação do comprimento da frase em obras da literatura mundial. Afinal, o que é o comprimento da frase? Nada mais é do que a distância até o próximo sinal de pontuação específico - o ponto final . Portanto, agora analisamos todos os sinais de pontuação sob uma lupa estatística e também analisamos o que acontece com a pontuação durante a tradução", diz o Prof. Stanislaw Drozdz (IFJ PAN, Cracow University of Technology).

Dois conjuntos de textos foram estudados. As principais análises relativas à pontuação dentro de cada idioma foram realizadas em 240 obras literárias altamente populares escritas em sete principais idiomas ocidentais: inglês (44), alemão (34), francês (32), italiano (32), espanhol (32), polonês (34) e russo (32). Essa seleção particular de idiomas foi baseada em um critério: os pesquisadores assumiram que nada menos que 50 milhões de pessoas deveriam falar o idioma em questão e que as obras escritas nele deveriam ter recebido nada menos que cinco prêmios Nobel de literatura.

Além disso, para a validade estatística dos resultados da pesquisa, cada livro deveria conter pelo menos 1.500 sequências de palavras separadas por sinais de pontuação. Uma coleção separada foi preparada para observar a estabilidade da pontuação na tradução. Continha 14 obras, cada uma disponível em cada uma das línguas estudadas (duas das 98 versões linguísticas, no entanto, foram omitidas devido à sua indisponibilidade).

No total, os autores de ambas as coleções incluíam escritores como Conrad, Dickens, Doyle, Hemingway, Kipling, Orwell, Salinger, Woolf, Grass, Kafka, Mann, Nietzsche, Goethe, La Fayette, Dumas, Hugo, Proust, Verne, Eco, Cervantes, Sienkiewicz ou Reymont.

A atenção dos pesquisadores de Cracóvia foi atraída principalmente para a distribuição estatística da distância entre sinais de pontuação consecutivos. Logo ficou evidente que, em todas as línguas estudadas, era melhor descrito por uma das variantes definidas com precisão da distribuição Weibull.

Uma curva deste tipo tem uma forma característica: primeiro cresce rapidamente e depois, depois de atingir um valor máximo, desce um pouco mais lentamente até um certo valor crítico, abaixo do qual chega a zero com uma dinâmica pequena e constantemente decrescente. A distribuição Weibull é geralmente usada para descrever fenômenos de sobrevivência (por exemplo, população em função da idade), mas também vários processos físicos, como o aumento da fadiga de materiais.

"A concordância da distribuição dos comprimentos das sequências de palavras entre os sinais de pontuação com a forma funcional da distribuição Weibull foi melhor quanto mais tipos de sinais de pontuação incluímos nas análises; para todos os sinais, a concordância acabou sendo quase completa. Ao mesmo tempo tempo, algumas diferenças nas distribuições são aparentes entre os diferentes idiomas , mas elas se resumem apenas à seleção de valores ligeiramente diferentes para os parâmetros de distribuição, específicos do idioma em questão. A pontuação parece, portanto, ser parte integrante de todos os idiomas estudados ”, observa o Prof. Drozdz.

Depois de um momento, ele acrescenta com alguma diversão: "... e uma vez que a distribuição Weibull está preocupada com fenômenos como a sobrevivência, pode-se dizer, sem muita ironia, que a pontuação tem em sua natureza uma luta literalmente embutida para sobrevivência."

A próxima etapa das análises consistiu na determinação da função de risco. No caso da pontuação, ela descreve como a probabilidade condicional de sucesso – ou seja, a probabilidade do próximo sinal de pontuação – muda se tal sinal ainda não apareceu na sequência analisada.

Os resultados aqui são claros: o idioma caracterizado pela menor propensão ao uso de pontuação é o inglês, com o espanhol não muito atrás; As línguas eslavas provaram ser as mais dependentes de pontuação. As curvas de função de risco para sinais de pontuação nas seis línguas estudadas parecem seguir um padrão semelhante, diferindo principalmente no deslocamento vertical.

O alemão provou ser a exceção. Sua função de risco é a única que intercepta a maioria das curvas construídas para as demais línguas. A pontuação alemã, portanto, parece combinar as características de pontuação de muitas línguas, tornando-se uma espécie de pontuação do esperanto.

A observação acima se encaixa na próxima análise, que foi ver se as características de pontuação das obras literárias originais podem ser vistas em suas traduções. Como esperado, o idioma que mais fielmente transformou a pontuação do idioma original para o idioma de destino acabou sendo o alemão.

Na comunicação falada, as pausas podem ser justificadas pela fisiologia humana, como a necessidade de recuperar o fôlego ou de reservar um momento para estruturar mentalmente o que será dito a seguir. E na comunicação escrita?

"Criar uma frase adicionando uma palavra após a outra, garantindo que a mensagem seja clara e inequívoca é um pouco como apertar a corda de um arco: é fácil no começo, mas torna-se mais exigente a cada momento que passa. Se não houver ordem elementos no texto (e este é o papel da pontuação), a dificuldade de interpretação aumenta à medida que a sequência de palavras aumenta. Um arco muito apertado pode quebrar, e uma frase muito longa pode se tornar ininteligível. Portanto, o autor se depara com a necessidade de 'soltar a flecha', ou seja, fechar uma passagem de texto com algum tipo de sinal de pontuação. Essa observação se aplica a todas as línguas analisadas, então estamos lidando com o que poderia ser chamado de lei linguística", afirma o Dr. .Tomasz Stanisz (IFJ PAN), primeiro autor do artigo em questão.

Finalmente, vale a pena notar que a invenção da pontuação é relativamente recente – os sinais de pontuação não ocorriam em textos antigos. O surgimento de padrões de pontuação ideais nas línguas escritas modernas pode, portanto, ser interpretado como o resultado de seu avanço evolutivo. No entanto, a necessidade excessiva de pontuação não é necessariamente um sinal de tal sofisticação.

O inglês e o espanhol, atualmente as línguas mais universais, parecem, à luz dos estudos anteriores, menos rígidos quanto à frequência do uso da pontuação. É provável que essas línguas sejam tão formalizadas em termos de construção de sentenças que haja menos espaço para ambiguidades que precisariam ser resolvidas com sinais de pontuação.


Mais informações: Tomasz Stanisz et al, Características universais versus específicas do sistema de padrões de uso de pontuação nas principais línguas ocidentais, Chaos, Solitons & Fractals (2023). DOI: 10.1016/j.chaos.2023.113183

 

.
.

Leia mais a seguir