De quem éa história? AI revela quem chama atenção nos livros dida¡ticos do ensino manãdio
O processamento de linguagem natural revela enormes diferenças em como os livros de história do Texas tratam homens, mulheres e pessoas de cor.
Usando o processamento de linguagem natural, os estudiosos foram capazes de determinar que os livros de história do ensino manãdio do Texas se concentram principalmente em homens brancos. REUTERS / JIM YOUNG
Aproveitando o poder do aprendizado de ma¡quina, os pesquisadores da Universidade de Stanford mediram quanto mais atenção alguns livros de história do ensino manãdio prestam aos homens brancos do que aos negros, minorias anãtnicas e mulheres.
Em um novo estudo de livros de história americana usados ​​no Texas, os pesquisadores encontraram disparidades nota¡veis.
Os alunos hispa¢nicos representam 52% das matraculas nas escolas do Texas, por exemplo, mas os hispa¢nicos quase não receberam nenhuma menção em nenhum dos livros dida¡ticos - menos de um quarto de um por cento das pessoas mencionadas pelo nome.
Em contraste, todos, exceto cinco dos 50 indivíduos mais mencionados, eram homens brancos. Apenas uma mulher fez essa lista - Eleanor Roosevelt - e apenas quatro pessoas de cor. O ex-presidente Barack Obama ficou em 29º, Martin Luther King em 30º, seguido por Dred Scott e Frederick Douglass. Andrew Jackson, um proprieta¡rio de escravos que contribuiu poderosamente para o genocadio dos nativos americanos , recebeu mais menções do que qualquer outro.
Esses são apenas os números da linha superior. Usando as ferramentas de processamento de linguagem natural, ou PNL, os pesquisadores também quantificaram as diferenças em como vários grupos foram caracterizados.
Os homens brancos eram mais propensos a serem associados a palavras que denotam poder, enquanto as mulheres eram mais propensos a se associar a casamento e famalias. Os afro-americanos eram mais provavelmente associados a palavras de impotaªncia e perseguição, ao invanãs de ação polatica ou governo.
“Isso tem o potencial de melhorar os livros dida¡ticos para que os alunos se sintam mais representados e tenham uma visão mais cratica da históriaâ€, diz ela. “Se nosso artigo puder ser um passo para que isso acontea§a, eu ficaria muito, muito feliz.â€
“Mesmo para as pessoas que cresceram com esses livros dida¡ticos, esses padraµes são surpreendentesâ€, disse Dorottya Demszky , uma candidata ao doutorado em linguastica que co-iniciou o projeto. “Esperamos que esse tipo de quantificação possa se tornar uma ferramenta para o desenvolvimento de livros dida¡ticos mais representativos.â€
Expondo os padraµes, mais rápido
Com certeza, não ésegredo que os livros dida¡ticos são moldados pelas prioridades e preconceitos das pessoas no poder. Atémeados do século 20, muitas escolas do sul ensinavam que a Guerra Civil era principalmente sobre os direitos dos estados, e não sobre a escravida£o. Na verdade, os educadores tem vasculhado os livros dida¡ticos por décadas para medir preconceitos e distorções.
Os modelos de PNL, dizem os pesquisadores, podem ser novas ferramentas aºteis nesse esfora§o. Como os modelos de IA laªem cada palavra e analisam cada frase, eles podem fornecer medidas mais holasticas, matizadas e confia¡veis ​​de possível sub e super-representação de grupos diferentes.
Os pesquisadores de Stanford analisaram 18 livros dida¡ticos de história americana que os distritos escolares do Texas usaram de 2015 a 2017, aplicando uma sanãrie de técnicas de processamento de linguagem natural. Isso incluiu modelos de rede neural que quantificam associações implacitas sutis, bem como bancos de dados linguasticos que ajudam a inferir as conotações que surgem de combinações de palavras especaficas.
Demszky, que trabalha com Dan Jurafsky , professor de linguastica e ciência da computação em Stanford e membro do Instituto de Stanford para Inteligaªncia Artificial Centrada no Homem , se juntou a Lucy Li, uma estudante de PhD em processamento de linguagem natural na UC Berkeley, e Patricia Bromley , professora associada de educação em Stanford.
“Houve uma mudança real no processamento da linguagem natural em direção a modelos mais socialmente conscientesâ€, diz Jurafsky. “Isso pode ajudar a descobrir as maneiras implacitas como as pessoas são descritas no texto e se saem melhor em capturar o elemento humano e social que étão importante na linguagem. "
A descoberta mais drama¡tica no projeto de história do Texas foi a ausaªncia virtual de hispa¢nicos, que quase não receberam atenção fora da Guerra Mexicano-Americana. As mulheres se saaam melhor, mas também eram discutidas com muito menos frequência do que os homens.
Quando os pesquisadores analisaram as palavras associadas a diferentes grupos, eles descobriram que os negros estavam muito mais conectados do que outros grupos a palavras de impotaªncia como "escravo", "escapou", "possuado" e "barrado". Isso estãoem desacordo, dizem os pesquisadores, com novas pesquisas hista³ricas que enfatizam o poder e a agaªncia dos negros na luta por sua liberdade. As mulheres, por sua vez, foram conectadas com verbos como "casar" e "ajudar" e substantivos como "esposa" e "ma£e". “Famaliaâ€, “casa†e “tarefas domésticas†estavam entre as outras palavras principais associadas a s mulheres. Os homens brancos, por outro lado, estavam mais intimamente associados a palavras como "lider", "autoridade", "realização" e "poderoso".
Os pesquisadores encontraram disparidades semelhantes quando analisaram os tópicos associados a diferentes grupos. As mulheres foram associadas a dois temas - familia e movimentos sociais. Os homens também eram associados a famalia, mas também aos militares e a tomada de decisaµes.
Talvez não surpreendentemente, os pesquisadores descobriram que a tendaªncia polatica dos distritos escolares afetou os tipos de livros usados. Os livros dida¡ticos em condados dominados por eleitores democratas prestavam um pouco mais atenção ao papel das mulheres do que os manuais usados ​​nos condados republicanos. Nenhum dos livros dida¡ticos, entretanto, prestou atenção real aos hispa¢nicos.
Os pesquisadores alertam que o estudo não tira conclusaµes sobre por que alguns livros da£o mais atenção aos homens brancos do que a s mulheres e minorias, nem sobre quais são os naveis apropriados. Embora velhos preconceitos fazm parte da explicação, outra possibilidade éque muitos livros-texto se concentrem em eventos e lideres polaticos formais, em vez de na vida das pessoas.
A principal conclusão, diz Demszky, éque o aprendizado de ma¡quina e o processamento de linguagem natural oferecem novas oportunidades para entender o que os livros dida¡ticos realmente ensinam e para torna¡-los mais amplamente relevantes.
“Isso tem o potencial de melhorar os livros dida¡ticos para que os alunos se sintam mais representados e tenham uma visão mais cratica da históriaâ€, diz ela. “Se nosso artigo puder ser um passo para que isso acontea§a, eu ficaria muito, muito feliz.â€