Estudo constata que homens são representados quatro vezes mais que mulheres na literatura
Pesquisadores da Escola de Engenharia USC Viterbi utilizaram tecnologias de IA para concluir que personagens masculinos são quatro vezes mais prevalentes na literatura do que personagens femininos.
Pixabay
Pesquisadores da Escola de Engenharia USC Viterbi utilizaram tecnologias de IA para concluir que personagens masculinos são quatro vezes mais prevalentes na literatura do que personagens femininos.
Mayank Kejriwal, lider de pesquisa do Instituto de Ciências da Informação da USC (ISI), foi inspirado pelo trabalho atual sobre preconceitos implacitos de gaªnero e sua própria experiência em processamento de linguagem natural (PNL). Enquanto muitos estudos publicados pesquisam e analisam os aspectos qualitativos da representação feminina na literatura e na madia, a pesquisa de Kejriwal fez uso particularmente de seus pontos fortes oscoleta de dados quantitativos por meio de algoritmos de aprendizado de ma¡quina existentes.
Para produzir essas descobertas, Kejriwal e Nagaraj acessaram dados por meio do corpus do Projeto Gutenberg, que contanãm 3.000 livros em inglês, uma tentativa adicional de mitigar o vianãs do pesquisador. O gaªnero de livros variou de aventura e ficção cientafica , a mistério e romance, e em meios variados, incluindo romances, contos e poesia.
Akarsh Nagaraj, MS '21, coautor do estudo e engenheiro de aprendizado de ma¡quina da Meta, ajudou a descobrir o desequilabrio litera¡rio masculino-feminino de 4:1.
“O preconceito de gaªnero émuito real, e quando vemos mulheres quatro vezes menos na literatura, isso tem um impacto subliminar nas pessoas que consomem a culturaâ€, disse Kejriwal, professor assistente de pesquisa no Departamento de Engenharia Industrial e de Sistemas Daniel J Epstein. "Revelamos quantitativamente de maneira indireta em que o preconceito persiste na cultura".
Nagaraj observou a importa¢ncia de como seus manãtodos e as descobertas do estudo lhes transmitiram uma maior compreensão dos preconceitos na sociedade e suas implicações. "Os livros são uma janela para o passado, e a escrita desses autores nos da¡ um vislumbre de como as pessoas percebem o mundo e como ele mudou."
Homens em todos os lugares… e personagens principais
O estudo descreve vários manãtodos para definir a prevalaªncia feminina na literatura. Eles utilizaram o Reconhecimento de Entidade Nomeada (NER), um manãtodo de PNL proeminente usado para extrair caracteres específicos de gaªnero. "Uma das maneiras de definir isso éolhando quantos pronomes femininos estãoem um livro em comparação com os pronomes masculinos", disse Kejriwal. A outra técnica équantificar quantas personagens femininas são os personagens principais nele.
Â
Isso permitiu que a equipe de pesquisa determinasse se os personagens masculinos eram centrais para a história.
Os achados do estudo também mostraram que a discrepa¢ncia entre personagens masculinos e femininos diminui sob autoria feminina. "Isso nos mostrou claramente que as mulheres naquela anãpoca se representavam muito mais do que um escritor masculino", disse Nagaraj.
Os manãtodos diversificados da equipe para medir e determinar a representação feminina na literatura não vieram sem limitações, no entanto, quando os autores não são nem homens nem mulheres. “Quando publicamos o artigo do conjunto de dados, os revisores tiveram essa cratica de que esta¡vamos ignorando gêneros não dicota´micosâ€, disse Kejriwal. "Mas concordamos com eles, de certa forma. Achamos que foi completamente reprimido e não conseguiremos encontrar muitos [indivaduos transgêneros ou indivíduos não dicota´micos]".
Dicotomias desafiadoras
Kejriwal reconheceu que as ferramentas de IA para identificar palavras no plural, como "eles", que podem estar se referindo a um indivaduo não dicota´mico, ainda não existem. Ainda assim, as descobertas do estudo constroem a estrutura para abordar essas questões sociais e construir as tecnologias que podem lidar com esses danãficits.
O estudo também fornece um plano para trabalhos futuros na quantificação das descobertas qualitativas que eles descobriram por meio das metodologias do estudo. Sem o vianãs inerente de pesquisas projetadas por humanos, a tecnologia da PNL também permitiu que eles encontrassem associações de adjetivos com personagens específicos de gaªnero, aprofundando sua compreensão do vianãs e sua difusão na sociedade.
"Mesmo com atribuições erradas, as palavras associadas a s mulheres eram adjetivos como 'fraca', 'ama¡vel', 'bonita' e a s vezes 'estaºpida'", disse Nagaraj. "Para personagens masculinos, as palavras que os descreviam incluaam 'liderana§a', 'poder', 'força' e 'polatica'."
Embora a equipe não tenha quantificado essa faceta de seu estudo, essa diferença nas descrições qualitativas entre caracteres específicos de gaªnero fornece um escopo futuro para uma investigação qualitativa mais abrangente sobre associações de palavras com gaªnero.
"Nosso estudo nos mostra que o mundo real écomplexo, mas hábenefacios para todos os diferentes grupos de nossa sociedade que participam do discurso cultural", disse Kejriwal. "Quando fazemos isso, tende a haver uma visão mais realista da sociedade."
Kejriwal espera que o estudo sirva para destacar a importa¢ncia da pesquisa interdisciplinar osou seja, usar a tecnologia de IA para destacar questões sociais urgentes e desigualdades que podem ser abordadas. As partes interessadas com formação especializada, incluindo cientistas da computação, podem oferecer ferramentas para processar dados e responder a perguntas, e os formuladores de políticas podem usar esses dados para promovermudanças.