Tecnologia Científica

Um canivete suiço para dados gena´micos
Uma boa maneira de descobrir o que uma canãlula estãofazendo - se estãocrescendo fora de controle, como nos ca¢nceres, ou estãosob o controle de um va­rus invasor, ou simplesmente fazendo a rotina de uma canãlula sauda¡vel -
Por Caltech.edu - 02/04/2021


Reprodução

Uma boa maneira de descobrir o que uma canãlula estãofazendo - se estãocrescendo fora de controle, como nos ca¢nceres, ou estãosob o controle de um va­rus invasor, ou simplesmente fazendo a rotina de uma canãlula sauda¡vel - éolhar para sua expressão gaªnica. Embora a grande maioria das células de um organismo contenha os mesmos genes, a forma como esses genes são expressos éo que da¡ origem aos diferentes tipos de células - a diferença entre uma canãlula muscular e um neura´nio, por exemplo.

Na última década, as tecnologias para medir a expressão gaªnica em células individuais revolucionaram a biologia . Os bia³logos não precisam mais calcular a média da expressão gaªnica em muitas células dentro dos tecidos; agora eles podem detectar quais genes estãoativos em cada canãlula a qualquer momento.

O poder computacional tem lutado para acompanhar essa explosão de dados, no entanto. Por exemplo, um aºnico experimento pode observar 100.000 células e medir informações de centenas de milhares de transcritos (fragmentos de RNA produzidos quando um gene estãoativo), resultando em dezenas de bilhaµes de fragmentos sequenciados. Os dados gena´micos do sequenciamento de uma única canãlula podem ocupar terabytes de espaço e levar horas ou dias para serem processados ​​em grandes servidores de computação.

Agora, uma nova ferramenta de software permite o processamento de grandes conjuntos de dados gena´micos em cerca de 30 minutos, usando o poder de computação de um laptop comum. Como um canivete suiço, a ferramenta pode ser usada de inaºmeras maneiras para diferentes necessidades biológicas e ajudara¡ a garantir a reprodutibilidade dos estudos cienta­ficos.

A ferramenta, que estãodispona­vel online e aberta para qualquer pessoa, agora estãosendo adaptada por outra equipe de pesquisadores para estudar o va­rus SARS-CoV-2 em amostras coletadas em testes de triagem.

A pesquisa foi realizada em colaboração entre o laboratório de Lior Pachter (BS '94), Bren Professor de Biologia Computacional e Ciências da Computação e Matema¡tica, e Pa¡ll Melsted , professor de Ciência da Computação da Universidade da Isla¢ndia. Melsted éo co-primeiro autor junto com a estudante de pós-graduação Sina Booeshaghi (MS '19). Um artigo descrevendo a pesquisa foi publicado na revista Nature Biotechnology em 1º de abril.

“Existem muitos exemplos de grupos diferentes usando tecnologias diferentes para estudar os mesmos tecidos, por exemplo, o cérebro”, diz Booeshaghi. "O processamento de todos esses dados com o mesmo mecanismo - nossa técnica - facilita a integração dos dados. Nossa ferramenta érápida, eficiente e permite fa¡cil reprocessamento, o que émuito importante para a consistaªncia e reprodutibilidade na ciência"

O desenvolvimento dessa complexa ferramenta de software "internamente" foi importante para realmente abordar as preocupações dos usuários em potencial, porque os usuários em potencial estavam la¡ mesmo no laboratório.

“A interdisciplinaridade de nossa equipe foi fundamental para a concepção e execução desse projeto”, afirma Pachter. "Ha¡ pessoas no laboratório que são cientistas da computação, bia³logos, engenheiros. Sina estãono departamento de engenharia meca¢nica e traz a perspectiva de sua formação em design e engenharia; Pa¡ll tem uma sãolida formação em ciência da computação tea³rica e engenharia de software."

A facilidade de uso, o baixo custo e a modularidade dessas ferramentas permitira£o o pré-processamento consistente e reproduza­vel de dados gena´micos para grandes consãorcios, como o Human Cell Atlas e o Brain Initiative Cell Census Network .

O artigo éintitulado "Pranã-processamento modular, rápido e de memória constante de dados de RNA-seq de canãlula única". Além de Melsted, Booeshaghi e Pachter, outros coautores são o aluno de graduação Lauren Liu, o diretor de bioinforma¡tica Fan Gao, o aluno de graduação Lambda Lu, o ex-aluno Joseph Min (BS '20), o aluno de graduação Eduardo da Veiga Beltrame, o ex-aluno de pós-graduação Kristján Eldjárn Hja¶rleifsson e o pa³s-doutorado Jase Gehring. O financiamento foi fornecido pelo Beckman Institute Caltech Bioinformatics Resource Center e pelo National Institutes of Health.

 

.
.

Leia mais a seguir