'Privid' pode ajudar as autoridades a coletar dados seguros de saúde pública ou permitir que os departamentos de transporte monitorem a densidade e o fluxo de pedestres, sem aprender informaa§aµes pessoais sobre as pessoas.

O sistema de análise de vadeo que preserva a privacidade da Privid suporta consultas de agregação, que processam grandes quantidades de dados de vadeo. Créditos: Imagem: Josanã-Luis Olivares
As ca¢meras de vigila¢ncia tem um problema de identidade, alimentado por uma tensão inerente entre utilidade e privacidade. Como esses pequenos dispositivos poderosos surgiram aparentemente em todos os lugares, o uso de ferramentas de aprendizado de ma¡quina automatizou a análise de conteaºdo de vadeo em grande escala - mas com o aumento da vigila¢ncia em massa, atualmente não háregras legalmente aplica¡veis ​​para limitar as invasaµes de privacidade .Â
As ca¢meras de segurança podem fazer muito oselas se tornaram mais inteligentes e extremamente mais competentes do que seus fantasmas de imagens granuladas do passado, a “ferramenta hera³ica†na madia criminal. (“Veja aquela pequena mancha azul borrada no canto direito daquele canto densamente povoado osnoso pegamos!â€) Agora, a vigila¢ncia por vadeo pode ajudar as autoridades de saúde a medir a fração de pessoas usando ma¡scaras, permitir que os departamentos de transporte monitorem a densidade e o fluxo de veaculos, bicicletas e pedestres, e fornecer a s empresas uma melhor compreensão dos comportamentos de compra. Mas por que a privacidade permaneceu uma reflexa£o tardia fraca?Â
O status quo éadaptar o vadeo com rostos borrados ou caixas pretas. Isso não apenas evita que os analistas fazm algumas perguntas genuanas (por exemplo, as pessoas estãousando ma¡scaras?), mas também nem sempre funciona; o sistema pode perder alguns rostos e deixa¡-los desfocados para o mundo ver. Insatisfeitos com esse status quo, pesquisadores do Laborata³rio de Ciência da Computação e Inteligaªncia Artificial (CSAIL) do MIT, em colaboração com outras instituições, criaram um sistema para melhor garantir a privacidade em imagens de vadeo de ca¢meras de vigila¢ncia. Chamado de “ Privid â€, o sistema permite que os analistas enviem consultas de dados de vadeo e adiciona um pouco de ruado (dados extras) ao resultado final para garantir que um indivaduo não possa ser identificado. O sistema se baseia em uma definição formal de privacidade os“ privacidade diferencial†— que permite o acesso a estatasticas agregadas sobre dados privados sem revelar informações de identificação pessoal.
Normalmente, os analistas teriam acesso ao vadeo inteiro para fazer o que quisessem com ele, mas Privid garante que o vadeo não seja um buffet gra¡tis. Analistas honestos podem ter acesso a s informações de que precisam, mas esse acesso érestritivo o suficiente para que analistas mal-intencionados não possam fazer muito com ele. Para habilitar isso, em vez de executar o ca³digo em todo o vadeo de uma são vez, o Privid divide o vadeo em pequenos pedaço s e executa o ca³digo de processamento em cada parte. Em vez de obter resultados de cada pea§a, os segmentos são agregados e esse ruado adicional éadicionado. (Tambanãm háinformações sobre o limite de erro que vocêobtera¡ em seu resultado - talvez uma margem de erro de 2%, devido aos dados extras com ruado adicionados).Â
Por exemplo, o ca³digo pode gerar o número de pessoas observadas em cada trecho de vadeo e a agregação pode ser a “somaâ€, para contar o número total de pessoas usando coberturas faciais ou a “média†para estimar a densidade das multidaµes.Â
A Privid permite que os analistas usem suas próprias redes neurais profundas que são comuns para análise de vadeo hoje. Isso da¡ aos analistas a flexibilidade de fazer perguntas que os designers da Privid não previram. Em uma variedade de vadeos e consultas, o Privid teve precisão de 79 a 99 por cento de um sistema não privado.
“Estamos em um esta¡gio agora em que as ca¢meras são praticamente onipresentes. Se houver uma ca¢mera em cada esquina, em cada lugar que vocêva¡, e se alguém pudesse realmente processar todos esses vadeos em conjunto, vocêpode imaginar essa entidade construindo uma linha do tempo muito precisa de quando e para onde uma pessoa foiâ€, diz MIT CSAIL O estudante de doutorado Frank Cangialosi, autor principal de um artigo sobre Privid. “As pessoas já estãopreocupadas com a privacidade da localização com GPS osos dados de vadeo agregados podem capturar não apenas seu hista³rico de localização, mas também humor, comportamentos e muito mais em cada local.â€Â
Privid introduz uma nova noção de “privacidade baseada em duraçãoâ€, que desvincula a definição de privacidade de sua aplicação oscom ofuscação, se seu objetivo de privacidade éproteger todas as pessoas, o mecanismo de aplicação precisa fazer algum trabalho para encontrar as pessoas a serem protegidas , que pode ou não fazer perfeitamente. Com esse mecanismo, vocênão precisa especificar tudo completamente e não estãoocultando mais informações do que o necessa¡rio.Â
Digamos que temos um vadeo com vista para uma rua. Dois analistas, Alice e Bob, afirmam que desejam contar o número de pessoas que passam por hora, então enviam um ma³dulo de processamento de vadeo e pedem uma agregação de soma.
O primeiro analista éo departamento de planejamento da cidade, que espera usar essas informações para entender os padraµes de passos e planejar as cala§adas da cidade. O modelo deles conta as pessoas e gera essa contagem para cada trecho de vadeo.
O outro analista émalicioso. Eles esperam identificar toda vez que “Charlie†passar pela ca¢mera. Seu modelo apenas procura o rosto de Charlie e gera um número grande se Charlie estiver presente (ou seja, o “sinal†que eles estãotentando extrair), ou zero caso contra¡rio. A esperana§a deles éque a soma seja diferente de zero se Charlie estivesse presente.Â
Da perspectiva de Privid, essas duas consultas parecem idaªnticas. a‰ difacil determinar com segurança o que seus modelos podem estar fazendo internamente ou para que o analista espera usar os dados. a‰ aa que entra o ruado. Privid executa ambas as consultas e adiciona a mesma quantidade de ruado para cada uma. No primeiro caso, como Alice estava contando todas as pessoas, esse ruado tera¡ apenas um pequeno impacto no resultado, mas provavelmente não afetara¡ a utilidade.Â
No segundo caso, como Bob estava procurando por um sinal especafico (Charlie estava visível apenas por alguns trechos), o ruado ésuficiente para impedi-los de saber se Charlie estava la¡ ou não. Se eles virem um resultado diferente de zero, pode ser porque Charlie estava realmente la¡, ou porque o modelo produz “zeroâ€, mas o ruado o tornou diferente de zero. Privid não precisava saber nada sobre quando ou onde Charlie apareceu, o sistema são precisava saber um limite superior aproximado de quanto tempo Charlie poderia aparecer, o que émais fa¡cil de especificar do que descobrir os locais exatos, nos quais os manãtodos anteriores dependem .Â
O desafio édeterminar quanto ruado adicionar - Privid deseja adicionar apenas o suficiente para ocultar todos, mas não tanto que seja inútil para os analistas. Adicionar ruado aos dados e insistir em consultas ao longo de janelas de tempo significa que seu resultado não serátão preciso quanto poderia ser, mas os resultados ainda são aºteis, proporcionando melhor privacidade.Â
Cangialosi escreveu o artigo com o estudante de doutorado de Princeton Neil Agarwal, o estudante de doutorado do MIT CSAIL Venkat Arun, professor assistente da Universidade de Chicago Junchen Jiang, professor assistente da Universidade Rutgers e ex-pa³s-doutorado do MIT CSAIL Srinivas Narayana, professor associado da Universidade Rutgers Anand Sarwate, e professor assistente na Universidade de Princeton e Ravi Netravali SM '15, PhD '18. Cangialosi apresentara¡ o artigo no USENIX Symposium on Networked Systems Design and Implementation Conference em abril em Renton, Washington.Â
Este trabalho foi parcialmente financiado por uma bolsa Sloan Research Fellowship e bolsas da National Science Foundation.