mineração de padrões

preocupações com a privacidade e direções futuras

o potencial de invasão de Privacidade usando mineração de dados tem sido uma preocupação para muitas pessoas. Os bancos de Dados Comerciais podem conter registros detalhados do histórico médico das pessoas, transações de compra e uso de telefone, entre outros aspectos de suas vidas. Os libertários civis consideram alguns bancos de dados mantidos por empresas e governos uma intrusão injustificada e um convite ao abuso. Por exemplo, a American Civil Liberties Union processou os EUA. Agência de segurança nacional (NSA) alegando espionagem sem mandado contra cidadãos americanos por meio da aquisição de registros de chamadas de algumas empresas americanas de telecomunicações. O programa, que começou em 2001, não foi descoberto pelo público até 2006, quando as informações começaram a vazar. Muitas vezes, o risco não é da mineração de dados em si (que geralmente visa produzir conhecimento geral, em vez de aprender informações sobre questões específicas), mas do uso indevido ou divulgação inadequada de informações nesses bancos de dados.Nos Estados Unidos, muitas agências federais agora são obrigadas a produzir relatórios anuais que abordam especificamente as implicações de privacidade de seus projetos de mineração de dados. A lei dos EUA que exige relatórios de privacidade de agências federais define a mineração de dados de forma bastante restritiva como “…análises para descobrir ou localizar um padrão preditivo ou anomalia indicativa de atividade terrorista ou criminosa por parte de qualquer indivíduo ou indivíduo. Como várias agências de aplicação da lei locais, nacionais e internacionais começaram a compartilhar ou integrar seus bancos de dados, o potencial de abuso ou violações de segurança forçou os governos a trabalhar com a indústria no desenvolvimento de computadores e redes mais seguros. Em particular, tem havido pesquisas em técnicas de mineração de dados que preservam a privacidade que operam com dados distorcidos, transformados ou criptografados para diminuir o risco de divulgação de dados de qualquer indivíduo.

a mineração de dados está evoluindo, com um piloto sendo competições em problemas de desafio. Um exemplo comercial disso foi o Prêmio Netflix de US $ 1 milhão. A Netflix, uma empresa americana que oferece aluguel de filmes entregues por correio ou transmitidos pela Internet, iniciou o concurso em 2006 para ver se alguém poderia melhorar em 10% seu sistema de recomendação, um algoritmo para prever as preferências de filmes de um indivíduo com base em dados de aluguel anteriores. O prêmio foi concedido em Setembro. 21 de junho de 2009, para o caos pragmático de BellKor—uma equipe de sete matemáticos, cientistas da computação e engenheiros dos Estados Unidos, Canadá, Áustria e Israel que alcançaram a meta de 10% em 26 de junho de 2009 e finalizaram sua vitória com um algoritmo aprimorado 30 dias depois. A competição aberta de três anos estimulou muitas inovações inteligentes de mineração de dados dos concorrentes. Por exemplo, as Conferências de 2007 e 2008 sobre descoberta de conhecimento e Mineração de dados realizaram workshops sobre o Prêmio Netflix, no qual foram apresentados trabalhos de pesquisa sobre tópicos que vão desde novas técnicas de filtragem colaborativa até uma fatoração matricial mais rápida (Um componente-chave de muitos sistemas de recomendação). Preocupações com a privacidade de tais dados também levaram a avanços na compreensão da privacidade e do anonimato.

a mineração de dados não é uma panacéia, no entanto, e os resultados devem ser vistos com o mesmo cuidado que com qualquer análise estatística. Um dos pontos fortes da mineração de dados é a capacidade de analisar quantidades de dados que seria impraticável analisar manualmente, e os padrões encontrados pode ser complexa e difícil para o homem compreender; esta complexidade requer cuidados na avaliação dos padrões. No entanto, as técnicas de avaliação estatística podem resultar em conhecimento isento de viés humano, e a grande quantidade de dados pode reduzir vieses inerentes a amostras menores. Usado corretamente, a mineração de dados fornece informações valiosas sobre grandes conjuntos de dados que, de outra forma, não seriam práticos ou possíveis de obter.

Christopher Clifton

Leave a Reply