Já percebeu que quando busca algo no Google a função autocompletar logo aparece? Opa! Então você já sabe como funciona, na prática, uma das estratégias de coleta e analise de dados, isto porque, o Google utiliza os termos de busca para aprender o que as pessoas estão mais interessadas em saber.
No LinkedIn, além da função autocomplementar, temos a de “Quem viu seu perfil”, que o distingue das outras mídias sociais. Embora utilize o mesmo instrumento do Google, o foco é fazer com que as informações cheguem detalhadas ao usuário e, por isso, mostram as pesquisas de palavras-chave que os trouxeram até seu perfil, quais regiões moram, profissão e empresas as trabalham. Toda essa analise pode ser verificada estatisticamente também.
A ferramenta utilizada por essas e outras plataformas chama-se Big Data. O oráculo do século XXI, são os dados digitais disponíveis em centenas ou milhares de bancos de dados, divididos em fechados (proprietários) ou abertos (redes sociais); estão estruturados (dados armazenados em bancos de dados tradicionais) ou não estruturados (dados como áudio, imagens, vídeos, sensores).
Embora o termo e as aplicações do Big Data estejam em evidência devido, principalmente, ao dilúvio de dados e informações captadas nesses últimos anos, o conceito é antigo e já era empregado antes mesmo de existir os meios digitais e as tecnologias computacionais, como historiou Gil Press em A Very Short History of Big Data no site Winshuttle .
Em meados de 1967, por exemplo, um artigo, Automatic data compression, publicado na The ACM Digital Library, já descrevia com a ‘explosão de informação’ indicava a necessidade de requerer padrões de armazenamento de de informações para que estas fossem reduzidas ao mínimo”. Três décadas se passaram até a terminologia Big Data foi nomeado e cunhado pela NASA.
Mas, qual a captação de dados no Big Data?
Em 2017, cerca de 1 milhão de pessoas começaram a utilizar as mídias sociais. O relatório do We are Social revelou que um novo usuário surge a cada 11 segundos, somatizando mais de 3 bilhões de usuários ativos em 2018.
Cerca de dois terços da população mundial já esta conectada a um serviço móvel e, de acordo com o estudo da GSMA Intelligence, isso representa significativos 5 bilhões.
O infográfico Bluesyemre mostra interativo, a produção de dados por minuto em 2018.
Mensalmente são feitos 42.033,600 trilhões de logins no Facebook; 159.840 trilhões de pesquisas no Google; 1.641,600 quatrilhões de mensagens enviadas do WhatsApp e 8.078,400 quatrilhões e-mails são enviados .
A Netflix informou que os usuários assistem a 140 milhões de horas por dia, isso representa pouco mais de um bilhão de horas por semana, caso você esteja se perguntando. Outro dado importantíssimo do caseda Netflix é que essas metas estratosféricas foram atingidas graças a aplicação do Thick Data ou thick description, pesquisa (tête-à-tête) antropológica dos consumidores.
A Organização Européia para a Pesquisa Nuclear (CERN), que estuda a estrutura fundamental do universo, #42*, revolucionaram suas experimentações. O datacenter do CERN DC transmitiu a marca de 200 petabytes em junho de 2017. Observe as curiosidades que irão sambar na cara do 5 GB do seu iCloud: – 1 Petabyte é suficiente para armazenar 13,3 anos de vídeo HD; 1.5 Petabytes são necessários para armazenar 10 bilhões de fotos no Facebook e o Google processa cerca de 24 Petabytes de dados por dia.
O que é feito com os dados do Big Data?
Revolucionado o Marketing, o Big Data permite que as empresas compreendam os consumidores determinando comportamentos, necessidades, preferências e, portanto, antecipem novas tendências antes da concorrência, aspecto fundamental para sobrevivência do negócio.
Alguns Apps utilizam o wearable devices outecnologia vestível. Assim, as marcas esportivas monitoram os hábitos e comportamentos do seu público e criam produtos cada vez mais alinhados às expectativas de seu público-alvo, fidelizando a clientela e conquistando cada vez mais atletas. Essa tecnologia chegara a mais de US $ 150 bilhões por ano até 2027, segundo o relatório “Wearable Technology 2017-2027.
Os wearables despontam também no segmento da saúde no que tange a prevenção. O relatório Smart Wearable Healthcare informou que 1,3 milhão de vidas serão salvas em 2020por causa do uso dessa tecnologia. A IBM, em parceria com a Universidades Johns Hopkins e da Califórnia, faz a análise de Big Data para prevenção de doenças mortais, como a dengue e a malária.
Máquinas e dispositivos estão mais inteligentes e autônomos através dos dados simultâneos coletados pelo Big Data o Google já criou o carro que dirige sozinho. As informações são obtidas por câmeras, GPS e sensores, não há intervenção humana na condução. Seria o fim do tão estimado utensílio “puta que pariu”?
Os algoritmos do Big Data são utilizados na tomada de decisões porque permitem uma averiguação mais rigorosa das ações monetárias. Além disso, reduz fraudes, aumenta lucros e torna serviços mais econômicos. A American Express (#TheEpitomeofFinancialServices) desenvolveu um sofisticado modelo de preditivos para analisar históricos de transações nos cartões de crédito e é capaz de identificar 24% de seus clientes australianos que pretendem encerrar suas contas dentro dos próximos quatro meses.
It’s a match,bby! O Tinder também utiliza Big Data para melhorar a experiência do usuário e tornar a busca por um “par ideal” menos aleatória. O app também é terreno fértil para monetização e implementação de ações de marketing. Para saber o que fazia mais sucesso na época, 2015, a Gillette propôs aos usuários que deslizassem para a direita rapazes barbeados e para esquerda os barbudos. Resultado: os rapazes barbeados totalizam 74% dos “swiperight”. Pelo, amor, né?
Uma diferencinha sempre dá?
Como observamos, o diferencial do Big Data está em atrelar a oportunidade em cruzar dados por meio de diversas fontes e estimular insights rápidos e, teoricamente, precisos. Teórico, porque a população mundial já atingiu 7,6 bilhões de habitantes então, a conta analítica ainda não fecha, parece que faltam alguns bilhões de dados à serem coletados nesse relatório.
Neste sentido, o Thick Data poderá chegar aonde o Big Data ainda não alcança. Tome como amostra as eleição deste ano, cerca de 66 milhões de eleitores são da classe C e D e que não acessam Twitter (maior fonte de informação do Big data), Instagram e Tinder. No facebook as notícias econômicas e politicas ecoam mais entre pessoas de classe A e B, por isso, a analise desses 66 milhões deverá ser qualitativa usando o Thick.
Há problemas de analise no Big Data quando se trata dos perfis automatizados e ainda não foi possível compilar uma característica única que identifique se determinado perfil é real ou automatizado. Para dimensiona-los, na greve geral de abril de 2017 mais de 20% das interações ocorridas no Twitter entre os usuários a favor da greve foram provocadas por esses perfis e durante as eleições presidenciais de 2014 os robôs também chegaram a gerar mais de 10% do debate.
Expondo esses problemas chegamos ao X da questão: Em estudo sobre o Big Data feito pela The Economist Intelligence Unit mostrou que: – 65% dos CEOs pesquisados acreditam que suas companhias estão aptas a interpretar apenas uma pequena parte das informações; – 35% dos executivos acreditam que principal obstáculo é falta de conhecimento de como aplicá-lo em cada setor; – 41% os diretores de TI endossam que os gestores de outros departamentos não entendem do assunto o suficiente para propor ou requerer projetos possíveis de serem implementados.
Por fim, o potencial do Big Data é decrescido se gerenciado apenas por vias tradicionais de processo e para poder extrair os insights épreciso entender um conjunto grande de dados complexos, ou seja, não está sendo fácil, diria Katia Cega.
Com carinho!