segunda-feira, 28 de setembro de 2020

Marcas e religiões - como as marcas imitam as religiões para conquistar cliente fiéis

Este é o meu mais recente livro.

Marcas e religiões: como as marcas imitam as religiões para conquistar cliente fiéis

Resumo:
Este livro é o resultado de uma pesquisa que fiz analisando como as marcas incorporam características das principais religiões do planeta, tentando entender como as marcas conseguem atrair fãs e transformar seus clientes em fiéis e evangelizadores.
Marcas incluem empresas, produtos, serviços, sites mas também franquias de cinema, livros, séries, além de artistas e grupos musicais e times de futebol.
A 1ª parte do livro traz uma discussão sobre mitos e religiões, e como eles fazem parte da evolução da Humanidade, relembrando o histórico de deuses e rituais primitivos. Esta parte tenta explicar a importância que damos a mitos e religiões, trazendo os estudos da neurociência sobre a natureza das religiões e por que temos propensão a crer em coisas metafísicas.
Se o leitor quiser, poderá pular a 1a parte sem prejuízo ao entendimento da 2a.
Depois, na 2ª parte, o livro analisa cada característica religiosa e como aparecem nas marcas mais conhecidas mundialmente.
As características estudadas incluem, entre outras, a história da criação da marca, seus heróis ou salvadores, os símbolos que representam a marca, os rituais, cerimônias e datas festivas seguidas pelos fãs, o local sagrado e os demais templos para cultos, os textos e a linguagem específicos do grupo, os ritos de passagem, as experiências místicas, os pecados e profecias, os inimigos e as batalhas, etc.
As informações do livro poderão ajudar a entender o posicionamento das marcas e também contribuir para a construção de marcas ao longo do tempo, com o intuito de conquistar clientes e torná-los fiéis e evangelizadores.
As características estudadas das religiões e que aparecem nas marcas podem servir como um roteiro para a construção de uma nova marca ou para o fortalecimento de uma marca já existente, com o objetivo de atrair clientes fiéis.
O livro se destina a pessoas interessadas em marketing e branding (construção e desenvolvimento de marcas).
À VENDA NA AMAZON.



terça-feira, 1 de setembro de 2020

Visionários e previsões

Quão difícil é tentar imaginar o mundo daqui a 100 anos?

Muitos tentaram. Júlio Verne imaginou como seria Paris em 1960. E fez isso 100 anos antes, no livro “Paris no Século XX”.

H.G. Wells foi mais longe no livro “A Máquina do Tempo”. Imaginou como seria a sociedade em 802.701 d.C.

Nostradamus fez previsões genéricas que podem ser interpretadas de várias formas e isso garante que sejam realizadas.  

João, autor do livro de Apocalipse no final da Bíblia, tentou descrever o que viu usando a linguagem da época. Eram imagens do Céu ou de outra dimensão. Seria como uma pessoa da Idade Média descrevendo um avião.

Júlio Verne era escritor de ficção, então não tinha compromisso com a Ciência. Mas chegou perto ao inventar o submarino, em “20 mil léguas submarinas”, e demonstrar como seria uma viagem à Lua em “Da Terra à Lua” (100 anos antes de um homem pisar lá).

Temos também que citar Philip K. Dick, com seus livros que inspiraram filmes (Blade Runner, O Vingador do Futuro, Minority Report, O Vidente, Agentes do Destino e O Pagamento). E mais: Mary Shelley com suas inovações para o famoso Frankenstein, Arthur C. Clarke (2001 uma odisséia no espaço, 2010 o ano em que faremos contato), Aldous Huxley (Admirável mundo novo), George Orwell (livro “1984”), Isaac Asimov, que escreveu sobre um mundo com robôs inteligentes, e Eugene Wesley Roddenberry criador da série “Star Trek”, cujas tecnologias estão se tornando realidade.

Mas tivemos também visionários que colocaram em prática suas ideias: Leonardo Da Vinci (com inúmeras invenções e estudos em diversas áreas), Benjamin Franklin (famoso por fazer experimentos com pipas), Thomas Alva Edison (que registrou 2.332 patentes e inventou gramofone, cinematógrafo, lâmpada incandescente, microfone e fundou a General Electric) e Nikola Tesla (inventor da corrente alternada).

Alvin Toflfer foi consultor de políticos e empresas nos anos 80 e 90. Seu trabalho era imaginar o mundo e as tecnologias do futuro. No livro “A 3ª Onda”), ele imaginou como seria o mundo hoje na Era da Informação e do Conhecimento. Acertou algumas coisas e errou outras.

O físico pop Michio Kaku descreve como será o mundo daqui a 100 anos no livro “A Física do Futuro”. Mas para isso ele consultou diversos cientistas de diversas áreas. É uma previsão baseada em fatos. Mas fatos atuais.

Steve Jobs imaginou um computador na palma da mão, sem conexões e cartões e memória. Foi criticado na época. Mas acertou em cheio.

 Mas há também visionários que erraram.

      1927, Harry M. Warnet (um dos fundadores da Warner Brothers): “quem quer ouvir os atores falarem ?

     Thomas Watson (1943) chairman da IBM: “Eu acho que há um mercado mundial para talvez 5 computadores.”

     1899, Charles H. Duell, do escritório de patentes dos EUA: “tudo que podia ser inventado já foi inventado.”

     New York Times: em 1920, criticou cientista de foguetes dizendo que foguetes não podem se mover no vácuo. Em 1969, quando a Apollo 11 aterrissou na lua, eles se retificaram: “Está definitivamente comprovado que um foguete pode funcionar no vácuo. Times lamenta o erro.”

     Revista Varietym sobre o rock’n’roll, em março de 1958: “Até julho sai de moda”.

 E o maior de todos visionários foi esse. Na década de 50, o Santos FC foi jogar com o Brasil de Pelotas. Foi feita uma proposta para trocar o craque pelotense Joaquinzinho por um jovem jogador do Santos, de apenas 16 anos, que era muito rápido. Um visionário da época sugeriu não realizar a troca pois o jovem só tinha velocidade e pouco físico. Seu nome era Edson Arantes do Nascimento. Até hoje os pelotenses estão procurando o tal “visionário”.  

sábado, 25 de julho de 2020

Sobre teletrabalho


Na década de 1980, Alvin Toffler (no livro "A 3a Onda") previu que as pessoas iriam trabalhar de casa. Isso geraria menos trânsito nas cidades e menos prédios de escritórios. As pessoas então iriam sair após o trabalho para entretenimento.

Toffler errou a previsão. Isso não aconteceu devido à tecnologia.

Foi preciso uma combinação de Pandemia + Tecnologias da informação para tornar isso uma realidade (ou pelo menos, algo bem mais comum).

Já Jeremy Rifkin acertou ao fazer uma previsão na década de 1990 (no livro "O Fim dos Empregos") de que os empregos iriam se modificar pelo avanço da tecnologia. O teletrabalho está acabando com alguns postos em áreas como transporte de pessoas e locação de locais físicos para trabalho. Mas aumentou demanda de serviços e vagas em empresas de infraestrutura de comunicação.

O teletrabalho permite a cada pessoa escolher onde quer morar e trabalhar, pois será um lugar somente para isso. Antes era preciso morar perto do trabalho para evitar perda de tempo no trânsito. Agora pode haver uma melhor distribuição de residências. Já há reportagens falando do deslocamento de pessoas para cidades do interior ou menos populosas. Talvez isso equilibre a distribuição de pessoas entre cidades, sem grandes concentrações. E pode ser uma boa oportunidade de negócios em cidades menores (inclusive para profissionais liberais).

Vão se dar melhor as empresas que conseguirem aumentar o número de clientes com pouco aumento nos custos. É o que Jeremy Rifkin discute no livro "Sociedade do Custo Marginal Zero".

Por outro lado, tem gente contra o teletrabalho. Marissa Meyer, presidente do Yahoo, acabou com o teletrabalho para seus funcionários por achar que eles estavam se encontrando menos e assim estavam discutindo menos ideias (tendo menos colaboração).

O argumento dela é embasado pelos estudos de Steven Johnson ("De onde vêm as boas ideias"). Ele relembra que os salões e cafés em Paris e Londres foram importantes para que grandes pensadores se encontrassem, trocassem ideias e desenvolvessem criações e inovações. Isso ficou bem claro no filme "Meia-noite em Paris" de Woody Allen.

quarta-feira, 8 de julho de 2020

Complexidade de sistemas


Quando um sistema fica mais complexo, ele se torna mais difícil de ser entendido ou fica mais difícil prever suas consequências ou funcionamento.

Há uma diferença entre sistemas complicados e sistemas complexos.

Um sistema complicado é aquele que pode ter seu funcionamento controlado, rastreado ou bem entendido. Ele até pode possuir muitos componentes, mas as interações entre eles pode ser controlada ou rastreada. Então o resultado final é previsível, caso os componentes funcionem como esperado. Esse é o caso de um foguete e é por isso que conseguimos enviar pessoas à Lua. Cada peça tem uma função e se relaciona com outras através de entradas e saídas. Ao entender cada relação, pode-se prever ou planejar o resultado final.

Já um sistema complexo, mesmo possuindo poucos componentes, pode ter muitas interações ou então o comportamento de alguns componentes pode não ser previsto, e aí fica mais difícil prever o resultado final (pode ser algo bem diferente do esperado). É isso que acontece com sistemas que envolvem pessoas. Não temos como prever como cada pessoa irá se comportar ou que decisão tomará.

A complexidade de um sistema aumenta conforme:
- o número de componentes;
- a diversidade de componentes, ou seja, quantos tipos diferentes existem (ex. um formigueiro possui um número pequeno de tipos de formigas por suas funções);
- o número de interações; entre 2 elementos, temos um canal de interação; com 3 elementos são 3 canais; com 4 elementos, o número de canais dobra para 6;
- a diversidade nos tipos de interações. Ex. o Facebook considera poucos tipos de ligações. A mais comum é “amizade”. Dentro deste tipo maior (a rede social de um usuário), podemos ter “familiares”. Mas o número de tipos de ligações ainda é pequeno.

A consequência nefasta de um sistema muito complexo é que a mesma entrada pode gerar resultados diferentes.

Além disso, pode ocorrer o fenômeno “pilha de arroz/areia”. Você vai colocando um grão de cada vez e a pilha vai crescendo. Num momento, ao colocar apenas um grão, a pilha desmorona. Você se pergunta “por que caiu, se foi só um grão a mais?”.

A explicação está nas relações. Este grão influenciou 1 ou 2, mas cada um desses influenciou outros e assim por diante (leia sobre sistema exponenciais, série de Fibonacci e Lei de Potência). A influência pode ter sido mínima, por exemplo, o deslocamento mínimo de um grão. Mas vários deslocamentos pequenos podem ter desestruturado o equilíbrio da pilha.


Quais as implicações do estudo de sistemas complexos?

Análise de problemas e causas
Fica mais difícil de fazer manutenção numa máquina ou software com maior complexidade (muitos componentes ou muitas interações). As técnicas para aumentar coesão e diminuir acoplamento podem diminuir a complexidade. O objetivo é entender melhor como cada componente se relaciona (com quais outros e de que forma).

Previsões baseadas em fórmulas matemáticas
Se a relação entre os componentes é uma fórmula, podemos ter um sistema com muitas fórmulas envolvendo diferentes variáveis (ex. previsão do tempo, jogos que simulam administração de uma empresa ou ambiente).
A simulação pode ajudar a entender as diferentes consequências. Mesmo fornecendo como entrada os mesmos dados, os resultados podem ser diferentes num sistema complexo.

Previsões de mercados ou comportamento de grupos sociais
Simulações para tentar entender o que pode acontecer com o coletivo, sem precisar entender o comportamento individual. A ideia é fazer várias simulações mudando parâmetros e entender quais os resultados possíveis.
Simulações sociais são boas para compreender sistemas que envolvem pessoas ou seres vivos. O Software NetLogo foi feito para fazer este tipo de simulação.
Aplicações incluem planejamento de saídas de emergência e movimentação de manifestações de rua. Também pode-se tentar prever o resultado de ações de marketing nas vendas e na logística de uma empresa.

quinta-feira, 11 de junho de 2020

Estratégias e cuidados para análise de dados




Essa figura nos remete a alguns cuidados e dicas de estratégias para análise de dados.

1) Nunca tome decisões com base em somente um indicador.
Neste caso, analise também o número de infectados, mortos, recuperados que voltaram a ter a doença, etc.
Para outro exemplo, veja o post

2) Seguindo a dica de Hans Rosling (livro "Factfulness: O hábito libertador de só ter opiniões baseadas em fatos"), o melhor é utilizar índices que são divisões entre 2 indicadores. Isto permite comparar ou considerar dois indicadores num só.
Por exemplo, recuperados dividido por número de infectados (ou mortos ou população).

3) Faça comparações mas dentro do mesmo contexto.
Exemplo: número de recuperados no Brasil x algum país semelhante (por população, localização geográfica, economia semelhante, etc).
E lembre: não há 2 casos exatamente iguais (até mesmo gêmeos são diferentes em vários aspectos como comportamento, por exemplo).
Adjetivos como bom/ruim, grande/pequeno, belo/feio, perto/longe são relativos; então só podem ser usados quando há uma comparação.

4) Cuidado com diferenças internas.
O Brasil é muito grande. Analise os indicadores por regiões e estados.
No Amazonas e Pará, capitais são bem diferentes do interior. Assim também em vários outros estados. Compare capitais x cidades do interior, litoral x interior, cidades grandes x pequenas.
E mesmo dentro de uma mesma cidade, há muitas diferenças entre bairros (centro x periferia, bairros ricos x pobres, bairro residencial x industrial).

5) Procure analisar a evolução dos indicadores ao longo do tempo.
Um dado é uma foto de um momento. Após ela, tudo pode ter mudado.
Analise tendências, desvios (outliers), picos, vales, platôs, normal x exceções.

terça-feira, 21 de abril de 2020

Como fazer previsões


Este texto é para iniciantes que querem entender como é que se faz previsões.
Atenção: esta é uma forma de fazer previsões (leia até o fim). 

1o passo é ter registros históricos


Vamos pegar como exemplo os casos confirmados de Covid-19.
Esses registros serão representados num gráfico/plano bidimensional, ou seja, com duas variáveis: X (eixo horizontal) e Y (eixo vertical).

No nosso exemplo, o eixo X terá os dias em sequência, e o eixo Y terá o número de casos.
Como depois vamos usar uma função matemática aplicada sobre os valores de X, o melhor é não usar a própria data mas sim a ordem do dia (por exemplo, o número 1 é o primeiro dia dos registros). Na figura a seguir, são os números em vermelho.





2o passo é encontrar uma função matemática que passe pelos pontos

Por todos os pontos ou o mais próximo deles



Isso pode ser representado por uma função como
y = f(x)

Essa f(x) provavelmente será um número que multiplicado por cada valor de X nos dará os correspondentes valores de Y.

O Excel e outras planilhas possuem funcionalidades para extrair este tipo de função.
Veja a regressão linear no Excel usando a função Proj.Lin


3o passo é usar esta função para calcular valores futuros


Ou seja, um valor que não temos ou não sabemos ainda.
Esse valor é o Y que  será calculado a partir do valor de X  usando a tal função y=f(x) identificada antes. Deve ser um ponto em cima da reta que foi traçada.
Essa função também pode ser chamada de modelo, por isso a expressão de modelo de predição.





1o Cuidado: registros históricos são confiáveis?

Estamos nos baseando em dados passados para identificar a função matemática. Se estes dados estiverem errados, a função identificada será condizente com os dados (estará certa sob este ponto de vista) mas não será condizente com a realidade.
No caso da Covid-19, já se sabe que os casos registrados são bem menores que os casos reais. Primeiro, porque nem todas as pessoas com a doença fizeram testes. Segundo, porque nem todos com a doença registraram seus casos. Terceiro, porque há pessoas com a doença que não apresentaram sintomas, ou seja, nem sabem que estão com a doença.


2o Cuidado: quantos pontos usar? mais recentes ou todos?

A figura a seguir mostra duas funções que foram extraídas a partir dos dados registrados.
A reta vermelha usou mais dados, ou seja, um período maior.
Enquanto que a reta azul foi extraída usando dados mais recentes.
Note que no dia X futuro (linha verde), os valores de Y são diferentes nas duas retas.
Como o comportamento do sistema pode mudar, o mais correto é usar dados mais recentes. Por isso, a previsão do tempo acerta para dias mais próximos e erra mais para dias mais distantes.
Entretanto, se usarmos poucos dados, fica mais difícil encontrar a função (veja o próximo cuidado).




3o Cuidado: qual função, se há mais de uma possível?

Ao extrair uma função que passe o mais próximo dos pontos registrados, é possível que tenhamos como resultado mais de uma função possível (com o mesmo grau, ou seja, mesma distância para todos os pontos).
E notem que no dia futuro X, os valores de Y são diferentes nas duas funções (vermelha e azul).




4o Cuidado: é linear?

Aqui eu mostrei um exemplo extraindo uma reta (função linear) dos pontos registrados. E se não for possível extrair uma reta porque os pontos estão muito distantes? (como na figura a seguir).

Neste caso, ainda temos que procurar uma função mas usando outros métodos.
Talvez a nossa função seja algo como
y = B . (x2 + C)




Talvez a função seja tão complexa que seja necessário dividi-la em partes (diferentes funções).







5o Cuidado: mudança com o tempo

Cuide que uma função exponencial começa muito parecida com uma função linear.
Em certo momento, ocorre  o que Malcolm Gladwell chama de Ponto da Virada. É quando a função passa de linear para exponencial (explosão de casos).



6o Cuidado: simples x complexo (mais de uma variável influencia)

Nem sempre a função Y depende só de uma variável (X, por exemplo).
A venda de refrigerantes não depende só da temperatura. Há outros fatores que podem influenciar (promoções, dia da semana, eventos na cidade, etc.)
Aí é que o modelo de predição fica mais complexo e talvez tenhamos uma função tipo:
y = X.Z + W(K + L.M2)

onde as letras são variáveis ou fatores que influenciam Y.


7o Cuidado: % de erro

Ao fazer previsões, é preciso saber se quanto o modelo está errando ou acertando, ou seja, calcular a margem de erro ou a taxa de precisão/acurácia.
Então, continue registrando os casos reais e compare com suas previsões. Qual foi o percentual de erro. Faça uma média e verifique se essa média ou esse erro diminuiu ou aumenta.
Talvez seja necessário calibrar a função ou usar dados mais recentes.


8o Cuidado: efeito Borboleta

Em sistemas complexos, que usam muitas variáveis, uma pequena diferença no valor de uma das variáveis pode gerar um resultado bem diferente no final.
Veja a figura a seguir. Vamos admitir que o modelo é a função azul e está correta.
Uma variação (ex.  0,0001 de diferença) numa variável pode gerar valores corretos no início mas depois gerar erros muito maiores (função vermelha).



9o Cuidado: cisnes negros - mediocristão x extremistão

Se um sistema está se comportamento de maneira previsível por muito tempo, não significa que será sempre assim.
O peru analisa o ano inteiro e acredita que a família gosta dele, pois tratam bem, dão comida, cuidam da segurança e saúde dele. Mas tudo isso muda no dia de Natal.

Segundo Taleb, existem 2 tipos de sistemas que se contrapõem: Mediocristão e Extremistão.

1) Mediocristão
É um sistema que tem comportamento médio, com poucos picos ou vales (e não muito distantes do ponto médio).
Exemplo: Venda de pães
Nenhuma ação de marketing conseguirá fazer as vendas de pães subirem numa curva exponencial. E também nenhum evento conseguirá diminuir drasticamente a venda de pães (se uma região deixar de produzir ou algumas padarias forem fechadas, por exemplo, a curva cai mas não drasticamente como num Efeito Sêneca).

2) Extremistão
Um sistema onde um único evento pode desorganizar tudo.
Exemplos: autores que tinham publicado alguns livros sem muito sucesso e depois um livro fez suas vendas estourarem: Dan Brown e JK Rowling.

A Economia é um sistema tipo Extremistão.
Sistemas assim são difíceis de serem previstos. Pequenos eventos podem fazer grandes estragos (bolha imobiliária nos EUA, um vírus que vira pandemia).


10o Cuidado: esta é uma maneira de fazer previsões

Ela usa modelos de regressão e precisa que as variáveis sejam valores numéricos.

Para  ver outro tipo de previsão, mas sobre eventos, acesse o link abaixo.
https://miningtext.blogspot.com/2019/10/categorizacao-de-eventos-para-analise.html?m=0


quinta-feira, 16 de abril de 2020

Seleção de Amostras para Análise


1.1       O que é uma amostra e para quê


Uma amostra é um subconjunto de um conjunto (universo de casos).
Ela é útil para analisar dados quando não temos condições de ter todo o conjunto para análise por um desses motivos:
a) não sabemos quem faz parte do Universo
ex. infectados por uma doença, clientes em potencial

b) não temos condições de coletar dados de todos elementos do Universo por limitações de custo ou tempo
ex. avaliar a qualidade de cada peça feita numa indústria, fazer pesquisa com todos as pessoas que já compraram na nossa loja


1.2       Tamanho da amostra


Como determinar o número ideal de elementos numa amostra ? Se olharmos para as pesquisas para presidente do Brasil, a amostra normalmente é composta por aproximadamente 2 mil pessoas. Isto quer dizer que cada pessoa representa em torno de 50 mil outras.
O cálculo estatístico do tamanho da amostra depende do erro amostral (a diferença entre o valor estimado pela pesquisa e o verdadeiro valor e isto pode ser um valor estabelecido como meta); do nível de confiança (a probabilidade de que o erro amostral efetivo seja menor do que o erro amostral admitido pela pesquisa); da população (número de elementos existentes no universo da pesquisa, valor que pode não ser conhecido); entre outros (percentuais máximo e mínimo). Há algumas calculadoras online para fazer tais cálculos.

Tversky e Kahneman (1971) discutem os problemas com amostras muito pequenas. Por exemplo, se você jogar uma moeda não viciada três vezes e der duas vezes cara e uma vez coroa, você estará inclinado a acreditar que a probabilidade é 66,66% contra 33,33%. Mas se jogar mil vezes a mesma moeda, certamente haverá uma proporção próxima de 50/50. Pior seria se nas três primeiras jogadas, desse somente um lado. Como sabemos que, no caso da moeda, a probabilidade é 50/50, isto pode gerar a chamada "falácia do jogador": acreditar que o jogo vai mudar para reverter uma tendência e voltar ao padrão estatístico. Por exemplo, jogando 5 vezes a mesma moeda e dando sempre o mesmo lado (digamos, cara), vamos acreditar que na 6a vez irá dar o outro lado (coroa). E na 7a também vamos estar inclinados que dará coroa para equilibrar o jogo e voltar à proporção 50/50. Entretanto, a proporção só acontece com amostrar maiores. Então, as próximas jogadas só minimizam os desvios e não os corrigem logo em seguida.

Um presidiário lançou 10 mil vezes uma moeda e anotou os resultados. A figura a seguir representa isso. O eixo horizontal X mostra o tempo (quantidade de lançamentos) e o eixo vertical Y mostra o número de vezes de um dos lados da moeda. Conclusão: com o passar do tempo (mais lançamentos), o resultado converge para 50% para cada lado.




1.3       Tipos de amostras


Existem 4 tipos de técnicas de seleção de amostras. Discutiremos elas através de um exemplo: uma loja querendo analisar a satisfação de seus clientes. Também discutiremos duas situações possíveis: a loja já ter um cadastro de clientes e o caso de a loja não conhecer seus clientes (porque entram e saem da loja sem mesmo a loja saber se são homens ou mulheres).

·         Amostras aleatórias
Neste caso, são selecionados aleatoriamente elementos do universo (conjunto todo). Por exemplo, a loja determina o tamanho da amostra (valor N) e a seleção é feita sorteando os N primeiros clientes da base de dados (do cadastro).
Entretanto, para que a técnica seja utilizada adequadamente, a aleatoriedade deve ser total. No caso de clientes saindo da loja, não se pode selecionar clientes apenas num dia. Deve-se levar em conta as variedades (dia da semana, dia do mês, mês, turno, etc).
Esta técnica só deve ser usada quando não se pode utilizar uma técnica melhor.

·         Amostras por conveniência
Neste caso, a seleção é feita pelo que for mais fácil. Por exemplo, a loja seleciona os N primeiros clientes que saírem da loja num determinado dia ou liga para N clientes cadastrados que tiverem telefone e só utiliza dados dos N primeiros que atenderem o telefone.
É a pior técnica pois o critério de escolha é definido por pessoas, o que pode levar a tendências (selecionar somente elementos de um tipo).
Esta técnica só deve ser usada quando não se pode utilizar uma técnica melhor.

·         Amostras por julgamento
As amostras por julgamento são formadas por elementos que satisfaçam regras previamente determinadas. Por exemplo, analisar somente a satisfação de clientes mulheres que compraram mais de um produto até uma semana após o Dia das Mães.
Neste caso, o critério de seleção está bem definido e é justificado (por exemplo, só querer analisar certos tipos de elementos do conjunto todo). E portanto os resultados da análise serão condizentes somente com as regras definidas (não valem para o universo todo).

·         Amostras estratificadas
Esta é a forma correta de gerar amostras. Para tanto, precisa-se identificar que variáveis podem interferir na análise. Por exemplo, no caso da loja, atributos como sexo, idade, classe sócio-econômica, bairro e cidade, valor gasto e forma de pagamento podem fazer diferença para entender os tipos de clientes. E talvez altura, peso e escolaridade não sejam diferenciais para campanhas de marketing ou para entender comportamentos de compra.
Depois de identificadas as variáveis, precisa-se saber a proporção de elementos no universo todo para cada variável. Por exemplo, digamos que há 50% de mulheres e 50% de homens entre todos os clientes da loja, e que 25% são da classe A, 50% da classe B e 25% da classe C, e assim por diante nas demais variáveis.
Então, a amostra será definida com a mesma proporção que a divisão no universo. Ou seja, a amostra deve conter 50% de mulheres, 50% de homens, 25% de pessoas da classe A, 50% de pessoas da classe B, 25% da classe C e assim por diante.
Como na figura a seguir.







1.4       Cuidado na coleta de amostras: normal x exceções

Se quisermos saber como é o funcionamento de uma Biblioteca, temos que ter o seguinte cuidado: se formos observar num dia normal, não estaremos coletando as exceções. E o pior caso é ir num dia que é exceção acreditando que aquilo é o normal.


1.5       Cuidado na coleta de amostras: diversidade

Imagine que queiramos saber a qualidade da água de uma piscina que está fechada há vários dias. Se formos fazer a coleta num único dia, seria adequado coletar amostras da água em pontos diferentes (da parte mais funda X mais rasa, superfície X fundo) se puder haver diferença entre pontos.

Assim, se quisermos avaliar se uma praia (enseada) está própria para banho, se houver diferença entre parte esquerda, centro e direita, temos que coletar amostras nas 3 partes. Temos que verificar se há algum tipo de dejeto em alguma parte, se alguma parte é mais frequentada que as outras, se há vegetação próxima, etc.


1.6       Cuidado na coleta: como saber o que está influenciando

Imagine que uma empresa quer avaliar a qualidade de peças feitas na sua fábrica. Se as peças forem feitas em máquinas diferentes, temos que ter elementos na amostra representando cada máquina.

Se for apenas uma máquina com muitos operadores, a amostra precisa de elementos produzidos por operadores diferentes.

Se a temperatura puder interferir no resultado, temos que coletar amostras em dias ou momentos com temperaturas diferentes.

E se for somente um operador, numa única máquina, num cidade sempre com o mesmo clima? Talvez ele possa produzir melhor ou pior dependendo do dia. Será que os dias que ele sai brigado com a esposa fazem diferença? E os dias em que ele come fruta no café da manhã é diferente dos dias em que ele só come pão?