3.1 Aplicação

Nessa aplicação consideraremos dados de um estudo conduzido pela Ipsos do Brasil Pesquisas de Mercado. Nesse estudo foram entrevistados \(6.127\) consumidores no processo de compra de um veículo novo. Os consumidores responderam a uma série de atributos utilizando uma escala de Likert de 7 pontos. A seguir são apresentados os atributos que serão analisados:

Variável Rótulos
V1007 A minha vida é uma correria, não consigo parar um minuto
V1008 Acho essencial ter as últimas novidades tecnológicas ao meu redor
V1009 Adoro receber elogios
V1010 Arrisco o que for preciso para ter o que eu quero
V1011 As pessoas dizem que sou muito criativo
V1012 As pessoas falam que sou uma uma pessoa sensata, com pé no chão
V1013 Busco sempre o prazer em tudo ao meu redor (casa, comida, bebida…..)
V1014 É importante para mim ter uma casa bem decorada
V1015 Escuto a opinião das outras pessoas antes de tomar uma decisão
V1016 Estou no melhor momento da minha vida
V1017 Eu adoro promoções e descontos
V1018 Eu batalho, corro atrás do que eu quero
V1019 Eu sinto que já cheguei no topo
V1020 Faço de tudo para me manter atualizado
V1021 Gosto de marcas que sinalizem a minha condição social
V1022 Gosto de notícias, de me manter informado
V1023 Gosto de pagar tudo a vista, não gosto de ter dívidas
V1024 Gosto de planejar, assim sei o que posso esperar
V1025 Gosto de relaxar, de aproveitar a vida
V1026 Gosto de superar desafios
V1027 Gosto de ter vida social intensa
V1028 Gosto de tudo muito claro, muito bem explicado
V1029 Me considero uma pessoa que compra muito por impulso
V1030 Me considero uma pessoa que tem consciência do preço das coisas
V1031 Me preocupo mais com os outros do que comigo mesmo
V1032 Minha família é minha fortaleza
V1033 Não perdôo deslizes quando o assunto é qualidade de produtos e serviços
V1034 O mais caro sempre é o melhor
V1035 Procuro me manter preparado para novas exigências profissionais
V1036 Procuro sempre estabilidade, segurança na minha vida
V1037 Quando compro algo, valorizo muito a simpatia, educação e cordialidade dos vendedores
V1038 Quando compro um produto considero muito o preço e o benefício para mim
V1039 Sou cauteloso ao comprar um produto e não me influencio com promoções
V1040 Sou muito detalhista em tudo que faço
V1041 Sou uma pessoa muito emocional
V1042 Sou uma pessoa religiosa
V1043 Tenho minhas contas sempre em dia
V1044 Tenho o poder de mudar a opinião das outras pessoas
V2807 Ao comprar um carro levo mais em consideração o conforto da minha família do que os meus desejos pessoais
V2808 Carros importados são muito melhores do que os nacionais
V2809 Comprar automóveis é um bom investimento
V2810 Comprar um carro novo me deixa muito feliz e me dá muito prazer
V2811 Compro carro pensando exclusivamente em mim
V2812 Dirigir para mim é um momento de grande prazer
V2813 Eu adoro meu carro
V2814 Eu ajusto as minhas finanças, planejo, para sempre poder trocar de carro
V2815 Eu conservo meu carro como se ele fosse novo
V2816 Eu gosto de “sentir” o carro ao dirigir
V2817 Eu gosto de carros com estilo clássico, sofisticado
V2818 Eu gosto de carros com estilo esportivo
V2819 Eu gosto de carros mais exclusivos, ou seja, que poucas pessoas têm
V2820 Eu gosto de carros mais altos
V2821 Eu gosto de ter um carro que atraia a atenção das pessoas
V2822 Eu gosto de velocidade
V2823 Eu pesquiso muito antes de comprar um carro
V2824 Gosto de testar os limites do meu carro, exigindo o máximo dele
V2825 Levo muito em conta qual a montadora do carro na hora de escolher o modelo
V2826 Me mantenho informado sobre as últimas novidades em automóveis
V2827 Meu carro é como se fosse a extensão de minha casa
V2828 Meus amigos e parentes freqüentemente pedem a minha opinião antes de comprar um carro
V2829 Não vivo sem automóvel
V2830 O carro é um mal necessário
V2831 O modelo de carro diz muito sobre seu dono
V2832 Os grandes fabricantes tem opções de modelos muito parecidos em preços e qualidade
V2833 Para mim o “visual” do carro é decisivo na hora da escolha
V2834 Pelo mesmo preço, eu prefiro um carro zero mais simples que um usado mais luxuoso
V2835 Pelo mesmo preço, prefiro comprar um carro mais barato muito equipado do que um carro sem opcionais
V2836 Prefiro carros pequenos/ compactos
V2837 Prefiro não comprar os modelos que sejam muito visados por assaltantes
V2838 Sempre escolho o modelo mais barato, que atenda às minhas principais necessidades
V2839 Sou apaixonado por carros
V2840 Comprei exatamente o carro que planejei
V2841 Concessionária rouba nos preços nas revisões pagas
V2842 Confio mais na oficina mecânica do que na concessionária
V2843 Para mim a concessionária reflete o que a montadora é
V2844 Reclamo diretamente na concessionária quando há um problema no meu carro
V2845 Reclamo diretamente com a fábrica quando há um problema no meu carro
V2846 Falta um canal de comunicação nas concessionárias para reclamações, sugestões, etc…

Após a coleta dos dados, as informações foram compiladas no seguinte banco de dados:

Id V2807 V2808 V2809 V2810 V2811 V2812 V2813 V2814 V2815 V2816 V2817 V2818 V2819 V2820 V2821 V2822 V2823 V2824 V2825 V2826 V2827 V2828 V2829 V2830 V2831 V2832 V2833 V2834 V2835 V2836 V2837 V2838 V2839 V2840 V2841 V2842 V2843 V2844 V2845 V2846
1 6 5 5 7 1 6 7 6 6 6 5 7 7 5 5 6 5 6 6 7 7 6 6 5 7 5 6 3 4 3 5 2 7 7 5 5 5 5 2 6
2 7 5 5 5 4 5 6 7 7 6 4 5 3 4 4 6 5 6 5 4 4 5 3 1 4 5 4 5 4 4 6 6 5 2 2 5 4 5 4 6
3 6 3 5 6 2 7 3 5 6 5 3 6 4 3 2 5 6 5 5 7 3 5 7 7 3 3 5 7 6 6 7 6 6 2 5 3 5 6 2 5
4 5 4 6 6 1 7 6 6 5 6 4 6 1 3 3 2 6 2 6 5 5 5 4 3 7 5 5 6 6 6 5 5 5 6 6 6 5 4 5 6
5 6 5 7 7 4 6 7 7 6 5 3 5 4 6 5 2 7 2 6 5 5 3 7 7 4 5 6 4 5 5 7 5 6 7 5 5 4 6 5 5
6 5 4 5 7 2 6 7 5 7 7 5 3 5 6 6 4 7 4 6 7 4 4 6 1 6 5 6 4 3 4 7 4 7 3 2 1 5 5 4 6
7 4 5 5 7 6 6 6 6 5 5 4 6 6 5 5 7 7 7 6 5 5 5 5 7 6 6 6 7 7 6 7 6 6 6 6 5 5 6 5 5
8 7 6 6 7 1 7 7 6 6 7 1 6 6 6 7 2 6 2 7 7 6 6 7 7 6 7 7 6 6 5 6 6 7 7 6 6 7 7 6 6

Assim, para cada consumidor indicado pela variável Id, possuímos uma série de respostas aos atributos numa escala de 1 a 7.

Lembre-se que temos interesse em definir um agrupamento entre os consumidores. Nesse momento, a primeira decisão a ser tomada é o número de segmentos que serão considerados. Um método simples e muito utilizado para determinar o número de segmentos é o método do cotovelo (Elbow Method). Nesse contexto vamos executar o algoritmo k-means com \(k\) segmentos em que \(k\) varia de 1 a 15 e para cada valor de \(k\) iremos calcular a soma de quadrados intra segmento/cluster total, ou seja,

\[\sum_{c = 1}^{k} \sum_{x \in c} || x - \mu_{c}||^2,\]

em que \(\mu_{c}\) indica o centroide do respectivo segmento/cluster e \(c\) é o índice do segmento em questão. Assim, após calcular essas quantidades, construímos um gráfico de linhas dessa soma de quadrados em função do número de segmentos \(k\). Caso o gráfico apresente um “cotovelo”, ou seja, uma queda brusca na soma de quadrados, então o primeiro valor de \(k\) após a queda brusca será o número de segmentos a ser considerado. Lembre-se que nesse tipo de algoritmo busca-se uma consistência interna dentro do segmento/cluster e uma distância grande em relação aos demais segmentos.

A seguir faremos o gráfico do cotovelo.

Com base no gráfico acima, notamos indícios de que 2 ou 4 segmentos seriam apropriados. Uma abordagem útil para guiar a definição do número de segmentos se dá com a utilização de técnicas de ACP e a projeção dos dados sobre um número reduzido de componentes de acordo com a segmentação. De acordo com os gráficos abaixo, notamos que a partir de duas dimensões já existe uma boa explicação da variância (mais de 30%)

Inicialmente vamos considerar 4 segmentos. Dessa forma, observa-se que os segmentos 1 e 4 apresentam aproximadamente 30% dos consumidores, o segmento 2 apresenta 20% e o segmento 3 apresenta a menor frequência.

Segmento n Porcentagem
1 1873 30.6
2 1224 20.0
3 1084 17.7
4 1946 31.8

Agora vamos considerar os gráficos das componentes de acordo com o segmento. Para as duas primeiras componentes teremos

Note que o gráfico acima sugere que três segmentos seriam adequados. No entanto, ao projetarmos a segmentação sobre a primeira e terceira componente no gráfico abaixo, verificamos que há uma separação razoável em 4 segmentos

Nesse caso, para facilitar a visualização, podemos considerar o gráfico tridimensional abaixo.

Para ajudar na interpretação dos resultados, podemos considerar um gráfico de linha com as medidas dos atributos de acordo com os segmentos. Dessa forma, teremos:

Note que o segmento 3 apresenta o pior desempenho em grande parte dos atributos. O segmento 1 apresenta, para todos os atributos, uma média próxima a 6. Já os segmentos 2 e 4 apresentam grande variabilidade nas medidas dos atributos, sendo que, de forma geral, o segmento 2 apresenta um desempenho melhor que o segmento 4 na maioria dos atributos.

Além de analisar os atributos diretamente, podemos descrever os segmentos em função das variáveis sócio-demográficas. A seguir, faremos a leitura dessas variáveis e a inclusão do segmento nesse banco de dados.

Id Combustivel QuemDirige praca idade sexo classe
1 Gasolina Próprio São Paulo (Metro) 25-34 anos Mulheres A
2 Gasolina Próprio São Paulo (Metro) 25-34 anos Mulheres B
3 Gasolina Próprio São Paulo (Metro) 35-44 anos Mulheres B
4 Gasolina Próprio São Paulo (Metro) 35-44 anos Homens B
Id Segmento Combustivel QuemDirige praca idade sexo classe
1 2 Gasolina Próprio São Paulo (Metro) 25-34 anos Mulheres A
2 3 Gasolina Próprio São Paulo (Metro) 25-34 anos Mulheres B
3 4 Gasolina Próprio São Paulo (Metro) 35-44 anos Mulheres B
4 4 Gasolina Próprio São Paulo (Metro) 35-44 anos Homens B

A seguir faremos duas tabelas de frequências relativas das medidas Combustível e QuemDirige de acordo com o segmento.

1 2 3 4
Álcool 2.51 0.98 3.51 1.75
Diesel 0.11 0.00 0.09 0.05
Flex 11.32 13.15 9.41 10.89
Gás Natural 0.91 0.82 0.92 1.39
Gasolina 85.16 84.97 86.07 85.92
Não sei 0.00 0.08 0.00 0.00
1 2 3 4
Cônjuge 0.59 0.41 0.92 0.72
Filhos 0.00 0.08 0.83 0.05
Motoristas 0.00 0.25 0.09 0.00
Outrs 0.00 0.16 0.28 0.05
Pais 0.43 0.49 0.74 0.67
Próprio 98.99 98.61 97.14 98.51

Assim, observa-se que em relação ao combustível, os segmentos apresentam um comportamento muito similar. Todos os segmentos apresentam a grande maioria de gasolina seguida, respectivamente, por flex, álcool e gás natural. As categorias diesel e não sei somadas não representam nem 1% dentro de cada segmento.

Em relação a quem dirige, os segmentos novamente apresentam uma configuração semelhante. Em todos, mais de 97% dos respondentes são os próprios condutores.

A seguir iremos considerar uma análise descritiva gráfica da faixa etária, sexo e classe social.

É possível observar nos gráficos apresentados acima que o segmento 2 apresenta a maior proporção de consumidores na faixa de 18 a 24 anos. A faixa de 55 anos ou mais é a menos frequente em todos os segmentos.

Os segmentos 1, 2 e 4 apresentam, pelo menos, 59% de consumidores do sexo masculino. Já o segmento 3 apresenta um equilíbrio entre os sexos (48% de homens e 52% de mulheres).

Em relação a classe social, todos os grupos apresentam maior frequência de classe B. Os segmentos 1, 3 e 4 apresentam, aproximadamente, 60% dos consumidores nessa classe. Já o segmento 2 apresenta 50% dos consumidores nessa mesma faixa. A classe social menos frequente nos três grupos foi a classe C, apresentando, aproximadamente 5% dos consumidores. Já a classe B apresenta um destaque no segmento 2.