Ashenfelter é um economista que gosta de analisar dados tanto quanto gosta de apreciar um bom vinho. Um dia ele resolveu unir suas duas paixões e estudar o que faz com que o preço de um vinho seja de alto ou não. Ele sabia por experiência o que fazia o sabor ser mais agradável ao seu paladar, porque aquela uva era menos ácida e o vinho mais encorpado, mas queria dados! Queria analisar essa relação numericamente. E talvez você até já tenha imaginado como ele conseguiu fazer isso: através de um modelo de regressão.
Para ambientar a história, Ashenfelter publicou seu modelo durante da década de 80 e até então a precificação das safras eram feitas baseadas em parâmetros de degustação como acidez e textura, mas também em opiniões de sommeliers acerca do vinho. O modelo de predição de preço de um vinho baseado em algumas variáveis meteorológicas fáceis de serem observadas foi considerado por muitos especialistas da área como uma ofensa, pois diziam que isso desmistificava a degustação do vinho.
Neste post vamos mostrar como o modelo de regressão foi construído e como ele revolucionou o mercado vinícola.
A sacada para fazer a regressão
Todo bom modelo de regressão vem de uma boa sacada para relacionar uma variável de interesse, a variável dependente, com outras variáveis disponíveis. A sacada de Ashenfelter foi muito simples, como ele mesmo disse:
É realmente uma coisa muito simples. O vinho é um produto agrícola tremendamente afetado pelo clima a cada ano.
É tão verdade que chega até a ser óbvio. Porém, até então ninguém havia feito essa relação para construir um modelo de regressão conseguisse avaliar quantitativamente o quanto o clima interfere na qualidade do vinho e consequentemente em seu preço. Assim, Ashenfelter foi atrás de dados de clima para relacionar com o preço das garrafas.
O conjunto de dados obtido
Toda regressão necessita de dados para ser ajustada. Ashenfelter obteve dados de 1952 a 1980 de uma vinícola em Bordeaux, na França, em que foram observadas variáveis meteorológicas da colheita das uvas daquele ano e o preço das garrafas de vinho feitas a partir dessas uvas coletadas. As variáveis meteorológicas são:
- Temperatura média durante a fase de crescimento,
- Quantidade de chuva na época da colheira,
- Quantidade de chuva no inverno.
As primeiras cinco observações do conjunto de dados de Ashenfelter podem ser observadas na tabela abaixo.
Ano | Preço | Temperatura | Chuva_Colheita | Chuva_Inverno |
---|---|---|---|---|
1952 | 37 | 17.1 | 160 | 600 |
1953 | 63 | 16.7 | 80 | 690 |
1955 | 45 | 17.1 | 130 | 502 |
1957 | 22 | 16.1 | 110 | 420 |
1958 | 18 | 16.4 | 187 | 582 |
Os gráficos para confirmar sua suposição
A ideia por trás da sacada de Ashenfelter era que observando como foi o clima durante o crescimento das uvas era possível predizer seu preço com certa precisão. Além disso, por ser um apaixonado por vinhos ele sabia que se o verão fosse bem quente, as uvas ficariam mais maduras, diminuindo a acidez. E quando chove menos a fruta fica mais concentrada, produzindo vinhos encorpados.
Para confirmar essa sua suposição, vejamos um gráfico conjunto da temperatura médio ao longo da fase de crescimento e da quantidade de chuva durante o período de colheira. Em preto estão os vinhos que foram precificados abaixo da média e em vermelho os que foram precificados acima da média daquele ano.
Note que as safras que foram precificadas acima da média são que estão concentradas no lado inferior direito do gráfico. Ou seja, quanto mais alta a temperatura média e quanto mais baixa o volume de chuva, melhor a qualidade do vinho e, consequentemente, maior seu preço.
O modelo de regressão
Sem entrar muito na matemática do modelo, vamos apenas mostrar o resultado final da regressão apresentada por Ashenfelter.
Preço do vinho = 12,145 + 0,0017 x (Volume de chuva no inverno) + 0,0614 x (Temperatura média na época de crescimento) – 0,00386 x (Volume de chuva na colheira)
Vemos então em números a relação que volume de chuva e temperatura tem na qualidade de um vinho. Analisando apenas o sinal dos efeitos das variáveis, volume de chuva no inverno e temperatura média na época de crescimento tem efeitos positivos, indicando que quando maior seus valores observados, maior será a qualidade do vinho. Podemos fazer a mesma relação de maneira análoga no caso do efeito negativo do volume de chuva na época da colheita.
Impacto do modelo
Entre os especialistas e sommeliers o modelo não foi nada bem-vindo e até repudiado. Ashenfelter travou uma briga que durou por anos até que alguém da comunidade de degustação aceitasse que seu modelo tem sua utilidade. Porém, o impacto maior foi para os produtores, principalmente os pequenos, que agora poderiam prever se as uvas coletadas naquela época teriam condições de produzir um bom vinho.
Quanto a precisão do modelo, Ashenfelter conseguiu prever duas safras excelentes dos vinhos de Bordeaux, as de 1989 e de 1990. Quando ele publicou com antecedência que a safra de 1989 seria a safra do século, muitos não acreditaram e diziam que seu modelo não tinha condições de afirmar uma coisa dessas. Após a afirmação de que era realmente uma das melhores safras dos últimos tempos, até a relutante comunidade entendedora do assunto decidiu considerar seu modelo.
Está na hora de você fazer seu próprio modelo de regressão
Bacana, não é? Você também pode fazer seu próprio modelo e quem sabe ele seja capaz de predizer o preço da safra de café ou de alguma outra variável de seu interesse? Basta ter os dados que ensinamos alguns truque de como fazer uma regressão show de bola, é só clicar no botão abaixo.
Links sobre a história do modelo de Ashenfelter
- Artigo original de Ashenfelter onde ele introduz o modelo.
- Página na web de Ashenfelter sobre vinhos e dados.
- Conjunto de dados em R (se desejar em outro formato, é só entrar em contato conosco).
- Números do modelo, para quem quiser estudá-lo.
Seis sigma é incrível! Regressão é incrível!
Contra fatos e dados, não há argumentos!
Parabéns pelo post…
Nossa que didática incrível.
Como fazer essa regressão linear?
Olá Eduardo, temos um infográfico em nosso blog que pode te ajudar!
https://www.sandbox.escolaedti.com.br/infografico-como-preparar-uma-regressao-linear
Espero que possa tirar todas as suas dúvidas.