A curiosa relação entre a margarina e o divórcio

Por Andre Borges Lopes

Estatística é prova cabal de que todo número, desde que devidamente torturado, confessa o que queremos dele. Confessa até que, para manter em paz o seu casamento, é melhor esquecer a margarina hi-tech com esteróides e antioxidantes, e voltar a comer a velha e boa manteiga de leite. Só Que Não.

Tyler Vigen, estudante de criminologia da Harvard Law School, desenvolveu um programa de computador que pesquisa bases de dados em busca de correlações estatísticas. Ele coloca as mais divertidas no seu web site “Spurious Correlations” (Correlações Espúrias), como forma de provocação e denúncia do uso irresponsável de estatísticas com objetivos meramente sensacionalistas.

Da BBC

Spurious correlations: Margarine linked to divorce?
 
By James Fletcher

A website set up by a student at Harvard teaches us to look carefully at statistics. And it’s fun at the same time.

“Margarine consumption linked to divorce.” If you saw that headline on a newspaper or website, what would you think?

What if you read a little further and found a compelling graph showing the rates of divorce and margarine consumption tracking each other closely over almost 10 years.

Tempted to believe there could be a link?

“Maybe when there’s more margarine in the house it’s more likely to cause divorce,” muses Tyler Vigen, “or there’s a link with some of the molecules in margarine or something.”

Vigen is the man behind the margarine graph, which he published on his website Spurious Correlations. The name gives the game away – he’s a statistical provocateur.

Margarine/ Divorce rates

“I’ve seen a lot of headlines, especially sensationalist ones – ‘Scientists find a connection between x and y,’ he says.”

“In a lot of those situations there might be a correlation, but it’s really important for us to be critical about whether there’s a causal mechanism.”

One of the golden rules of statistics is that correlation does not equal causation. Just because the movements of two variables track each other closely over time doesn’t mean that one causes the other.

To make this important, but somewhat dry, point more accessible, Vigen, a criminology student at Harvard Law School, wrote a computer programme to mine datasets for statistical correlations. He posts the funniest ones to Spurious Correlations.

“What’s kind of fun about it is it allows people to be their own scientist for a few minutes, because they get to come up with their own hypothesis,” he says.

The site contains plenty of raw material to test out your ability to come up with a creative causal mechanism.

What links rising per capita cheese consumption to the number of people who died by becoming tangled in their bedsheets?

Why do murders by steam, hot vapours and hot objects rise and fall with the age of the winner of the Miss America beauty pageant?

And how does the number of films Nicholas Cage appears in each year influence the number of female editors of the Harvard Law Review?

Miss America/ Hot vapours

“We think about that for a second, and realise that we have no basis for that in reality,” says Vigen. “There’s just nothing that can confirm that for us and we can kind of reject our own hypothesis outright.”

Real world examples of the difference between correlation and causation abound. A classic is that in summer, ice cream sales and murder rates rise. The two are correlated, but it’s easy to see that neither causes the other. Perhaps there’s a third variable – like hot weather – that causes both?

More seriously, when hormone replacement therapy became commonplace, doctors noticed that women taking HRT seemed less likely to get coronary heart disease. Some doctors suggested a causal relationship – that HRT lowered the risk of heart disease.

Again it turned out that there was a third variable at play. Women who were taking HRT were more likely to come from higher socio-economic groups, with healthier diet and exercise habits. It’s this that lowered the risk of heart disease. In the end, other tests showed that HRT actually raised the risk slightly.

Vigen’s site has attracted lots of attention on social media, where making fun of correlations is a healthy meme. A quick search turns up graphs “proving” Facebook caused the Greek debt crisis, or that a pirate shortage “caused” global warming.

Spurious Correlations goes further in illustrating the pitfalls of our data-rich age.

One is that if you throw enough processing power at a large data set you can unearth huge numbers of correlations.

Nicholas Cage

Many will be statistically significant, meaning that they’re unlikely to have occurred by chance alone. But causal relations, where a change in one variable causes a change in the other, are much harder to find.

Another pitfall is the seductive power of graphs. Numbers in datasets can be hard to grasp, but show someone two lines moving up or down in apparent unison and you’re halfway to convincing them that one causes the other.

“A lot of my charts illustrate where there isn’t a statistically significant correlation but it looks like there is because of how I plotted them on a graph,” he says.

Take the graphs of Nicholas Cage’s film appearances – there are several on Vigen’s website. Cage’s appearances only vary between zero and four each year, but by choosing the scale carefully they can be made to track other variables which rise and fall by millions.

“When you only have maybe 10 (data) points to go by, it’s not that hard to find overlapping lines that curve or vary together,” says Vigen.

So what are Tyler Vigen’s tips to make sure the statistical wool isn’t being pulled over your eyes?

  1. Be critical of statistics that you see
  2. Look for a causal link or mechanism
  3. Demand a little bit of scientific rigour in showing that there’s a strong, statistically significant correlation

Something to bear in mind next time a sensational headline catches your eye.

Redação

11 Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

  1. Não sei se veio daí – já tem

    Não sei se veio daí – já tem tempo – que veio uma da correlação (confundida com causalidade, como foi lembrado) entre a lua cheia e crimes violentos…

  2. O artigo serve para provar
    O artigo serve para provar que estudos estatísticos não valem nada.
    E é isso que o artigo diz.

    No artigo também há gráficos “provando” que o surgimento do FB foi responsável pela crise na Grécia.
    E também outro que diz que a diminuição da pirataria é a causa do aquecimento global.
    Etc..

    1. Vc está desvirtuando… (p/ variar?)

      O artigo nao serve para provar que estatísticas nao valem nada, apenas que nao valem tudo… E que mesmo do ponto de vista estatístico é preciso uma melhor análise da influência mútua de duas ou mais variáveis (ver se a mudança em uma causa mudança em outras) para concluir sobre causalidade, a mera correlaçao entre elas nao sendo suficiente para isso.  

  3. Para traduzir, basta clicar no link da BBC e lá, clicar em

    Traduzir, não é? Pelo menos é assim que faço, usando o google Chrome.

    Aí vai um pedaço do artigo, traduzido lá:

    Um site criado por um estudante na Universidade de Harvard nos ensina a olhar atentamente para as estatísticas. E é divertido ao mesmo tempo.

    “O consumo de margarina ligada ao divórcio.” Se você viu essa manchete em um jornal ou site, o que você pensaria? 

    E se você ler um pouco mais e encontrou um gráfico atraente mostrando as taxas de divórcio e consumo de margarina rastrear o outro de perto ao longo de quase 10 anos.

    Tentados a acreditar que poderia haver um link?

    “Talvez, quando há mais de margarina na casa é mais susceptível de causar o divórcio”, brinca Tyler Vigen “, ou há um link com algumas das moléculas em margarina ou algo assim.”

    Vigen é o homem por trás do gráfico margarina, que ele publicou em seu site espúrias Correlações . O nome dá a partida fora de casa – ele é um provocador estatística.

    “Eu vi um monte de títulos, especialmente os sensacionalistas -” Cientistas descobrem uma conexão entre X e Y “, diz ele.”

    “Em muitas dessas situações pode haver uma correlação, mas é realmente importante para nós, para ser crítico sobre se há um mecanismo causal.”

    Uma das regras de ouro da estatística é que a correlação não é igual a causalidade. Só porque os movimentos de duas variáveis ​​são relativamente próximos ao londo tempo, não significa que um causa o outro.

    Para tornar este importante, mas um pouco seco, ponto mais acessível, Vigen, um estudante de criminologia na Universidade de Harvard Law School, escreveu um programa de computador para os meus conjuntos de dados para correlações estatísticas. Ele posta as mais engraçadas para espúrias Correlações.

    “Qual é o tipo de diversão sobre ele é que permite que as pessoas para ser seu próprio cientista por alguns minutos, porque começam a aparecer com a sua própria hipótese”, diz ele.

    O site contém uma abundância de matéria-prima para testar sua capacidade de chegar a um mecanismo causal criativo.

    O que traz o aumento do consumo per capita de queijo para o número de pessoas que morreram, tornando-se enredado em seus lençóis?

    Por que os assassinatos por vapor, vapores ou objectos quentes subir e descer com a idade do vencedor do concurso de beleza Miss América?

     

    E como é que o número de filmes Nicholas Cage aparece em cada influência ano o número de editores do sexo feminino da Harvard Law Review?

    Leia mais em português no link, clicando em “traduzir”:

    http://www.bbc.com/news/magazine-27537142

  4. Também soube de outras

    correlações interessantes, como essas:

    Inacreditáveis 100% dos ganhadores de prêmios nos concursos da Caixa (megassena, quina, esportiva, etc.) jogaram nessas apostas,  

    Praticamente unânime!!

     

    1. Isso em Lógica indica um fator necessário, mas nao suficiente…

      Nao se ganha em uma loteria sem jogar. Mas nao basta jogar para ganhar. 

  5. Estatística válida

    A relação estatística entre a mudança na alimentação e a diminuição de divórcios não é absurda ( fonte : http://bemzen.uol.com.br/noticias/ver/2012/02/13/3118-combata-a-depressao )

    Trecho:

    “Alimentos ricos em magnésio, cálcio, vitamina B6 e ácido fólico melhoram significadamente o humor. (…)

    Iogurte e Queijos:

    Auxiliam na eliminação da tensão e sintomas da depressão, além de ser possível reduzir e controlar o nervosismo e a irritação. O iogurte por ser rico em BCAA, ou amino-ácidos ramificados, fortalece a memória e ajuda para o bom-humor, já queijos sabiamente envelhecidos, são ricos em triptofano e fosfato de cálcio e magnésio devidamente balanceados, mantendo o bom funcionamento elétrico cerebral. (…)

    Carboidratos complexos:

    Eles ajudam o organismo a absorver triptofano e estimulam a produção do neurotransmissor serotonina, que ajuda a reduzir as sensações de depressão. Uma alimentação pobre em carboidratos, por vários dias, pode levar a alterações de humor e depressão. Alimentos fontes de carboidratos: pães integrais, cereais integrais (trigo, arroz). A recomendação é de 6 a 9 porções diárias, juntamente com manteiga tipo ghee, que não tem colesterol ruim, é rica em colesterol bom  e ajuda ao intestino na produção de serotonina.”

  6. Margarina X Manteiga X KY

    Será que o uso de manteiga promove relações estáveis ? Ou pode levar a um desastre ( a desconfiança da manteiga é minha ) como ilustra o ” Último Tango em Paris ” ? 

Você pode fazer o Jornal GGN ser cada vez melhor.

Apoie e faça parte desta caminhada para que ele se torne um veículo cada vez mais respeitado e forte.

Seja um apoiador