Bloggrannen professor Olle Häggström slår sönder i nyheterna uppmärksammade forskningsrön om att farmödrars svältsituation i unga år påverkar kvinnliga barnbarns dödlighet i hjärt- och kärlsjukdomar. Låter det orimligt, så är det för att det handlar om datafiske eller data mining.
Latest in data mining
Det svensk-amerikanska bolaget Recorded Future, som jag skrivit om tidigare, verkar ha smugit ut lite publika tjänster, som borde vara högintressanta för investerare.
Man kan nu sätta upp sig på att prenumerera på olika framtider (eng futures, ej att blanda ihop med futures, i form av terminer), bevakningar av möjliga eller omdiskuterade händelser som utspelar sig i framtiden. Nedan har jag satt upp prenumerationer för att bevaka guld och olja, samt generellt prat om nyemissioner och specifikt spekulationer om en nyemission i Facebook.

Det går också att sätta upp bevakningar på uttalanden om framtiden för större amerikanska börsbolag, liksom bl a geopolitiska händelser för specifika länder vilket också kan vara intressant, t ex om man investerar i råvarubolag som verkar i lite skakigare länder. Därmed kan man få en bevakning över om det börjar pratas om möjliga framtida geopolitiska händelser i för investeringarna relevanta länder.
Det verkar dock vara så att det enda man kan få fram är hur mycket det pratas om det hela. Klickar man på en viss framtid så får man ett meddelande om “Sorry, you cannot view this. As a Future user you only have limited access. Please contact Recorded Future to get full access.”
Just när det gäller börsintroduktioner och nyemissioner så diskuterar Recorded Future det hela lite grann på sin blogg. För att få tillgång till själva visualiseringen så behöver man dock registrera sig, vilket skedde genom att man satte upp sig på någon framtid och angav sin e-postaddress.
Gränssnittet för själva webtjänsten är inte helt intuitivt än så länge. När jag i efterhand ville lägga till en framtid för Saudi-Arabien hade jag svårt att hitta hur jag skulle göra. Faktum är att jag inte hittade tillbaka till hur jag kunde lägga upp fler framtider i efterhand.
Vem vet, kanske var det inte meningen att jag ens skulle kunna registrera mig? Fast ur användaravtalet kan man läsa följande:
3. Here’s The Best Part
We’re giving you access to the service free of charge. Use it all you want and it won’t cost you a penny. We can’t promise it will stay that way forever (this is not 1999 and sooner or later we will have to find a way to pay our bills), but for now we are focused on trying to make the service the best it can be. Your constructive feedback is all we ask for at this stage. And just so there are no misunderstandings in that regard, the feedback you give us will become the property of RF for us to use or not use as we see fit with no obligation to you.
Så det var nog meningen. Nu skall jag försöka lägga upp fler framtider.
På bolagets blogg kan man också läsa om hur man kan titta på omdiskuterad framtid för det sönderfallande Jemen. Ett citat:
“Based on the information we’ve gathered we can see that Yemen will likely experience food shortages in and torrential floods in 2010. This combination of natural disasters, propensity for famine and malnutrition, and challenges with Islamic radicals and terrorists make it a top hot-spot for conflict in the future.”
Recorded Future söker också folk i Sverige, interaktionsdesigners, språkteknologer/lingvister och statistiker/analytiker. Tror de flesta utvecklarna jobbar i Göteborgsområdet, men några ser ut att vara Stockholmsbaserade baserat på lite grävande hos LinkedIn. Länk med mer info finns längst ner på bolagets hemsida.
Tillägg: Hittar en hel del buggar, så man kanske skall vänta lite med att titta på systemet. Framtiden är kanske inte riktigt här än, åtminstone inte när jag försöker titta på den.
I gårdagens artikel om finansiella korrelationer för perioden 2004-2010, så framgick det att guldet hade en stark korrelation mot priset på WTI-oljan, och underligt nog även mot växelkursen mellan euro och svenska kronor, EURSEK. Det fanns också en svagare negativ korrelation mot växelkursen USDSEK.
Just förhållandet EURSEK och guldpriset i USD borde man ifrågasätta, så jag gjorde en graf över 3-månaders och 12-månaders rullande korrelation för dessa två.

Det framgår med all tydlighet att korrelationen hoppar upp och ner kraftigt över tiden, och nog får avfärdas som slumpmässig. Det finns inte heller något rimligt samband, så slutsatsen är inte direkt överraskande. Det handlade antagligen bara om slump och att vi så lätt lurar oss själva.
Tittar vi däremot mot det mer självklara sambandet mellan dollarns styrka som representerad av USDSEK och guldpriset så kan man dra en annan slutsats.

Tremånaders korrelation varierar kraftigt, men det finns en tendens att den håller sig negativ. För 12-månaders korrelation finns det dock ett mycket kraftfullt samband mellan fallande dollar och stigande guldpris, och tvärt om, undantaget två kortare perioder: Råvarurally 2005-2006 och den akuta finanskrisen 2008-2009. Det är också de perioder som guldet steg som mest mätt i svenska kronor, pga att både guldpris och dollar steg samtidigt. För tillfället är istället korrelationen i både 12- och 3-månaders starkt negativ, och mycket riktigt så har inte heller guldet stigit nämnvärt i pris de senaste månaderna.
Guld är helt klart en hedge mot dollarn, men med periodvis uppsida.
Slutligen kan vi titta på den för hela perioden kraftiga korrelationen mellan WTI och guldpriset.

Här är korrelationen för 12-månaders nästan hela tiden positiv undantaget en kortare period 2007 då det inte fanns någon korrelation, och under den akuta fasen av finanskrisen då oljan föll men guldet steg. Generellt ser ock guldet och oljepriset ut att följa varandra rätt starkt. Som sämst har de inget samband alls, men 12-månaderskorrelationen slår aldrig om så att de går tvärt emot varandra, utan bara att sambandet periodvis försvinner.
Guld kan alltså vara ett bra alternativ till att investera i oljepriset så här efter peak oil. Stiger oljepriset får man följa med via guldet, som dessutom är skyddat mot finansiella kriser.
Fast som svensk bör man titta på om samma samband gäller även för guldpriset mätt i SEK, vilket jag kommer göra i ett senare inlägg.
Generellt verkar 3-månaders korrelationer vara en för kort period, och varierar kraftigt, så jag överväger att sluta titta på den.
Med anledning av förra inlägget har jag titta på lite andra korrelationer mellan olika finansiella indikatorer. Det finns ju en del vedertagna sanningar som kanske inte ifrågasätts.
Jag har plockat fram dagsdata för OMXS30, OMXSPI, EURSEK (dvs vad kostar en EUR i SEK), USDSEK (vad kostar en USD i SEK), S&P-500, WTI (nordamerikanska WTI-referensoljepriset i USD) och guldpriset i USD.
Kom nu ihåg att mellan -0.1 och +0.1 så kan man inte anse att det ens finns något svagt samband, 0.1 till 0.3 är svagt, 0.3 till 0.5 är mellanstarkt och över 0.5 är starkt, och vice versa när det gäller negativ korrelation.
En snabb titt på korrelationer under hela perioden 2004-01-01 – 2010-03-08 ger följande sorterat på störst positiv korrelation överst, och ner till störst negativ (=motsatt) korrelation nederst. Starka korrelationer i fetstil. Glöm nu inte att USDSEK stiger när dollarn faller.
OMXS30/OMXSPI 0.998191787
OMXS30/SP500 0.832665066
EURSEK/Guld 0.679142098
WTI/Guld 0.571562702
OMXSPI/WTI 0.434113035
SP500/WTI 0.415352142
OMXS30/WTI 0.410292917
OMXS30/Guld 0.200593102
EURSEK/WTI -0.028942523
SP500/Guld -0.18267278
USDSEK/Guld -0.247202619
OMXS30/EURSEK -0.291380652
OMXS30/USDSEK -0.458875587
SP500/USDSEK -0.645224687
USDSEK/WTI -0.711507943
Vad vi ser här är alltså att priset på WTI-oljan, och med också övriga världens oljepriser, inte har någon som helst koppling till eurons styrka mot svenska kronor. Inget överraskande direkt.
Däremot är det en stark negativ korrelation mellan stigande amerikanskt börsindex och stigande dollar. Stiger dollarn mot SEK faller amerikanska börsen. Men framför allt så stiger oljepriset om dollarn faller, men det betyder alltså inte att om dollarn faller 1% så stiger oljan 1%, utan snarare så är det dollarn som försvagas om oljan stiger och USA:s bytesbalans försämras. Dessutom har oljan stigit mer än dollarn fallit.
Det finns negativa korrelationer mot EURSEK och USDSEK och svenska börsindex OMXS30. Börsen och svenska kronan stärks alltså ofta samtidigt. Och i övrigt är svenska börsen ofta en svans till det amerikanska börshumöret om man får tro en korrelation på 0.83 mellan S&P-500 och OMXS30. Det finns också ett samband mellan stigande börs och stigande oljepris. Man skall inte tro att oljepriset kan stå emot börskrascher, inte ens efter peak oil, något vi fick se hösten-vintern 2008.
Korrelationer mot guld hittar vi i mitten, med två undantag. Guld kan kanske korrekt nog ses som en hedge som korrelerar svagt mot andra indikatorer och alltså inte berörs så mycket av valutakurser och börshumöret. Däremot finns ett starkt positivt samband mellan stigande oljepris och stigande guldpris.
Och mest överraskande av allt, ett samband mellan stigande guldpris i USD och stigande EURSEK. Stärks euron mot kronan så stiger också priset på guld i USD, eller stiger priset på guld i USD så faller svenska kronan mot euron. Kanske är det så att när investerare flyr till guld, så överger de också mindre valutor som SEK. Det visar i så fall att det finns god anledning som svensk att äga guld. Går det dåligt för Sverige och kronan försvagas så stärks också guldet i utländsk valuta. Underligt nog är denna korrelation mellan guld och euro större än den negativa korrelationen mellan USD och guld.
Det här tål att tittas närmare på, så jag får återkomma vid ett senare tillfälle med närmare analyser över hur korrelationerna ändrats över tiden.
Eller lurar vi oss själva nu igen? Är det bara så att man behöver läsa Fooled by Randomness en gång till? Söker jag mönster där inga finns?
I så fall bör korrelationerna ändra sig över tiden, men det får vi studera närmare framöver.
När det gäller svenska börsindex så finns det lite olika index att välja mellan. Jag brukar mest hänvisa till börsens egna index OMX Stockholm 30 Index (OMXS30) eller det bredare OMX Stockholm PI (OMXSPI), även om jag ibland istället använt Affärsvärldens generalindex, AFGX.
Man kan diskutera lite om det är bättre eller sämre att välja OMXS30 eller OMXSPI.
För att gå till botten med saken har jag testat korrelationen mellan dessa två index sedan 2004.
Vi kan börja med en graf över själva indexen.

Redan här kan väl de flesta se att det inte skiljer sig speciellt mycket åt.
För att sätta det i siffror så är korrelationen mellan OMXS30 och OMXSPI +0.988 under perioden. Inget chockerande kanske, men de två indexena följer alltså varandra mycket hårt och för de flesta ändamål så spelar det alltså ingen roll vilket index man använder.
Min käre läsare, vän av ordning, anmärker då direkt att indexen säkert kan avvika från varandra periodvis.
Låt oss testa den hypotesen. Nedan följer en graf över den rullande korrelationen mellan OMXS30 och OMXSPI det senaste året (257 handelsdagar) respektive de senaste tre månaderna (63 handelsdagar).

Nu blev det genast lite mer intressant. På 12-månaderskorrelationen så följer de två indexen varandra väldigt tätt, undantaget några perioder med lite svagare korrelation. Nu är ju korrelationen baserad på ca 12 månader bakåt, men det ser ut som att det blir lite större skillnad när börsen stiger. Under börskraschen 2008-2009 så var korrelationen däremot extremt hård.
Faller OMXS30 så dras hela börsen med? Här hade det förstås varit intressant att titta på IT-kraschen, där man definitivt såg skillnad på olika sektorer, men jag orkar inte lägga ner tid på att piska fram synkroniserat data.
På tremånaders korrelation så inbillar jag mig att korrelationen faller om börsen gått sidledes. När det inte händer så mycket på börsen försvagas sambandet mellan OMXS30 och OMXSPI, men det är fortfarande över 0.9, undantaget i början av 2005 och nu i början av 2010.
Vill man anstränga sig så ser det ut att finnas en viss symmetri i 3-månaders korrelation, med mittenpunkt runt börstoppen 2007. Korrelationen faller ju längre bort vi är från börstoppen, 2009 speglar 2005, 2008 speglar 2006 om man verkligen anstränger sig att hitta mönster som inte finns. Det är samtidigt rimligt, för när börsen är på topp är alla positiva, och de flesta aktier går åt det enda möjliga hållet, dvs upp, upp, upp! Tills det som alltid vänder ner igen.
Nu kan man diskutera vad en stor avvikelse i korrelationen innebär. Det är dock alldeles för dåligt underlag för att kunna dra några som helst slutsatser.
En slutsats är iaf att det inte är någon större skillnad på OMXS30 och OMXSPI. Inte ens när korrelationen faller ner under 0.9 kan man påstå att de skiljer sig så värst åt.
Håller på att ta fram mer data. Överraskande svårt faktiskt, inte ens samma leverantör av data kan lämna ut samma datum, utan det blir olika luckor här och var som man får åtgärda manuellt. Har iaf piskat ihop synkroniserat data kontra lite valutor, vilket jag får återkomma med, vilket kan ge svar på frågan om kronan stärks när börsen stiger.