Databaser och relatationsdata är gamla välkända begrepp inom IT-sektorn. En relationsdatabas är helt enkelt ett antal olika tabeller(strukturerade i kolumner och fält) där man skapar en eller flera relationer mellan tabellerna. Ett exempel på detta är databasen till vår egen hemsida. Medlemmarna finns i en tabell. Våra kurser finns i en annan och bokningar i en tredje. Sedan skapas det relationer mellan tabellerna så att rätt kurs kan kopplas till rätt medlem. Se detta som ett något förenklat exempel på en relationsdatabas med så kallade strukturerad data.

Big data, eller på svenska stordata, är egentligen en stor mängd ostrukturerad data som behandlas i realtid. Ett exempel på ostrukturerad data är delvis den information som vi lägger in på Facebook, Twitter, bloggar etc. Nu slipas systemen så att man skall kunna analysera, dra slutsatser och fatta beslut efter realtidsbehandling av dessa enorma datamängder. Träffsäkerheten och tillförlitligheten kan idag vara ett problem. Det jobbas febrilt på att öka tillförlitligheten.

Låt mig ta ett exempel! Stordata gör det möjligt att rikta marknadsföringen från en målgrupp till en enskild individ. Tänkt dig att du skriver på Facebook att ”i morgon skall jag åka till stan och köpa nya skor”. Dagen därpå när du är i stan och befinner dig kanske 200 meter från Nordlöfs skor, får du ett SMS om extraerbjudande från just Nordlöfs. Informationen om skoköp har du själv lagt in på facebook. Din mobiltelefon avslöjar var du befinner dig. Tekniskt sett är detta fullt möjlig idag. Men hur roligt är det egentligen när man vet att stora företag vet exakt vad du skriver på Facebook eller Twitter och vet exakt vad du befinner dig just nu.

Problemet med Big Data är idag att hantera all denna ostrukturerade data som samlas in och göra felbedömningar. Jag är övertygad om att Big Data – stordata är ett begrepp vi kommer att höra och läsa mycket av kommande år.