Data er ikke til at stole på

Analyse: Det er enhver leders våde drøm, komplet information. Med Big Data kan alt måles og det meste forudsiges. Det er i hvert fald, den vision IT-leverandørerne sælger. Hele industrier er i dag bygget på data, kaldet det 21. århundredes olie. Men som så ofte før med ny teknologi er fascinationen større end betænkelighederne. Data er ganske rigtigt en råvare som olie, men hvis ikke den bliver brugt rigtigt, risikerer vi, at noget sprænger i luften.

Her er fem gode grunde til at forblive kritisk.

Data manipuleres

I årevis stolede myndighederne blindt på testdata fra Volkswagens biler. Den tyske bilgigant havde imidlertid foretaget en simpel ændring i softwaren, der ændrede dramatisk på resultaterne. Skandalen til milliarder af dollar blev kun opdaget, fordi et beskedent privat laboratorium fortsatte med at undre sig. Data er ikke en konstant, objektiv størrelse, men løbende udsat for manipuleringer, med rette eller ej. Google og Facebook bruger algoritmer til at prioritere indhold, så brugeren kun får et udvalg at se. Ingen kender kriterierne for denne udvælgelse, og der spekuleres konstant i, at virksomheder som Google blander kortene i eget favør.

Data misforstås

Også selv om man i bedste mening fortolker data, kan det give vidt forskellige resultater. The Economist fortæller om en undersøgelse, hvor 29 højt estimerede forskerteams fik udleveret et identisk sæt data, men konklusionerne varierede betydeligt. Ikke kun på grund af kendte faktorer som ubevidst bias, men også fordi forskerne brugte forskellige, men anerkendte værktøjer og metoder. ”Der er tre slags løgne – løgne, forbandede løgne, og statistikker.” Det sagde statsmanden Benjamin Disraeli i det 19. århundrede, og den skepsis over for data data er endnu mere relevant i 2015.

Data overvurderes

Virksomheder bør også være skeptiske over for hypen. Data er en råvare, der først bliver noget værd ved forædling, det vil sige analyse, og lige som i forskningens verden er det langt fra nogen nem proces. Analysefirmaet Gartner forudser en algoritme-økonomi, hvor det er virksomheders evne til at omsætte data til noget operationelt, der bliver den afgørende parameter. I den verden af Internet of Things handles data som en råvare, og allerede nu er der ved at opstå et marked kun for formler, algoritmer, der tilfører værdi. Vinderne bliver de virksomheder, der er bedst til at forstå data.

Data polariserer

Gartners ikke urealistiske fremskrivelse indeholder en økonomi drevet af data. Men den markedsdynamik har en tendens til at skabe ulige markeder, der er blevet kaldt både plutokratier og oligarkiske. Naturloven er, at jo flere data samles, jo mere værdifulde er de. Derfor er størrelse en konkurrenceparameter i sin egen ret.   Allerede i dag har vi en erklæret elite inden for feltet, ”The Gang of Four,” Apple, Amazon, Facebook og Google, mens mange andre har lignende ambitioner. Således er det kun en håndfuld af de 50 største europæiske e-handelsvirksomheder, der tjener penge. Lige som det har været tilfældet for Amazon i stort set alle sine leveår. For dem er forretningen en investering, ikke så meget i patenter eller en infrastruktur, men kundedata.

Data skader

Endelig er der problemet med data som en tikkende bombe. Vi er stadig ved at finde ud af, hvad data kan bruges til, men på nogle områder er man allerede for langt fremme, som hos NSA. Efterretningstjenesten er gået fra en besværlig og lidet effektiv tilværelse med telefonaflytninger og fysisk overvågning til et gennemdigitaliseret marked, hvor der er data på alt. Det har givet NSA, og den amerikanske regering helt nye og uset præcise værtøjer i kampen mod terrror, og i sin de facto industrispionage. Der er adskillige problemer knyttet til det forehavende, men det mest presserende er systemets uigennemsigtighed, i alle tre grene af statsmagten. Ingen eller meget få ved, hvad dataindsamlingen går ud på, og hvilke aktioner den medfører. Det er skadeligt i sig selv.

Data, ja tak, med transparens

Big Data, Internet of Things og lignende teknologier, der bygger på data, har masser af positivt potentiale indenfor såvel økonomisk vækst som bedre leveforhold. Som effektive transportsystemer eller IBM’s Watson, tidligere Jeopardy-vinder, nu lægeaspirant, lige som vi har det konstante behov for avancerede datasimulationer i udforskningen af klimaforandringer. Data er godt, men vi skal bruge stoffet fornuftigt og forlange nogle grundlæggende spilleregler, hvor den allervigtigste er transparens. Vi er nødt til at vide, hvad data, vores alle sammens data, bliver brugt til. Kun på den måde kan vi blive klogere og sikre.

One Response to Data er ikke til at stole på

  1. Pingback: Anti-terror: Hvor skarp skal profilen være? | Tech tjek - teknologi til folket

Password Reset
Please enter your e-mail address. You will receive a new password via e-mail.