Fokuset på data och dataanalys blir allt starkare. Det innebär naturligtvis att det myntas en massa nya begrepp inom området. Vissa är enkla att förstå, andra mer kryptiska.

Här tipsar IDG News om sex aktuella databegrepp.

1. Snabba data

Snabba data syftar på data vars användbarhet minskar över tid. Det säger i alla Tony Baer, analytiker på Ovum, som säga ha myntat begreppet 2012. Det kan handla om Twitterflöden som bör fångas in och analyseras i realtid. Ur vilken aspekt man än pratar om hög hastighet så innebär det krav på höga prestanda för att hantera sådana data.

Läs också: Nu ska alla barn ha en Windows-hybrid

2. Långsamma data

Här handlar det om data som trillar in i ganska lågt tempo, vilket innebär lägre krav på att analysera dem ofta. Ett exempel är en sensor som mäter tidvatten, vars mätvärden knappast behöver analyseras i realtid. Det är ofta lämpligt att lagra långsamma data i en datasjö och att analysera dem i batchjobb.

3. Små data

”Små data är allt som får rum i en bärbar dator”, säger Gregory Piatetsky-Shapiro, vd på konsultföretaget Kdnuggets i USA. Mycket dataanalys görs fortfarande baserat på en datakälla, eller ett fåtal, på bärbara datorer med hjälpa av enkla program, ibland till och med Excel.

4. Mellandata

Mellandata är, tja, mittemellan. Om det handlar om flera petabyte så är det big data och då används lösningar som Hadoop och Mapreduce för analyser. Men de flesta analyser baseras inte på flera petabyte data enligt Tony Baer. Analyser av mellanstora datamängder görs till exempel med Apaches ramverk Spark.

Läs också: Svenskt i topp när hetaste börskandidaterna rankas

5. Mörka data

Mörka data är sådana data som ofta glöms bort eller används mindre än de borde. ”Folk vet inte att de finns, eller har inte åtkomst till dem, eller så finns det inte system för att använda dem”, säger Nik Rouda, senior analytiker på Enterprise Strategy Group. Databaser, datalager och datasjöar innehåller ofta mörka data. De kan till exempel komma till nytta för maskininlärning.

6. Smutsiga data

Smutsiga data är helt enkelt datamängder som inte har tvättats, alltså inte kvalitetskontrollerats eller transformerats. Om man inte har tvättat data så är de smutsiga, vilket innebär risk för felaktiga resultat av analyser.