De 5 typer databehandling

før du kan gøre brug af en struktureret og ustruktureret du indsamler, skal disse data behandles.

det enkleste eksempel på databehandling er datavisualisering. For eksempel kan de fleste CRM ‘ er spytte dataanalyserapporter i form af grafer. For at komme til dette punkt gennemgår data imidlertid en række konverteringsoperationer.

der er flere forskellige typer databehandling, som adskiller sig med hensyn til tilgængelighed, atomicitet og samtidighed blandt andre faktorer.

Indholdsfortegnelse

1. Hvorfor betyder Databehandlingsmetoden noget?

2. Transaktionsbehandling

5. Distribueret behandling

3. Real-time behandling

4. Batchbehandling

6. Multiprocessing

7. Forberedelse af dine Data til behandling

hvorfor betyder Databehandlingsmetoden noget?

metoden til databehandling, du anvender, bestemmer responstiden på en forespørgsel, og hvor pålidelig output er. Metoden skal således vælges omhyggeligt. For eksempel i en situation, hvor tilgængelighed er afgørende, såsom en børsportal, bør transaktionsbehandling være den foretrukne metode.

det er vigtigt at bemærke forskellen mellem databehandling og et databehandlingssystem. Databehandling er de regler, hvormed data konverteres til nyttig information. Et databehandlingssystem er et program, der er optimeret til en bestemt type databehandling. For eksempel er et timesharing-system designet til at køre timesharing-behandling optimalt. Det kan også bruges til at køre batchbehandling. Det vil dog ikke skalere meget godt til jobbet.

i den forstand, når vi taler om at vælge den rigtige databehandlingstype til dine behov, henviser vi til at vælge det rigtige system. Følgende er de mest almindelige typer databehandling og deres applikationer.

transaktionsbehandling

transaktionsbehandling implementeres i missionskritiske situationer. Dette er situationer, som, hvis de forstyrres, vil påvirke forretningsdriften negativt. For eksempel behandling af børstransaktioner, som tidligere nævnt. I transaktionsbehandling er Tilgængelighed den vigtigste faktor. Tilgængelighed kan påvirkes af faktorer som:

  • udstyr: et transaktionsbehandlingssystem skal have overflødigt udstyr. Redundans giver mulighed for delvise fejl, da redundante komponenter kan automatiseres til at overtage og holde systemet kørende.
  • programmel: programmet til et transaktionsbehandlingssystem skal være designet til hurtigt at komme sig efter en fejl. Transaktionsbehandlingssystemer bruger typisk transaktionsabstraktion for at opnå dette. Kort sagt, i tilfælde af en fiasko afbrydes uforpligtede transaktioner. Dette gør det muligt for systemet at genstarte hurtigt.

distribueret behandling

meget ofte er datasæt for store til at passe på en maskine. Distribueret databehandling nedbryder disse store datasæt og gemmer dem på tværs af flere maskiner eller servere. Det hviler på Hadoop distribueret filsystem (HDFS). Et distribueret databehandlingssystem har en høj fejltolerance. Hvis en server i netværket fejler, kan databehandlingsopgaverne omfordeles til andre tilgængelige servere.

distribueret behandling kan også være uhyre omkostningsbesparende. Virksomheder behøver ikke længere at bygge dyre mainframe-computere og investere i deres vedligeholdelse og vedligeholdelse.

Streambehandling og batchbehandling er almindelige eksempler på distribueret behandling, som begge diskuteres nedenfor.

Integrer Dine Data I Dag!

Prøv gratis i 7 dage. Ingen kreditkort kræves.

realtidsbehandling

realtidsbehandling svarer til transaktionsbehandling, idet den bruges i situationer, hvor output forventes i realtid. De to er imidlertid forskellige med hensyn til, hvordan de håndterer datatab. Realtidsbehandling beregner indgående data så hurtigt som muligt. Hvis den støder på en fejl i indgående data, ignorerer den fejlen og flytter til den næste del af data, der kommer ind. GPS-tracking applikationer er det mest almindelige eksempel på real-time databehandling.

kontrast dette med transaktionsbehandling. I tilfælde af en fejl, såsom en systemfejl, Afbryder transaktionsbehandling løbende behandling og initialiserer igen. Realtidsbehandling foretrækkes frem for transaktionsbehandling i tilfælde, hvor omtrentlige svar er tilstrækkelige.

i en verden af dataanalyse er streambehandling en almindelig anvendelse af databehandling i realtid. Først populariseret af Apache Storm, stream processing analyserer data, som det kommer ind. Tænk data fra IoT-sensorer eller sporing af forbrugeraktivitet i realtid. Google Bigforespørgsel og snefnug er eksempler på cloud-dataplatforme, der anvender realtidsbehandling.

batchbehandling

som navnet antyder, er batchbehandling, når klumper af data, der er gemt over en periode, analyseres sammen eller i batches. Batchbehandling er påkrævet, når en stor mængde data skal analyseres for detaljeret indsigt. For eksempel vil salgstal for en virksomhed over en periode typisk gennemgå batchbehandling. Da der er en stor mængde data involveret, vil systemet tage tid at behandle det. Ved at behandle dataene i batches sparer det på beregningsressourcer.

batchbehandling foretrækkes frem for realtidsbehandling, når nøjagtighed er vigtigere end hastighed. Derudover måles effektiviteten af batchbehandling også i form af gennemstrømning. Gennemstrømning er mængden af data, der behandles pr.

Multiprocessing

Multiprocessing er metoden til databehandling, hvor to eller flere end to processorer arbejder på det samme datasæt. Det lyder måske nøjagtigt som distribueret behandling, men der er en forskel. I multiprocessing befinder forskellige processorer sig inden for det samme system. Således er de til stede i samme geografiske placering. Hvis der er en komponentfejl, kan det reducere systemets hastighed.

distribueret behandling bruger på den anden side servere, der er uafhængige af hinanden og kan være til stede på forskellige geografiske placeringer. Da næsten alle systemer i dag har evnen til at behandle data parallelt, bruger næsten alle databehandlingssystemer multiprocessing.

i forbindelse med denne artikel kan multiprocessing imidlertid ses som et lokalt databehandlingssystem. Typisk kan virksomheder, der håndterer meget følsomme oplysninger, vælge databehandling på stedet i modsætning til distribueret behandling. For eksempel farmaceutiske virksomheder eller virksomheder, der arbejder inden for olie-og gasudvindingsindustrien.

den mest åbenlyse ulempe ved denne form for databehandling er omkostninger. Opbygning og vedligeholdelse af interne servere er meget dyrt.

Kundehistorie

Kundehistorie

Keith tilsluttede flere datakilder til at transformere, organisere og analysere deres kundedata.

 Dansk Redshift Dansk Redshift

David Schuman

Keith Slater
seniorudvikler hos kreativ ambolt

før vi startede med mange, forsøgte vi at flytte data fra mange forskellige datakilder til Redshift. Jens har hjulpet os med at gøre det hurtigt og nemt. Den bedste funktion ved platformen er at have evnen til at manipulere data efter behov uden at processen er for kompleks. Støtten er også stor-de er altid lydhøre og villige til at hjælpe.

FIND ud af, om vi kan integrere dine DATA

tillid til virksomheder over hele verden

nyder Du denne artikel?

Modtag godt indhold ugentligt med nyhedsbrevet!

forberedelse af dine Data til databehandling

før data kan behandles og analyseres, skal de udarbejdes, så de kan læses af algoritmer. Rådata skal gennemgå ETL-ekstrakt, transformere, indlæse – for at komme til dit datalager til behandling. Vi forenkler opgaven med at forberede dine data til analyse. Med vores skyplatform kan du bygge ETL-datarørledninger inden for få minutter. Den enkle grafiske grænseflade fjerner behovet for at skrive kompleks kode. Der er integrationsstøtte lige ud af kassen til mere end 100 populære datalagre og SaaS-applikationer. Og du kan bruge API ‘ er til hurtige tilpasninger og fleksibilitet.

du kan bruge mindre tid på at behandle dine data, så du har mere tid til at analysere dem. Lær mere ved at planlægge en demo og opleve vores lavkodeplatform for dig selv.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.