Andmete segadus

Videot: Bicycles. Memorial service for Tallinn City Hall.

Sisu

Definitsioon - mida tähendab andmete kobestamine?
Sissejuhatus Microsoft Azure'i ja Microsoft Cloud | Kogu selle juhendi kaudu saate teada, mis on pilvandmetöötlus ja kuidas Microsoft Azure aitab teil pilvest rännata ja oma ettevõtet juhtida.
Techopedia selgitab Data Wranglingut

Definitsioon - mida tähendab andmete kobestamine?

Andmete segadus on spetsiifiline andmehaldusviis, mis tuleneb uutest tarkvaravõimalustest, mis tutvustavad suuri, räpaseid ja mitmekesiseid andmekogumeid, mis peavad analüüsimise ja kasutamise jaoks minema teenuskesksele arhitektuurile (SOA). Andmete segamine hõlmab reeglina palju erinevaid keerukaid tehnikaid ebaregulaarsete või mitmekesiste andmete töötlemiseks ja nende töötlemiseks äriotstarbel.

Sissejuhatus Microsoft Azure'i ja Microsoft Cloud | Kogu selle juhendi kaudu saate teada, mis on pilvandmetöötlus ja kuidas Microsoft Azure aitab teil pilvest rännata ja oma ettevõtet juhtida.

Techopedia selgitab Data Wranglingut

See võib kõlada mitteametliku terminina, kuid andmete segadus võtab andmehalduses tegelikult teatud ruumi. Üks abistav viis andmete kuritarvitamise mõistmiseks on selle vastandamine sageli ametlikuma ekstraheerimise, teisendamise ja laadimise (ETL) metoodikaga. Andmete segamisel on ETL-ist erinevad aspektid ja kasutusjuhud. Seda teevad sageli kvalifitseeritud andmeteadlased või teised torujuhtme lähedal olevad isikud. Mõnes mõttes võiks andmete segamist nimetada avatud lähtekoodiga ETL-i tüübiks, kuna need andmetega tegelevad insenerid võivad olla rohkem "käed-külge" või kasutada rohkem käsitsi kaevandamismeetodeid.

Neile, kes mõistavad tõepoolest rafineeritud protsesse, mille abil mitmekesiseid andmeid kogutakse, sorteeritakse ja sisestatakse ettevõtte arhitektuuridesse, on andmete segamine tegelikult väga oluline teema. IT-spetsialistid vaatavad tohutut hulka tööriistu, ressursse ja tehnikaid, et räpakatest, töötlemata või struktureerimata andmetest väärtust juurde tuua.