6 suurt müüti suurandmete haldamise kohta

Autor: Eugene Taylor
Loomise Kuupäev: 15 August 2021
Värskenduse Kuupäev: 22 Juunis 2024
Anonim
6 suurt müüti suurandmete haldamise kohta - Tehnoloogia
6 suurt müüti suurandmete haldamise kohta - Tehnoloogia

Sisu


Allikas: Dwnld777 / Dreamstime.com

Ära võtma:

Suured andmed on suur äri, kuid ainult siis, kui neid kasutatakse õigesti.

2014. aasta mais avaldas Forrester Research kaks aruannet, milles tehti teatud järeldused suurandmete ümbritseva hüpe kohta. Uuringufirma küsitles enam kui 250 turundus- ja äriarendusjuhti. Aruannete autorite sõnul on suurandmete retoorika kõigi aegade tipptasemel ja tehnoloogia müüjad esitavad tooteid, mille osas võib tunduda uskumatu väide.

Gartner nõustub Forrester Researchiga; oluline hype ümbritseb suurandmeid. 2014. aasta septembri aruandes debüteerib Gartner viis suurimat andmemüüti ja Gartneri analüütikud pakuvad arvamust selle kohta, mida on suurandmetest ja nende manipuleerimisest valesti mõistetud. Mis on suurte andmete suurimad müüdid? Vaatame.

Müüt: suurandmete vastuvõtmisel on kõik meist ees.

Gartner ütleb, et huvi suurandmete vastu on kõigi aegade tipptasemel. Vaatamata sellele on 13 protsendil küsitletutest vaevalt töösüsteeme. Põhjus: enamik ettevõtteid pole veel välja mõelnud, kuidas suurtest andmehoidlatest mingit väärtust kaevandada. Gartneri uuring on siinkohal optimistlikum kui Forresteri raport, milles leiti, et vaid 9 protsenti uuringus osalejatest ütles, et nad plaanivad järgmise aasta jooksul rakendada suurandmete tehnikaid. (Suurandmetel on palju pakkuda. Lisateave 5-st reaalajas probleemist, mida suurandmed saavad lahendada.)

Müüt: meil on nii palju andmeid; me ei pea muretsema iga väikese andmevigu pärast.

Gartner on mures sööda pärast, mis meil inimestel on: "Meil on nii palju, vähe, mis halb, pole oluline." Gartneri asepresident ja silmapaistev analüütik Ted Friedman usub, et see on olukorra vaatamiseks vale viis.

"Tegelikult, kuigi igal üksikul veal on kogu andmekogumile palju väiksem mõju kui siis, kui andmeid oli vähem, on puudusi rohkem kui varem, kuna andmeid on rohkem," ütles Friedman. "Seetõttu jääb halva kvaliteediga andmete üldine mõju kogu andmekogumile samaks."

Friedman lisab mureks veel ühe põhjuse. Suurte andmete kogumine hõlmab sageli andmeid väljastpoolt ettevõtet, mille struktuur ja päritolu on seetõttu teadmata. See suurendab vigade võimalust.

Müüt: suurandmete tehnoloogia kaob vajadus andmete integreerimise järele.

Suurandmetele võib rakendada kahte peamist andmete analüüsistrateegiat: „kirjutatav skeem” või „loetud”. Alles hiljuti oli kirjutamisskeem ainus kasutatud meetod. Loetud skeem on praegune hullusega andmebaasihalduses. Erinevalt kirjutamisskeemist, mis nõuab struktureeritud vormingut, laaditakse andmed skeemi loetud andmebaasidesse töötlemata vormingus. Seejärel painutavad arendajad - kasutades struktureerimata andmebaasiplatvorme nagu Hadoop - erinevad andmed kasutatavasse vormingusse. Loetud skeemil on ilmsed eelised, kuid nagu Gartner mainib, peab mingil hetkel toimuma andmete integreerimine.

Müüt: Andmelao kasutamine täiustatud analüütika jaoks on mõttetu.

Andmelao loomiseks aja kulutamine tundub paljudele teabehalduritele mõttetu, eriti kui värskelt püütud andmed erinevad andmelao andmetest. Kuid Gartner hoiatab taas, et isegi täiustatud andmeanalüütika kasutab andmeladu ja uusi andmeid, mis tähendab, et andmeintegraatorid peavad:
  • Täpsustage uusi andmetüüpe, et muuta need analüüsiks sobivaks
  • Otsustage, millised andmed on olulised, ja vajaliku andmete taseme
  • Andmete koondamise määramine
  • Saage aru, et andmete täpsustamine võib toimuda mujal kui andmelaos

Müüt: andmelaod asendavad andmejärved.

Andmejärved on erinevate andmete hoidlad, mitte andmelaod, kus andmed on struktureeritud vormingus. Andmejärve loomine võtab võrreldes andmeladudega vähe vaeva (andmeid pole vaja vormindada), mistõttu pakuvad andmejärved huvi.

Gartner rõhutab, et andmete omamine ei ole mõte - mõte on suhelda hõivatud andmetega teadlike otsuste tegemiseks. Pealegi on problemaatiline (mõneti tõestamata) andmejärvede kasutamine otsustamise hõlbustamiseks.

"Andmeladudel on juba võimalused toetada mitmesuguseid kasutajaid kogu organisatsioonis," ütles Gartneri teadusdirektor Nick Heudecker. "Teabehaldusjuhid ei pea ootama, kuni andmejärved järele jõuavad." (Lisateave suurandmete vastuvõtmise kohta 7-st asjust, mida peate enne vastuvõtmist teadma suurandmete kohta.)

Suurandmed toimivad - uued andmete manipuleerimise meetodid ei pruugi olla

Põhjus, miks Gartner ütles, et "suuremate andmete müütide" asemel "suurimad andmemüüdid", selgub pärast raporti lugemist. Gartner ei ole suurtest andmetest leija. Gartner on kahetsusväärne nende jaoks, kes tunnevad, et uuemad suurandmetega manipuleerimise meetodid on valmis peaministriks.