12 peamist nõuannet andmeteaduse õppimiseks

Autor: Laura McKinney
Loomise Kuupäev: 3 Aprill 2021
Värskenduse Kuupäev: 15 Mai 2024
Anonim
12 peamist nõuannet andmeteaduse õppimiseks - Tehnoloogia
12 peamist nõuannet andmeteaduse õppimiseks - Tehnoloogia

Sisu


Allikas: Artinspiring / Dreamstime.com

Ära võtma:

Andmeteadlased vajavad ilmselgelt tugevat matemaatika- ja kodeerimisoskust, kuid edu saavutamiseks on vaja ka suhtlemis- ja muid pehmeid oskusi.

Andmeteadlane hindab seda 2019. aasta parimaks tööks Ameerikas Glassdooril. Kuna keskmine põhipalk on 108 000 dollarit ja tööga rahulolu 4,3 viiest, millele lisandub õiglane arv avamisvõimalusi, pole see üllatav. Küsimus on järgmine: Mida peab sellesse töösse pääsemiseks õigele teele asumiseks tegema?

Selle väljaselgitamiseks otsisime nõuandeid neile, kes soovivad sellel karjääriredelil pääseda. Palju taandub kodeerimise ja matemaatika rasketele oskustele. Kuid see tugev arvutus üksi ei lõika seda. Edukad andmeteadlased peavad ka suutma äriinimestega rääkida oma tingimustel, mis nõuab pehmete oskuste ja juhtimisega seotud võimeid. (Lisateavet andmeteadlase kohustuste kohta leiate teemast Töö roll: Andmeteadlane.)


Haridusfondi loomine: kolm peamist näpunäidet

NYC Data Science Academy andmeteadlane Drace Zhan rõhutab vajadust haridusliku sihtasutuse järele, mis sisaldaks kodeerimise ja matemaatikaoskuse olulisust:

  1. R / Python + SQL. Kui teil pole kodeerimisoskust, vajate selle puudujäägi suurendamiseks palju võrguvõimet ja muid valdkondi. Olen näinud andmeteadlasi, kellel on nõrk matemaatika ja vähene domeenikogemus, kuid neid on alati kandnud tugev võime kodeerida. Python on ideaalne, kuid R on suurepärane tagasimineku tööriist. Kõige parem on, kui teie arsenalis on mõlemad. SQL on ka andmeanalüütiku jaoks äärmiselt oluline.

  2. Tugevad matemaatikaoskused. Mõne kõige sagedamini kasutatava meetodi - üldistatud lineaarsete mudelite, otsustuspuu, K-keskmiste ja statistiliste testide - väga hea tundmine on parem kui laiaulatuslik pilt erinevatest mudelitest või spetsialiseerumisest, näiteks RNN.

Need on peamised oskused, millele tugineda, ehkki mõned eksperdid lisavad neid. Näiteks sisaldab KDnuggetsi loend Zhani mainitud kodeerimise komponente ja lisab veel mõned tehnilisest küljest teada olevad kasulikud asjad, sealhulgas Hadoopi platvorm Apache Spark, andmete visualiseerimine, struktureerimata andmed, masinõpe ja AI.


Kuid kui võtta näpunäited uuringus enamlevinud tööriistade kohta, mida kasutatakse Kaggle'i uuringus tegelikus elus kasutamiseks, saame mõnevõrra erinevad tulemused. Nagu alloleva 15 parima valiku graafikult näete, teevad Python, R ja SQL hõlpsalt esikolmiku, neljandaks on aga Jupyteri sülearvutid, millele järgnevad TensorFlow, Amazon Web Services, Unix kest, Tableau, C / C ++, NoSQL. , MATLAB / Oktaav ja Java, kõik Hadoopist ja Sparkist ees. Veel üks lisand, mis võib inimesi üllatada, on Microsofti Exceli andmekaevandamine.

Pilt viisakalt Kaggle'ilt

KDnuggetsi loend sisaldab ka näpunäiteid formaalse hariduse kohta. Enamikul andmeteadlastest on kõrgem kraad: 46 protsendil on doktorikraad ja 88 protsendil vähemalt magistrikraad. Neil olevad bakalaureuse kraadid jagunevad üldiselt omavahel seotud valdkondade vahel. Ligikaudu kolmandik on matemaatikas ja statistikas, mis on sellel karjäärirajal kõige populaarsem. Järgmine populaarseim on arvutiteaduse kraad, mida omab 19 protsenti, ja tehnikateadus, mille valik on 16 protsenti. Muidugi ei uurita andmetöötluse jaoks eriti tehnilisi vahendeid sageli kraadiõppekavades, vaid spetsialiseeritud alglaadimislaagrites või veebikursuste kaudu.

Rohkem kui kursused: veel kaks näpunäidet

Weill Cornelli meditsiini kopsuosakonna teadusuuringute assistent ja NYC Data Science Academy tudeng Hank Yun soovitab püüdlikel andmeteadlastel kavandada, mille kallal nad töötavad, ja leida mentor. Ta ütles:

Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata

Programmeerimisoskust ei saa parandada, kui keegi tarkvara kvaliteedist ei hooli.

Ärge tehke seda viga, mille tegin, öeldes endale, et teate infoteadust, kuna võtsite kursuse ja saite tunnistuse. See on suurepärane algus, kuid kui hakkate õppima, minge projekti silmas pidades. Seejärel leidke väljalt mentor ja alustage kohe kireprojektiga! Kui oled värske, ei tea sa seda, mida sa ei tea, see aitab siis, kui keegi on kohal, juhendades sind selle jaoks, mis on sulle oluline ja mis mitte. Te ei soovi veeta palju aega õppides, ilma et oleks midagi ette näidata!

Teades, millist tööriista oma tööriistakastist välja võtta: näpunäide kõvera ette liikumiseks

Arvestades andmeteadustööriistade järjestamise erinevusi, võivad mõned end segadusse ajada, millele keskenduda. Turvatarkvaraettevõtte McAfee vanemandmeteadlane Celeste Fralick käsitleb seda CIO artiklis, milles käsitletakse andmeteadlase olulisi oskusi, kuulutades järgmist: “Andmeteadlane peab teadusuuringutes püsima kõvera ees, aga ka mõistke, millist tehnoloogiat millal kasutada. ”See tähendab, et teid ei meelita„ seksikas ”ega uus, kui tegelik probleem nõuab midagi palju paremat. "Teadlikkus ökosüsteemi arvutuslikust maksumusest, selle tõlgendatavusest, latentsusest, ribalaiusest ja muudest süsteemi piirtingimustest - aga ka kliendi küpsusest - aitab iseenesest infoteadlasel mõista, millist tehnoloogiat rakendada."

Olulised pehmed oskused: veel kuus nõuannet

Fralicki tõstatatud punkt seostub mittetehniliste oskustega, mida andmeteadlase töö nõuab. Sellepärast sisaldab KDnuggetsi loend neid nelja: intellektuaalne uudishimu, meeskonnatöö, suhtlemisoskus ja ettevõtlusoskus. Zhan sisaldas ka peamisi pehmeid oskusi andmeteadlaste jaoks mõeldud näpunäidetes, tuues välja „suhtlemisoskused” nagu KDnuggets, kuid kasutades „äritegevuse” asemel „domeeni ekspertiisi”. äri. (Lisateavet suhtlemisoskuste kohta leiate jaotisest Suhtlusoskuste tähtsus tehnilistele spetsialistidele.)

Olivia Parr-Rud pakkus sellele välja oma keerutuse, lisades veel kaks pehmet oskust, rõhuasetusega loovuse rollile, kinnitades: „Arvan nii andmeteadust kui kunsti kui teadust”, midagi, millele tuleb tugineda mõlema aju poole tugevad küljed. “Paljud inimesed räägivad andmeteadusest kui karjäärist, mis kasutab peamiselt vasakut aju. Olen leidnud, et edu saavutamiseks peavad andmeteadlased kasutama kogu oma aju. ”

Ta selgitas, et valdkonnas edasiminek nõuab mitte ainult tehnilist kompetentsi, vaid ka loovust ja juhtimiseks vajalikku visiooni:

Enamikku vasaku aju / lineaarseid ülesandeid saab automatiseerida või allhanke korras hankida. Andmeteadlastena konkurentsieelise pakkumiseks peame suutma ära tunda mustreid ja sünteesima suures koguses teavet, kasutades mõlemat meie aju osa. Ja me peame olema uuenduslikud mõtlejad. Paljud parimatest tulemustest tulenevad vasaku ja parema aju integreerimisest.

Ta rõhutas ka, miks visiooni selge edastamine on hädavajalik:

Andmeteadlastena on meie eesmärk kasutada andmeid selleks, et aidata oma klientidel kasumit kasvatada. Enamik juhtivtöötajaid ei saa aru, mida me teeme või kuidas me seda teeme. Seega peame mõtlema nagu juhid ja edastama oma tähelepanekud ja soovitused keeles, mida meie sidusrühmad mõistavad ja usaldavad.

Andmekümn

Peamised näpunäited hõlmavad suuremat hulka tehnilisi tööriistu, oskusi ja võimalusi, aga ka vähem kvantitatiivselt mõõdetavaid omadusi, nagu loovuse ja juhtimisvõime. Lõppkokkuvõttes pole see lihtsalt numbrimäng. Kuna infoteadus ei tähenda ainult vaakumis mudelite loomist, vaid ka ettevõtete jaoks reaalse elu probleemide lahendamiseks vajalike praktiliste rakenduste väljatöötamist, peavad valdkonnas edu saavutavad inimesed mitte ainult valdama tehnoloogiat, vaid teadma oma ärivaldkonda ja mõistma ettevõtete vajadusi meeskonna erinevad liikmed tööl.