Töö roll: andmeteadlane

Autor: Roger Morrison
Loomise Kuupäev: 28 September 2021
Värskenduse Kuupäev: 11 Mai 2024
Anonim
Töö roll: andmeteadlane - Tehnoloogia
Töö roll: andmeteadlane - Tehnoloogia

Sisu


Allikas: Sergei Khakimullin / iStockphoto

Ära võtma:

Andmeteadlastel on laiaulatuslikke töökohti, mis erinevad rakenduste lõikes märkimisväärselt. Kuid üks asi, mis neil kõigil ühist on, on andmete kasutamise hea tahe.

Mida teeb andmeteadlane tehisintellekti ja masinõppega seotud töös? Paljud plussid, kes tegelevad selliste projektidega iga päev, ütlevad, et küsimusele on raske lihtsalt vastata. Parem küsimus oleks: mida andmeteadlased EI tee?

Andmeteadlane on AI või ML protsessi lahutamatu osa selles mõttes, et kõik need projektid sõltuvad suurandmetest või keerukatest sisenditest. Andmeteadlane on oluline karjäär, kes teab, kuidas tulemuste saamiseks andmetega töötada.

Siiski on mõned viisid, kuidas rääkida sellest, mida andmeteadlane teeb, millist kvalifikatsiooni ta vajab ja milline on tema roll protsessis.


Loe: 6 peamist andmeteaduse kontseptsiooni, mida saate veebipõhise õppe kaudu omandada

Erinevad määratlused, erinevad kohustused

Paljud eksperdid, kes kirjeldavad andmeteadlase tööd, räägivad sellest laias laastus.

„Väikestes ettevõtetes või uuel turul töötades on andmeteadlase roll konverteerida suhteliselt uudsed (kuid ilmselged) andmeallikad sellisteks andmeallikateks, mis lahendavad lõppkasutaja jaoks sellise probleemi, mis varem poleks olnud võimalik, kus kasutatavaid tehnoloogiaid ei eksisteerinud, ”ütleb Antonio Hicks, Mercury Global Partnersi kontojuht. "Ideaalne kandidaat on keegi, kes on osaliselt matemaatik, osaliselt tarkvarainsener ja osa ettevõtja."

Teised kajastavad seda põhiideed, mainides, milliseid andmeid vajavad teadlased modelleerimisprojektide lahendamiseks.

„Kõige olulisem omadus, mida andmeteadlane vajab, on sügav uudishimu ümbritseva maailma vastu - olgu nad siis vastates küsimustele või ehitades mudeleid, võtmeks on soov nende ees olevat probleemi mõista,“ ütleb andmeteadlaste juht Erin Akinci. Asanas. "Sealt edasi nõuab enamik inimesi lahenduste leidmiseks matemaatika- ja programmeerimisoskusi, kuid konkreetsed matemaatika- ja programmeerimisviisid varieeruvad sõltuvalt andmetöötluse valdkonnast."


Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata

Te ei saa oma programmeerimisoskusi parandada, kui keegi tarkvara kvaliteedist ei hooli.

"Suurepärane teadustöö on seotud pigem sellega, kuidas teadlane mingi probleemi peale mõtleb, kui vahenditega, mida nad selle lahendamiseks kasutavad," lisab Charlie Burgoyne, Valkyrie Intelligence'i asutaja ja tegevjuht. Valkyrie on rakendusteaduse konsultatsiooniettevõte, mille tiiva all on muljetavaldavad projektid, näiteks Mark I, spetsiaalne võrguseade, mis edendab närvivõrgu väljaõpet ja testimist, täiustades eelnevaid pilvepõhiseid masinõppeplatvorme.

"Turg nõuab teadlasi, kes valdavad Pythoni arendamist, närvivõrkude kujundamist ja võimet muuta andmehoidla uusimaks andmebaasi arhitektuuriks," ütleb Burgoyne. “Need võimalused on aga andeka teadlase jaoks olulised. Mis pole nii ilmne, on teadlase sobivus aruka uudishimu, agressiivse leidlikkuse ja teadusliku meetodi järgimisega. "

Andmeteadlase oskused

Praktiliste oskuste kogumi osas vajavad andmeteadlased modelleerimise osas pisut loovust ja asjatundlikkust. Neile on ka üsna palju kasu, kui neil on raskete oskuste, näiteks Python, C ++ või muude tavaliste keelte kogemuste kodeerimise kogemus ML-i projektides.

„Python ja C ++ on hädavajalikud ning kodeerimisoskuste ühendamine andmete analüüsi ja töötlemise ning statistikaga on põhioskused, mis muudavad andmeteadlase silma paistma tugeva kandidaadi või töötajana,“ ütleb Val Streif veebipõhises modelli intervjuude platvormis Pramp. tarkvarainseneridele, arendajatele ja andmeteadlastele. "Kuigi mõne programmeerimisoskuse eest saaks hoolitseda andmeteadlase ja arendaja sidumisega, on palju lihtsam, kui teil on mõlemad oskused ühendatud ettevõtte vaatevinklist."

Teised eksperdid lisavad loendisse R, Hadoop, Spark, Sas ja Java ning sellised tehnoloogiad nagu Tableau, Hive ja MATLAB.

Kõik need jätkavad muljetavaldavat jätkamist, kuid osa neist, kes on kogenud andmeteadlaste värbamisega, ütlevad ka, et tegemist on ka teiste inimlike külgedega. (Üks andmesidetüüpide tüüp on kodanike andmeteadlane. Lisateave jaotises Kodanike andmeteadlaste roll suurandmete maailmas.)

"Traditsiooniliselt teevad mitmekesise vabade kunstide haridusega inimesed suurepäraseid andmeteadlasi," ütleb Burgoyne, eristades hoonete poolel töötavaid insenere ja andmeteadlasi, kelle töö võib olla palju kontseptuaalsem. Ta jätkab:

Ekspertiisid traditsioonilises STEM-i valdkonnas, millele on lisaks keskendutud humanitaar-, kunsti- või ärivaldkonnas, annavad need omadused, mis muudavad suurepärase tööstusele orienteeritud teadlase. Peab ütlema, et sama oluline on organisatsiooni suutlikkus neid omadusi rakendada ning nende erksust ja meetodeid produktiivselt kujundada. Olen märganud, et kui andmetöötluse algatus ebaõnnestub, on organisatsioon tõenäoliselt sama süüdi kui teadlased. Teadlased pole insenerid. Neid ei ajata ellu ega ehitata. Neid ajendatakse avastama ja mõistma. Organisatsioonid, kes sellest erinevusest aru saavad, on mõlema põllu harimise eest hästi tasustatud.

Mis puutub andmetesse, mida teadlased tavaliselt rakendavad, on see seotud ettevõtte põhieesmärkidega. Mõned ettevõtted jälitavad detsentraliseeritud internetti - mõned mängivad ringi Interneti või SaaS-iga. Teised üritavad olla kasutajasõbralikud või eetilised või läbipaistvad AI-d.

Igal juhul on andmeteadlased tõenäoliselt ületamas lõhet nende kasutatavate andmete raskete mõõdikute vahel, olenemata sellest, millises tehnoloogilises virnas see parasjagu on, ja AI / ML funktsionaalsuse kontseptualiseerimise vabakäigu vahel.

“Palkame andmete kogumise ja puhastamise haldamiseks ning nende andmete tähenduslikuks infoks tõlkimiseks andmeteadlasi,” ütleb Michael Hupp, G2 Crowdi andmeteaduse ja analüüsi juht. Ta töötab välja:

Tavaliselt tähendab see ettevõtte andmemootorit juhtivate oluliste algoritmide haldamist ning sujuvust peamiste analüütiliste tööriistade ja keelte valdamisel, kuid viimastel aastatel on see hõlmanud ka uusi valdkondi, nagu loomulik keele töötlemine, masinõpe ja muud AI-põhise analüüsi vormid. Edukaimad andmeteadlased on need, kes ühendavad oma rasked oskused kiire õppimisvõimega ja võimega tõhusalt edastada avastatud teadmisi, et neil oleks oma ettevõttele tähendus.

Seda tüüpi teadmiste abil on noortel spetsialistidel või üliõpilastel lihtsam aru saada, kas andmeteadlane oleks neile hea roll ja kuidas oskusi omandada. STEM-õpe on kogu riigi koolides kättesaadavamaks muutumas, kuid see ei asenda kirge kodeerimise ja tehnoloogia vastu ning võimalust õppida lennult.