Andmeteadus või masinõpe? Heres kuidas vahet märgata

Sisu

Andmeteadus ja masinõpe: lai ja kitsas terminoloogia
Andmeteaduse ja masinõppe oskuste komplektid
Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata
Kuidas juhtida masinõpet
Kaks tipptasemel eriala

Allikas: Elnur / Dreamstime.com

Ära võtma:

Andmeteadus ja masinõpe on võtmeliikides erinevad. Mõnes mõttes võib ühte vaadelda kui teise alamhulka. Mõlemad on olulised praeguses IT arengus.

Selles uues tehisintellekti ja andmehalduse maailmas on lihtne segadusse ajada mõne terminiga, mida IT-maailmas kõige sagedamini kasutatakse.

Näiteks on infoteadusel ja masinõppel üksteisega palju pistmist. Pole üllatav, et paljudel inimestel, kellel on nende erialade kohta ainult teadmised, oleks keeruline aru saada, kuidas need üksteisest erinevad.

Siin on parim viis eraldada infoteadus masinõppest põhimõtteliselt ja tehnoloogilise lähenemisena.

Andmeteadus ja masinõpe: lai ja kitsas terminoloogia

Esiteks on andmeteadus tõesti lai, kõikehõlmav tehnoloogiakategooria, mis hõlmab palju erinevaid projekte ja loomingut. (Lisateavet andmeteadustööga seotud asjade kohta leiate teemast Role: Data Scientist.)

Andmeteadus on sisuliselt suurandmetega töötamise tava. See kujunes välja nagu Moore'i seadus ja tõhusamate salvestusseadmete levik viis ettevõtete ja muude osapoolte kogutud tohutul hulgal andmeid. Seejärel hakkasid suured andmeplatvormid ja sellised tööriistad nagu Hadoop andmetöötlust uuesti määratlema, muutes andmehalduse toimimist. Nüüd on pilve- ja konteinerikontrolli ning ka täiesti uute mudelite abil suurandmetest saanud peamine tegur töö- ja elamisviisides.

Andmeteadus on kõige lihtsamal kujul viis, kuidas me neid andmeid haldame, alates nende puhastamisest ja täpsustamisest kuni kasutamiseni teadmiste kujul.

Masinõppe määratlus on palju kitsam. Masinõppes võtavad tehnoloogiad andmeid ja panevad need läbi algoritmide, et simuleerida inimese kognitiivseid protsesse, mida kirjeldatakse kui „õppimist“. Teisisõnu, olles arvutist andmed omandanud ja selle välja koolitanud, suudab arvuti pakkuda oma tulemusi , kus tehnoloogia näib olevat programmeerijate poolt kasutusele võetud protsessidest õppinud.

Andmeteaduse ja masinõppe oskuste komplektid

Teine viis andmeteaduse ja masinõppe vastandamiseks on vaadata erinevaid oskusi, mis on kummagi valdkonna spetsialistide jaoks kõige väärtuslikumad.

Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata

Te ei saa oma programmeerimisoskusi parandada, kui keegi tarkvara kvaliteedist ei hooli.

Üldiselt ollakse üksmeelel selles, et andmeteadlastest saavad kasu sügavad analüüsi- ja matemaatikaoskused, andmebaasitehnoloogiaga seotud praktilised kogemused ning programmeerimiskeelte tundmine, näiteks Python või muud suurandmete parsimiseks kasutatavad paketid.

„Kõik, kes on huvitatud tugeva (karjääriandme) karjäärist, peaksid omandama võtmeoskused kolmes osakonnas: analüütika, programmeerimine ja domeeniteadmised,“ kirjutab Srihari Sasikumar Simplilearnis. „Ühel tasandil sügavamale minnes aitavad järgmised teadmistega nišše teadlasena välja kujundada: Tugevad teadmised Python, SAS, R (ja) Scala kohta, praktiline kogemus SQL andmebaasi kodeerimisel, võime töötada struktureerimata andmetega mitmesugused allikad, näiteks video ja sotsiaalmeedia, mõistavad mitut analüütilist funktsiooni (ja) teadmisi masinõppe kohta. ”

Masinõppe poolel nimetavad eksperdid masinõppeinseneri tööriistakomplekti abistavateks vahenditeks sageli andmete modelleerimise oskusi, tõenäosuse ja statistikaga seotud teadmisi ning laiemaid programmeerimisoskusi.

Kuidas juhtida masinõpet

Peamine on see, et igasugused asjad hõlmavad infotehnoloogia tööd, kuid see ei tähenda masinõpet, kui teil pole seadistatud väga ranget režiimi, mis aitab arvutil selle sisenditest õppida.

Kui see on paigas, loob see mõne üllatavalt võimeka süsteemi, millel võib olla meie elule laiaulatuslik mõju.

"Suur osa sellest, mida me masinõppega teeme, toimub pinna all," on väidetavalt öelnud Amazoni asutaja Jeff Bezos, tuues välja seda tüüpi süsteemide mõned rakendused. „Masinõpe juhib meie nõudluse prognoosimise, tooteotsingu paremusjärjestuse, toote- ja pakkumissoovituste, reklaamipaigutuste, pettuste tuvastamise, tõlkimise ja palju muu algoritme. Kuigi masinõppe mõjud on vähem nähtavad, on see just seda tüüpi - parandades põhitegevusi vaikselt, kuid sisukalt. ”

Üks kasulikumaid näiteid siin on närvivõrgu teke - see on tavaline ja populaarne meetod masinõppe protsesside seadistamiseks.

Kõige põhilisemas vormis koosneb närvivõrk tehisneuronite kihtidest. Igal üksikul tehisneuronil on funktsionaalsus, mis on samaväärne bioloogilise neuroniga, kuid sünapside ja dendriitide asemel on sellel sisendid, aktiveerimisfunktsioon ja võimalikud väljundid.

Neuraalvõrk on loodud käituma nagu inimese aju ja masinõppe spetsialistid kasutavad seda mudelit sageli masinõppe tulemuste loomiseks.

Kuid see pole ainus viis masinõppe läbiviimiseks. Mõned algelisemad masinõppeprojektid hõlmavad arvutis laia valiku fotode kuvamist (või muude lähteandmetega varustamist), ideede sisestamist juhendatud masinõppe ja andmete sildistamise protsessi kaudu ning arvuti võimaldamist lõpuks eristada mitmesugused kujundid või esemed vaateväljas. (Masinõppe põhitõed leiate masinõppest 101.)

Kaks tipptasemel eriala

Kokkuvõtteks võib öelda, et masinõpe on infoteaduse väärtuslik osa. Kuid andmeteadus esindab vastumeelset piiri ja konsooli, kus masinõpe toimub.

Mõnes mõttes võiks öelda, et masinõpe ei juhtu kunagi ilma suurte andmeteta. Suured andmed iseenesest ei loonud masinõppimist - selle asemel, et olime kokku kogunud nii palju andmeid, et me peaaegu ei teadnudki, mida sellega teha, tulid tippmeelele need bioimiteerivad protsessid laetud viisil teadmiste pakkumine.

Veel üks hea asi, mida siinkohal meeles pidada, on see, et andmeteadust saab rakendada kahel peamisel viisil - me võime omaks võtta masinõppe ja tehisintellekti, lastes arvutitel meie eest mõelda, või võime viia andmeteaduse tagasi inimkesksema lähenemisviisi juurde, kus arvuti lihtsalt esitab tulemusi ja meie, inimesed, teeme otsuseid.

See viib mõned eksperdid, sealhulgas mõned tänapäeva parimaid uuendajaid, nõudma, et nende tehnoloogiate kasutamise viise käsitletaks põhjalikumalt.

"(AI) on võimeline tohutult rohkemaks, kui peaaegu keegi teab, ja paranemise kiirus on hüppeline," on Elon Musk öelnud, öeldes samas, et masinõpe ja AI-programmid vajavad järelevalvet.

Igal juhul on nii infoteadus kui ka masinõpe edusammude põhiosad, mida me ühiskonnana täna tehnoloogia valdkonnas teeme.