Need valupunktid takistavad ettevõtteid sügavuti õppimast

Sisu

Süvaõppe ärirakendused
Suurandmete ja sügava õppimise V-d
Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata
Musta kasti dilemma
Määrus

Allikas: Agsandrew / Dreamstime.com

Ära võtma:

Süvaõppel on ettevõtetele palju pakkuda, kuid paljud kõhklevad selle rakendamist endiselt. Siin vaatleme selle mõnda suurimat valupunkti.

Sügav õppimine on masinõppe alamväli, mis (üldiselt) on tehnoloogia, mis on inspireeritud inimese ajust ja selle funktsioonidest. Esmakordselt kasutusele võetud 1950ndatel, masinõppest saab kumulatiivselt teada nn kunstlik närvivõrk, mis on omavahel ühendatud arvukalt omavahel ühendatud andmesõlmi, mis koos moodustavad tehisintellekti aluse. (Masinõppe põhitõed leiate masinõppest 101.)

Masinõpe võimaldab sisuliselt arvutiprogrammidel end väliste andmete või programmeerimise paludes muuta. Oma olemuselt on see võimeline selle saavutama ilma inimeste sekkumiseta. See jagab sarnast funktsionaalsust andmete kaevandamisega, kuid kaevandatud tulemusi töötlevad masinad, mitte inimesed. See on jagatud kahte suurde kategooriasse: juhendatud ja juhendamata õpe.

Juhendatud masinõpe hõlmab ettemääratud toimingute tuletamist märgistatud koolitusandmete kaudu. Teisisõnu, (inimese) programmeerija teab kontrollitud tulemusi ette, kuid tulemusi tuletav süsteem on koolitatud nende “õppimiseks”. Kontrollimata masinõpe seevastu teeb järeldused sildistamata sisendandmetest, sageli selleks, et tuvastada tundmatuid mustreid.

Sügav õppimine on ainulaadne selle poolest, et suudab ennast treenida hierarhiliste algoritmide kaudu, erinevalt masinõppe lineaarsetest algoritmidest. Süvaõppehierarhiad muutuvad arenedes (või „õppides“) järjest keerukamaks ja abstraktsemaks ning ei sõltu juhendatud loogikast. Lihtsamalt öeldes on sügav õpe masinõppe kõrgelt arenenud, täpne ja automatiseeritud vorm ning on tehisintellekti tehnoloogia esirinnas.

Süvaõppe ärirakendused

Masinõpet kasutatakse juba sageli erinevates tööstusharudes. Näiteks sotsiaalmeedia kasutab seda sisuvoogude kureerimiseks kasutaja ajakavades. Google Brain asutati mitu aastat tagasi eesmärgiga pakkuda tehnoloogia arenedes süvaõpet Google'i teenustes.

Ennustavale analüütikale keskendumisega investeeritakse turunduse valdkonnas eriti süvaõppega seotud innovatsiooni. Ja kuna andmete kogumine on see, mis tehnoloogiat juhib, on sellistel tööstusharudel nagu müük ja klienditugi (kellel juba on palju rikkalikku ja mitmekesist kliendiandmeid) ainulaadsed positsioonid selle vastuvõtmiseks maapinnal.

Varase kohanemine sügava õppega võib väga hästi olla peamiseks määravaks teguriks, kui palju konkreetsed sektorid tehnoloogiast kasu saavad, eriti selle kõige varasemas faasis. Sellegipoolest takistavad mõned konkreetsed valupunktid paljusid ettevõtteid põhjalikumalt õppimistehnoloogiasse tehtavate investeeringute tegemisel.

Suurandmete ja sügava õppimise V-d

2001. aastal tõi META Groupi (nüüd Gartner) analüütik nimega Doug Laney välja, mida teadlased pidasid suurandmete kolme peamiseks väljakutseks: maht, mitmekesisus ja kiirus. Üle pooleteise aastakümne hiljem on Interneti-pöörduspunktide kiire kasv (peamiselt mobiilseadmete leviku ja Interneti-tehnoloogia leviku tõttu) viinud need küsimused esiplaanile nii suurtele tehnoloogiaettevõtetele kui ka väiksematele ettevõtetele ja idufirmad. (Lisateabe saamiseks kolme v-i kohta lugege jaotist Tänapäeval pakutavad suurandmete väljakutsed varieeruvad mitmekesisusest, mitte helitugevusest või kiirusest.)

Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata

Programmeerimisoskust ei saa parandada, kui keegi tarkvara kvaliteedist ei hooli.

Värske statistika globaalse andmekasutuse kohta on jahmatav. Uuringud näitavad, et umbes 90 protsenti kogu maailma andmetest loodi alles viimase paari aasta jooksul. Kogu maailmas oli ühe hinnangu kohaselt kogu maailmas 2016. aastal kogu maailmas mobiiltelefoni liiklus umbes seitse eksiili ja see arv kasvab järgmise poole kümnendi jooksul umbes seitse korda.

Lisaks mahule on mitmekesisus (andmetüüpide kiiresti kasvav mitmekesisus uute meediumite arenedes ja laienedes) ja kiirus (kiirus, millega elektroonilisi meediume saadetakse andmekeskustesse ja jaoturitesse) ka peamised tegurid, kuidas ettevõtted kohanevad kasvava väljaga sügav õppimine. Ja mnemoonilise seadme laiendamiseks on viimaste aastate suurte andmete valupunktide loendisse lisatud mitu muud v-sõna, sealhulgas:

Kehtivus: sisendandmete täpsuse mõõtmine suurtes andmesüsteemides. Tuvastamata valed andmed võivad põhjustada masinõppekeskkondades nii probleeme kui ka ahelreaktsioone.
Haavatavus: Suured andmed kutsuvad loomulikult esile turvalisuse probleemid, lihtsalt nende ulatuse tõttu. Ja kuigi masinõppega võimaldatud turvasüsteemides on palju potentsiaali, on nende süsteemide praeguses kehastuses täheldatud nende vähest tõhusust, eriti nende kalduvuse tõttu tekitada valehäireid.
Väärtus: suurandmete potentsiaalse väärtuse tõestamine (ettevõttes või mujal) võib olla märkimisväärne väljakutse mitmel põhjusel. Kui mõnda muud selles nimekirjas sisalduvat valupunkti ei ole võimalik tõhusalt lahendada, võivad need tegelikult lisada mis tahes süsteemile või organisatsioonile negatiivset väärtust, isegi katastroofilise mõjuga.

Muud loendisse lisatud alliteratiivsed valupunktid hõlmavad varieeruvust, tõepärasust, volatiilsust ja visuaalsust - kõik esitavad suurtele andmesüsteemidele oma ainulaadsed väljakutsed. Ja veel võib lisada, kui olemasolev nimekiri (tõenäoliselt) aja jooksul kaob. Ehkki see võib mõnele tunduda pisut ahvatlev, hõlmab mnemooniline „v” nimekiri tõsiseid probleeme, millega seisavad silmitsi suurandmed ja millel on oluline roll süvaõppe tulevikus.

Musta kasti dilemma

Süvaõppe ja tehisintellekti üks atraktiivsemaid omadusi on see, et mõlemad on mõeldud selliste probleemide lahendamiseks, mida inimesed ei saa. Samad nähtused, mis väidetavalt seda võimaldavad, esitavad siiski ka huvitava dilemma, mis on nn musta kasti kujul.

Närvivõrk, mis on loodud sügava õppimise käigus, on nii ulatuslik ja nii keeruline, et selle keerukad funktsioonid on inimese vaatlemisel põhimõtteliselt ületamatud. Andmeteadlastel ja inseneridel võib olla põhjalik arusaam sellest, mis toimub süvaõppe süsteemides, kuid see, kuidas nad sagedamini oma väljundotsuste juurde jõuavad, jääb täiesti seletamatuks.

Ehkki see ei pruugi näiteks turundajate või müüjate jaoks oluline probleem olla (sõltuvalt sellest, mida nad turundavad või müüvad), vajavad teised tööstusharud teatud määral protsesside valideerimist ja põhjendamist, et tulemustest kasu saada. Näiteks võib finantsteenuseid pakkuv ettevõte kasutada põhjalikku õppimist, et luua ülitõhus krediidiskoorimise mehhanism. Kuid krediidiskoorid peavad sageli sisaldama mingisuguseid suulisi või kirjalikke selgitusi, mida oleks keeruline moodustada, kui tegelik krediidiskoori võrrand on täiesti läbipaistmatu ja seletamatu.

See probleem laieneb ka paljudele teistele sektoritele, eriti tervishoiu ja ohutuse valdkonnas. Meditsiin ja transport võivad mõlemal juhul sügavast õppimisest olulisel määral kasu saada, kuid neil on ka musta kasti näol oluline takistus. Mis tahes väljundtulemused nendes väljades, ükskõik kui kasulikud, võib nende algoritmide täieliku segasuse tõttu täielikult ära jätta. See viib meid kõigi nende kõige vaieldavaimasse valupunkti ...

Määrus

2016. aasta kevadel võttis Euroopa Liit vastu isikuandmete kaitse üldmääruse (GDPR), mis muu hulgas annab kodanikele “õiguse saada selgitust” masinõppe süsteemide genereeritud automatiseeritud otsuste jaoks, mis neid “oluliselt mõjutavad”. Regulatsioon, mis peaks jõustuma 2018. aastal, tekitab muret tehnoloogiaettevõtetes, kes investeerivad sügavasse õppesse selle läbitungimatu musta kasti tõttu, mis paljudel juhtudel takistaks GDPR-i volitatud selgitust.

„Automatiseeritud individuaalne otsustusprotsess”, mida GDPR kavatseb piirata, on sügava õppimise oluline tunnusjoon. Kuid mure selle tehnoloogia pärast on vältimatu (ja suures osas kehtiv), kui diskrimineerimise potentsiaal on nii suur ja läbipaistvus nii madal. Ameerika Ühendriikides reguleerib toidu- ja ravimiamet sarnaselt ravimite testimist ja turustamist, nõudes, et need protsessid jääksid auditeeritavaks. See on esitanud takistusi farmaatsiatööstusele, nagu väidetavalt on juhtunud Massachusettsis asuva biotehnoloogiaettevõtte Biogen puhul, millel on FDA reegli tõttu keelatud kasutada seletamatuid süvaõppe meetodeid.

Süvaõppe (moraalse, praktilise ja muu) mõju on enneolematu ja ausalt öeldes üsna sügav. Tehnoloogia ümbritseb suurt kartust, mis on suuresti tingitud selle häirivast potentsiaalist ning läbipaistmatust loogikast ja funktsionaalsusest.Kui ettevõtted suudavad sügava õppimise käigus tõestada käegakatsutava väärtuse olemasolu, mis ületab kõik mõeldavad ohud või ohud, siis võiksid need aidata meid juhtida tehisintellekti järgmisse kriitilisse faasi.