Süvaõppemudelite ringkäik

Sisu

Neuraalne stiil
Neuraalne jutuvestja
Andmed
Char-RNN TED
Järeldus

Allikas: Kran77 / Dreamstime.com

Ära võtma:

Süvaõppe mudelid õpetavad arvuteid iseseisvalt mõtlema, pakkudes väga lõbusaid ja huvitavaid tulemusi.

Süvaõpet rakendatakse üha enam valdkondades ja tööstusharudes. Alates juhita autodest kuni Go mängimise ja pildimuusika genereerimiseni ilmub iga päev uusi süvaõppe mudeleid. Siin käsitleme mitut populaarset süvaõppe mudelit. Teadlased ja arendajad võtavad neid mudeleid kasutusele ja muudavad neid uuel ja loomingulisel viisil. Loodame, et see esitlus inspireerib teid nägema, mis on võimalik. (Tehisintellekti edusammude kohta lisateabe saamiseks vaadake teemat Kas arvutid on võimelised jäljendama inimese aju?)

Neuraalne stiil

Te ei saa oma programmeerimisoskusi parandada, kui keegi tarkvara kvaliteedist ei hooli.

Neuraalne jutuvestja

Neuraalne jutuvestja on mudel, mis pildi saamisel võib selle pildi kohta luua romantilise loo. See on lõbus mänguasi ja ometi võite ette kujutada tulevikku ja näha suunda, kuhu kõik need tehisintellekti mudelid liiguvad.

Ülaltoodud funktsioon on "stiili muutmise" toiming, mis võimaldab mudelil romaani lugude stiilile üle viia standardsed pildi pealdised. Stiili muutmine oli inspireeritud teosest "Kunstilise stiili neuraalne algoritm".

Andmed

Selles mudelis on kaks peamist andmeallikat. MSCOCO on Microsofti andmekogu, mis sisaldab umbes 300 000 pilti, iga pilt sisaldab viit pealdist. MSCOCO on ainus kasutatav jälgitav teave, mis tähendab, et see on ainus teave, kuhu inimesed pidid sisse minema ja iga pildi pealkirjad selgesõnaliselt välja kirjutama.

Edastatava närvivõrgu üks peamisi piiranguid on see, et sellel pole mälu. Iga ennustus on varasematest arvutustest sõltumatu, justkui oleks see esimene ja ainus ennustus, mille võrk eales teinud on. Kuid paljude ülesannete jaoks, näiteks lause või lõigu tõlkimine, peaksid sisendid koosnema järjestikustest ja üksteisega seotud andmetest. Näiteks oleks keeruline lauses ühte sõna mõtestada, ilma et ümbritsevad sõnad seda pakuksid.

RNN-id on erinevad, kuna need lisavad neuronite vahele veel ühe ühenduste komplekti. Need lingid võimaldavad varjatud kihis olevate neuronite aktiveerimistel jada järgmises etapis tagasi pöörduda. Teisisõnu, varjatud kiht saab igal sammul aktiveerimise nii selle all asuvalt kihilt kui ka järjestuse eelmisest etapist. See struktuur annab sisuliselt korduvate närvivõrkude mälu. Objektide tuvastamise ülesande täitmiseks saab RNN tugineda oma varasematele koerte klassifikatsioonidele, et aidata kindlaks teha, kas praegune pilt on koer.

Char-RNN TED

See varjatud kihi paindlik struktuur võimaldab RNN-i kasutada tähemärgitasandi keelemudelite jaoks väga hästi. Algselt Andrej Karpathy loodud Char RNN on mudel, mis võtab sisendina ühe faili ja koolitab RNN-i õppima ennustama järgmist tähemärki jadas. RNN võib genereerida tähemärgi kaupa, mis näeb välja nagu treeningu algsed andmed. Demo on koolitatud, kasutades erinevate TED-kõnede ärakirju. Lisage mudelile üks või mitu märksõna ja see loob lõigu märksõna (de) kohta TED-kõne kõnes / stiilis.

Järeldus

Need mudelid näitavad uusi läbimurdeid masinate intelligentsuses, mis on saanud võimalikuks tänu sügavale õppimisele. Sügav õppimine näitab, et suudame lahendada probleeme, mida me ei suutnud kunagi varem lahendada, ja me pole selle platooni veel jõudnud. Põhjaliku õppeinnovatsiooni tulemusel võite järgmise paari aasta jooksul oodata palju põnevat, näiteks juhita autosid.