Tugevdusõpe võib anda turundusele kena dünaamilise pöörde

Sisu

Mis on tugevdusõpe?
Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata
Masinad turustajatele
Tulekul
Mõeldes suuremale
Vastuvõtmise tee

Allikas: Juliatimchenko / Dreamstime.com

Ära võtma:

Tugevdusõpe on tehisintellekti ja masinõppe alamhulk, mis võib tulemusi ette näha ja aidata kasutajatel paremaid otsuseid langetada.

Turundajad otsivad pidevalt skaleeritavaid ja arukaid lahendusi, kui nad üritavad üha konkurentsitihedamates turutingimustes eelist saada. Pole ime, et kaubamärgid ja nende turundusorganisatsioonid võtavad tehisintellekti (AI) ja masinõpet (ML) massiliselt kasutusele. (Lisateavet ML põhitõdede kohta leiate masinõppest 101.)

Tahtmatu jaoks võib AI-d üldiselt pidada tehnoloogiaks, kui arvuti automatiseerib määratletud ülesanded, mida inimene muidu teeks. Masinõpe kui AI funktsionaalne piirkond on see, kui arvutile antakse lõpp-eesmärk, kuid selleks tuleb eraldi arvutada parim marsruut.

Täna näeme neid tehnoloogiaid - eriti masinõpet - paljudes turunduse valdkondades, sealhulgas reklaamipettuste tuvastamine, tarbijakäitumise prognoosimine, soovitussüsteemid, loominguline isikupärastamine ja palju muud.

Ehkki see kõik on hästi ja hea, on olemas uus kõrvaltehnoloogia, mis turundajate jaoks vastab tõepoolest nõudlusele, mille masinõpe loob. Seda nimetatakse tugevdusõppeks (RL).

Mis on tugevdusõpe?

Samm-vahetus ML-ist RL-i on midagi enamat kui lihtsalt täht. Enamik masinõppele antud ülesandeid hõlmab ühe sammu kasutamist, näiteks „selle pildi ära tundmine”, „raamatu sisu mõistmine” või „pettuste püüdmine”. Turundaja jaoks on selline ärieesmärk nagu „kasutajate meelitamine, hoidmine ja kaasamine”. oma olemuselt mitmeastmeline ja pikaajaline, mida pole masinõppe abil kerge saavutada.

Siin tuleb õppima tugevdusõpe. RL-algoritmid on mõeldud optimeerimiseks lahtiseletavaks ja pidevalt muutuvaks teekonnaks - selliseks, kus tekivad dünaamilised probleemid. Kasutades matemaatilist “tasu funktsiooni” iga permutatsiooni tulemuse arvutamiseks, saab RL vaadata tulevikku ja teha õige kõne.

Täna saab selle tipptasemel tehnoloogia parimaid teostusi näha mängudes ja isesõitvates autodes. Kui Google'i AlphaGo süsteem edestas möödunud aastal maailma parimat lauamängu Go mängijat, oli nende salajane kastme tugevdamine. Kuigi mängud on reegleid seadnud, muutuvad mängija võimalused võidu saavutamiseks marsruudil dünaamiliselt vastavalt laua olekule. Tugevdusõppe abil võtab süsteem arvesse kõiki võimalikke permutatsioone, mis võivad iga järgmise käigu põhjal muutuda.

Samamoodi läheb isesõitv auto teekonnale, kus teereeglid ja sihtkoha asukoht jäävad fikseerituks, kuid muutujad teel - alates jalakäijatest kuni teekatteteni kuni jalgratturiteni - muutuvad dünaamiliselt. Seetõttu kasutab Tesla Elon Muski asutatud organisatsioon OpenAI oma sõidukite jaoks täiustatud RL-algoritme.

Pole vigu ega stressi - teie samm-sammuline juhend elumuutva tarkvara loomiseks ilma oma elu hävitamata

Te ei saa oma programmeerimisoskusi parandada, kui keegi tarkvara kvaliteedist ei hooli.

Masinad turustajatele

Mida see turundajate jaoks tähendab?

Paljude turundajate peamisi väljakutseid loob asjaolu, et ettevõtte olukord muutub pidevalt. Võitnud kampaania strateegia võib aja jooksul muutuda ebasoodsaks, samas kui vana strateegia võib saada uue veojõu. RL on samm tõelise inimintellekti jäljendamise suunas, kus õpime mitme tulemuse õnnestumisest ja / või ebaõnnestumisest ning moodustame tulevikku suunatud strateegia. Lubage mul tuua mõned näited:

1. Kasutajate kaasamise suurendamine

Keskendugem restoranide keti klientide kaasamisele ja eesmärgile korrutada see järgmise aasta jooksul kümnekordselt. Täna võib turunduskampaania hõlmata sünnipäevatervituse kaasamist sooduspakkumisega, mis võib-olla põhineb isegi toidueelistustel. See on lineaarne mõtlemine, kus turundaja on määratlenud algus- ja lõpp-punkti.

Kindel maailmas on klientide elu reaalajas pidevalt muutuv - mõnikord on nad rohkem hõivatud, mõnikord vähem. Täiendusõppes kalkuleeriks süsteem pidevalt ümber, milline turundusrelva taktika on igal hetkel parim võimalus suunata vastuvõtja 10-kordse kaasamise lõppeesmärgi poole.

2. Dünaamiline eelarvejaotus

Kujutage nüüd ette reklaamistsenaariumi, mille korral eelarve on miljoni dollari suurune ja peate kuu lõpuni iga päev kulutama, jagatuna neljale kanalile: televiisor, lojaalsuse edendamine ja Google. Kuidas saate tagada, et kulutate eelarvet kõige optimaalsemal viisil? Vastus sõltub päevast, sihtkasutajatest, varude hinnast ja paljudest muudest teguritest.

Tugevdamise õppimisel kasutaksid algoritmid reklaamide ajaloolise tulemuse andmeid, et kirjutada premeerimisfunktsioone, mis skoorivad teatud kulutamisotsuseid. Kuid see arvestab ka reaalajas tegutsevaid tegureid nagu hinnakujundus ja sihtrühma liikme positiivse vastuvõtu tõenäosus. Korduva õppe kaudu muutuks kogu kuu reklaamikulude jaotamine dünaamiliselt. Ehkki lõppeesmärk on seatud, eraldab RL eelarve kõigi stsenaariumide korral parimal võimalikul viisil. (Lisateavet AI kohta turunduse kohta leiate artiklist Kuidas tehisintellekt muudab müügitööstuse revolutsiooniks.)

Tulekul

Tugevdusõpe tunnistab keerukust ja tõdeb, et inimesed on heterogeensed ning arvestavad nende tõdedega, parandades aja jooksul iga järgmist toimingut, kui teie mängulaua tükid selle ümber muutuvad.

Tugevdusõpe on endiselt suures osas teadusprojektide ja tipptasemel rakendajate pärusmaa. Matemaatikakontseptsioon ja -tehnika on olemas olnud juba üle 40 aasta, kuid tänu kolmele suundumusele pole seda alles hiljuti olnud võimalik kasutusele võtta:

Arvutusvõimsuse levik suure võimsusega graafikatöötlusüksuste (GPU) kaudu.
Pilvandmetöötlus teeb tipptasemel protsessorivõimsuse kättesaadavaks vaid osaga GPU-de ostmise kuludest, võimaldades kolmandatel isikutel rentida GPU-d, et koolitada oma RL-mudelit mitu tundi, päevi või nädalaid suhteliselt soodsa hinnaga.
Parandamine numbriliste algoritmide või nutika heuristika osas. Mõni RL-algoritmi kriitiline numbriline samm suudab nüüd läheneda palju kiiremas tempos. Ilma nende maagiliste numbriliste trikkideta poleks need tänapäevaste võimsaimate arvutitega siiski teostatavad.

Mõeldes suuremale

Kõik see tähendab, et uued tugevdusõppe võimalused on brändidele ja turundajatele peagi saadaval. Selle vastuvõtmine nõuab aga mõtteviisi muutmist. Turundusjuhi jaoks tähendab see tehnoloogia võimalust võtta käsi rooli alt ära.

Igal ettevõttel on eesmärk, kuid kui olete sügaval kaevikus, võivad selle eesmärgi saavutamiseks tehtud igapäevased toimingud muutuda häguseks. Nüüd võimaldab RL-tehnoloogia otsustajatel eesmärk püstitada, olles kindlam, et süsteemid suunavad selle poole oma parima suuna.

Näiteks reklaamimisel näiteks mõistavad paljud inimesed tänapäeval, et sellised mõõdikud nagu klikkimise määr (CTR) on üksnes tõeste äritulemite puhverserverid, mida arvestatakse ainult seetõttu, et need on loendatavad. RL-i juhitavad turundussüsteemid rõhutavad selliseid vahendavaid mõõdikuid ja kogu nendega seotud rasket tõstmist, võimaldades ülemustel keskenduda eesmärkidele.

See nõuab, et ettevõtted mõtleksid oma suurtele probleemidele palju ennetavamalt ja pikaajaliselt. Kui tehnika on küps, saavutavad nad oma eesmärgi.

Vastuvõtmise tee

Tugevdusõpe pole brändide poolt veel täismahus kasutamiseks valmis; Siiski peaksid turundajad võtma selle uue kontseptsiooni mõistmiseks aega, mis võib muuta brändide turundusmeetodeid revolutsiooniliseks, täites mõned masinõppe varased lubadused.

Kui jõud saabub, saabub see turundus tarkvaraga, millel on kasutajaliides, kuid selle tarkvaraga nõutavaid ülesandeid lihtsustatakse radikaalselt. Töötajate jaoks on vähem liikuvaid lüliteid ja numbrite sisestamist, aga ka vähem analüütiliste aruannete lugemist ja nende alusel tegutsemist. Armatuurlaua taga tegeleb algoritm suurema osa sellest.

On ebatõenäoline, et RL suudab inimese intelligentsuse otse väravast välja viia. Selle väljatöötamise kiirus sõltub turundajate tagasisidest ja ettepanekutest. Peame tagama, et palume arvutil lahendada õige probleem ja karistada selle eest, kui see ei õnnestu. Kõlab nagu see, kuidas sa ise oma lapsele õpetad, kas pole?