Mis vahe on kõnel tekstil ja vestlusprogrammidel?

Autor: Roger Morrison
Loomise Kuupäev: 26 September 2021
Värskenduse Kuupäev: 9 Mai 2024
Anonim
Mis vahe on kõnel tekstil ja vestlusprogrammidel? - Tehnoloogia
Mis vahe on kõnel tekstil ja vestlusprogrammidel? - Tehnoloogia

Sisu

K:

Mis vahe on kõnel ja vestlusbotil?


A:

Kõnetehnoloogiate ja vestlusprogrammide arvukad olulised erinevused on osa sellest, mida uuritakse vestlus- ja kõneobotite projektide kiire arengu käigus.

Kõne tehnoloogiaks on lihtsalt see, mis teisendab suulise kõne digitaallehel. See on selle täielik funktsioon, kuid seda ei ole lihtne kujundada. Sõnalise kõne teisendamiseks peab tehnoloogia jagama sõnad ja laused üksikuteks foneemideks ning töötama nendega keerukate algoritmide järgi, et luua täpne ja esindada seda, mida kõneleja ütles.

Vestlusbotid on seevastu tehnoloogiad, mis täidavad eesmärki suhelda inimesega. Vestlusbotte on kahte tüüpi: vestlusbotid ja häälebotid. Vestlusbotid on olnud palju kauem, kuna nad ei vaja kõneelementi, mida häälbotid kasutavad.

Peamine erinevus kõnetehnoloogiate ja vestlusprogrammide vahel on ulatus. Nagu mainitud, peab kõnetehnoloogiaks olema ainult sõnalise kõne transkribeerimine. Vestlusbot seevastu peab kõne pidama ükskõik millises vormis, nagu see on ette nähtud, mõistma seda ja pakkuma vastuseid, mis püüavad läbida Turingi testi - testi, kas tehnoloogia võib panna inimese mõtlema, et ta on teise inimesega rääkimine.


Seda silmas pidades on vestlusprogramme palju lihtsam luua kui häälkõnesid. Vestlusbot võtab inimestes käiku ja annab vastuse. Isegi suhteliselt lihtsad vestlusprogrammid on alates 1980. aastate lõpust ja 1990. aastate algusest suutnud inimestele pakkuda huvitavaid ja nauditavaid tulemusi.

Teisalt peab häälepael võtma suulise kõne, teisendama selle, kontrollima selle täpsust, andma vastuse ja looma selle vastuse masinkeelest kuuldavaks kõneks. See suur arv üsna olulisi ülesandeid tähendab, et häälboti ehitamiseks kulub palju arvutusvõimsust ja palju disaini.

Sellised projektid nagu Siri, Cortana ja Alexa demonstreerivad häälbottide tehnoloogia esirinnas. Samuti illustreerivad nad seda, et see tehnoloogia on alles lapsekingades. Ehkki Alexa ja muud tehnoloogiad suudavad inimkõnele verbaalselt reageerida, pole need siiski eriti võimekad selles mõttes, et seostame neid verbaalse inimkõnega üldiselt. Teisisõnu, nende tehnoloogiate pakutavad vastused on üsna piiratud. Isegi tänapäeva isiklike abistajate põlvkonna piiratud võimalus genereerida kõnesid näiteks essee ümberkirjutamiseks või essee kirjutamiseks abistamiseks ilma oma käsi kasutamata. Mõned turul olevad konkreetsed kõneprogrammid teevad seda paremini kui Siri või Cortana, tõenäoliselt ressursside eraldamise tõttu. On aga märke, et häälboti edasiliikumine on varsti stardis - näiteks Amazons Lexi platvorm, mis võimaldab stuudiokeskkonda seda tüüpi tehnoloogiate loomiseks.


Tobias Goebel räägib nutikast ja õpetlikust selleteemalisest esseest nende tehnoloogiate erinevusest, vastandades protsessi, mida „transkribeerib”, millise kõne teha, mõistmise tööga, mida vestlusprogrammid peaksid tegema.

"Ehkki kõnetuvastuse vajaduse välistamine teeb vestlusprogrammi jaoks asjad lihtsamaks, on funktsionaalsete robotite loomise peamine väljakutse loomuliku keele mõistmine," kirjutab Goebel.

Goebel tuvastab ka paljud praegused tööstuses osalejad:

Kõnetuvastuse turuliider on Nuance, kes on tuntud süsteemide taga, näiteks Dragon NaturallySpeaking personaalarvutis dikteerimiseks, mis on olnud juba üheksakümnendatest, aga ka Siri: Apple'i pilves teostatud kõnetuvastuse / transkriptsiooni ülesanne kasutab Nuance tehnoloogia kulisside taga. Teised on LumenVox, Verbio või Interactions, kuid kõnetuvastust pakuvad nüüd API-de kaudu pilveteenusena ka näiteks Amazon, Google, Microsoft ja IBM.

Vestlusbottide arenedes eeldatakse, et nende mõistmine kasvab mõnel trajektooril jätkuvalt - ja suuresti eeldatakse ka seda, et rohkem robotitehnoloogiat läheb liidestest verbaalsetesse liidestesse, nõudes täiendavat arvutusvõimsust.