Edasine hoog: Suhte ülekandmine traditsioonilisest kaugemale

Ära võtma: Host Eric Kavanaugh arutab andmebaasitehnoloogia uuendusi ekspertide Dez Blanchfieldi, Robin Bloori ja Bert Scalzoga.

Te pole praegu sisse logitud. Video nägemiseks logige sisse või registreeruge.

Eric Kavanagh: Daamid ja härrad, on käes kolmapäev, kell neli Ida-aega. Olen New Orleansis, suvi on käes, see tähendab, et on kuum! On aeg Hot Technologiesi jaoks, jah, tõesti, jah. Minu nimi on Eric Kavanagh, ma olen teie peremees. Ma löön siin palli tagasi Hot Technologiesi jaoks. Täna on teemaks “Edasine hoog: liikudes suhtest kaugemale traditsioonilisest”. Inimestel on meil täna telefonis kolm andmebaasieksperti, nii et teil on küsimusi, mis teil on - rasked - ärge kartke. Täna on teile hunnik head sisu rivistatud. Teie kohta on tõesti kohta, minu kohta piisavalt. Muidugi on see aasta kuum. Räägime selles saates kõike kuumast tehnoloogiast, mis on partneriks meie Techopedia sõpradele. Ja me läheme tänapäeval kogu teabehalduse alustalale, mis muidugi on andmebaas. Me räägime sellest, kuidas me siia jõudsime, mis täna toimub ja mis edasi saab. Toimub palju väga huvitavat kraami.

Ilmselt on meil andmebaasiruumis tõsine uuendus. Mõnda aega oli selline vaikne; Kui räägite mõne ärianalüütikuga, siis ma ütleksin, et tõenäoliselt aastast 2005, 2009 või '10, siis ei tundunud, et innovatsiooni osas oleks liiga palju tehtud.Ja äkki puhkes see lihtsalt nagu jaanilõke või midagi muud, ja nüüd juhtub seal igasuguseid huvitavaid asju. Palju on selle põhjuseks veebi ulatus ja kõik lahedad veebiatribuudid, mis teevad erinevaid huvitavaid asju. Siit tuli NoSQL-i kontseptsioon. Ja see tähendab kahte erinevat asja: see tähendab SQL-i puudumist, kuna see ei toeta SQL-i, see tähendab ka mitte ainult SQL-i. Mõni inimene on kasutanud terminit NewSQL. Kuid ilmselgelt on SQL - struktureeritud päringute keel - tõesti alus, see on päringute alus.

Ja huvitav on see, et kõik need NoSQL mootorid juhtusid? Noh, nad tulid välja, seal oli palju põnevust ja siis mõni aasta hiljem, mida me kõik kuulma hakkasime? Oh, SQL Hadoopis. Noh, kõik need ettevõtted hakkasid SQL-liideseid oma NoSQL-i tööriistadele kallale ja igaüks, kes on programmeerimismaailmas, teab, et see põhjustab teatud väljakutseid ja raskusi, mõnede juhtmete ristumist ja nii edasi. Nii et me uurime täna paljudest asjadest teada.

Seal on meie kolm saatejuhti: Dez Blanchfield helistab Sydneyst, meie enda Robin Bloor, kes on Texases, ja nagu ka Bert Scalzo, ta on ka Texases. Nii et kõigepealt kuuleme Dez Blanchfieldilt. Inimesed, piiksume #HotTech hashtagi juures, nii et julgustage oma kommentaare või küsimusi veebiülekandekonsooli küsimuste ja vastuste kaudu või isegi vestlusakna kaudu. Ja koos sellega, Dez Blanchfield, viige see ära.

Dez Blanchfield: Aitäh, Eric. Tere kõigile. Nii et ma proovin seada stseeni 30 000-jalasest vaatepunktist sellele, mis juhtus viimase kümnendi jooksul ja olulistest nihetest, mida oleme näinud - või vähemalt niikuinii poolteist kümmet aastat - andmebaaside haldussüsteemid ja mõned mõjud nii ärilisest kui ka tehnilisest aspektist ning mõned suundumused, mille üle oleme hilja talunud, ja viivad meid vestlusele, mis meil täna selle teema ümber on.

Minu kaanepilt siin on liivaluide ja selle tipust puhub tuul pisikesi pisikesi liiva tükke. Ja selle tulemusel juhtub see, et liivaluide kõnnib aeglaselt ühest ruumist teise. Ja see on hämmastav nähtus, kus need massiivsed 40 ja 50 jala kõrgused liivamäed tegelikult liiguvad. Ja nad liiguvad väga aeglaselt, kuid liiguvad kindlalt ja liikudes muudavad nad maastikku. Ja see on üsna midagi vaadata, kui veedate üldse aega piirkonnas, kus liivaluited on loomulik asi. Kuna võite ühel päeval aknast välja vaadata ja mõista, et see tohutu liivamägi, väikesed pisikesed terad on iseenesest liikunud ja tuul viib selle aeglaselt ühest kohast teise.

Ja ma arvan, et paljuski on see olnud andmebaasisüsteemide maailm juba pikka aega. Kuni väga, väga hiljuti toimus see väga väike liivaterade nihkumine, mis liigutas hiiglaslikku liivamäge liivaluidena. Aastate jooksul on andmebaasiplatvormidesse jõudnud vähe nihkeid ja see on olnud keskmise staažiga ajastu suurarvuti kaudu üsna stabiilne ja kindel keskkond andmebaasisüsteemide ja -platvormide ümber. Kuid hilja on juhtunud, et meie ärivajaduste ja tehniliste draiveritega on juhtunud üsna olulisi asju. Ma lähen neist läbi.

Olen seisukohal, et andmebaasi põhikontseptsioon, nagu me seda juba mitu-mitu aastat teadsime ja nagu võisite juba show-eelses vestluses kuulda, oli meie kahel eksperdil, kes täna minuga kõnelevad, terve elu Kui see kõik algas 80ndate alguses, on neil ruumi ja neil on täiesti õigus jagada seal olemise julgustamisõigusi. Kuid me oleme seda massilist nihet viimasel kümnendil natuke näinud ja kavatsen meid kiiresti läbi käia, enne kui selle dr Robin Bloorile üle anda.

Oleme läbi elanud selle, mida ma nimetan “suuremaks, paremaks, kiiremaks, odavamaks” kogemuseks. Nagu ma ütlesin, on andmebaasi määratlus muutunud. Maastik, kus andmebaasiplatvormid on pidanud jõudlust käsitlema, on muutunud ka tehnilised ja kaubanduslikud nõuded. Oleme näinud nõudluse kasvu lahenduste järele, et tulla toime keerukamate kaubanduslike või keerukamate tehniliste nõuetega. Nii et tõesti kiire ülevaade selle kohta, mida see minu meelest tegelikult tähendab, on see, et me pidime omamoodi 90ndatesse jõudma ja nägime, kuidas Interneti kasutuselevõtt on mõjutanud andmebaasitehnoloogiat, ja omamoodi seda, mida me toona Internetiks kutsusime skaala. Me ei rääkinud ainult terminalide ees istuvatest inimestest, algselt meeldis neile näiteks sisseehitatud füüsiliste terminitega teletiitterminalide ja paberil väljatulevate 132 veeru kohta. Siis varajase rohelise ekraani terminalid, klaviatuuridega mulgustamiseks.

Kuid teate, meie maailm oli terminalid ja jadakaablid või võrgukaablid, mis rääkisid pikka aega arvutitega. Siis tuli ka Internet ja see ühenduvuse plahvatuslik kasv, et te ei pidanud enam arvutit ühendama. Andmebaasisüsteemi pääsemiseks vajasite lihtsalt veebibrauserit. Nii et andmebaasitehnoloogia pidi dramaatiliselt muutuma, tegelema kõige ulatusega alates põhilistest otsingumootorite tehnoloogiatest, mida kasutati maailma indekseerimiseks, ja säilitama teabe indeksit andmebaasi vorminguskaala näites. Ja sellised inimesed nagu Google ja teised pakkusid selleks platvormi. Ja toodeti kõik uut tüüpi andmebaaside hoidlad ning päringud ja indekseerimine. Ja siis olid meil muusikasaidid ja ka filmisaidid.

Ja siis 2000. aastatel nägime dot-com buumi ja see põhjustas veelgi dramaatilisema plahvatuse inimeste seas, kes kasutasid süsteeme, mida mingil kujul andmebaas alati juhib. Selles etapis said relatsiooniandmebaasid ikkagi suurema osa koormusest hakkama, me panime need lihtsalt suuremale plekile ja läksime omamoodi väga-väga suurtesse keskklassi süsteemidesse, kus käitatakse Unixi platvorme inimestelt nagu IBM ja Sun jne. . Punktkomm-buum muutis asjad riistvara, jõudluse seisukohast lihtsalt suuremaks ja kiiremaks ning andmebaasimootorites toimusid mõned olulised muudatused, kuid paremaks pooleks oli see ikkagi sama, mida me omamoodi nägime. pikka aega.

Ja siis saime selle veebi 2.0 ajastu, nagu me sellele viitame. Ja see oli koletu nihe, sest äkki vajasime palju lihtsamaid andmebaasiplatvorme ja horisontaalsel kujul pidi olema skaala. Ja see oli niivõrd oluline nihe selles, et lähenesime ideele, mis andmebaas on. Me jõuame minu arvates ikka väga kaugele. Ja nüüd on meil tegemist kogu selle mölluga ja ma ütlen, et positiivse spinni, mitte negatiivse varjundiga, selle tülpimusega, mida me nimetame suurandmeteks, ja tohutuks plahvatuseks, pean silmas plahvatust. See ennekuulmatu nihe vertikaalselt graafikul, mis näitab meie andmebaasi ja mõne vormingu päringuvõimaluse valikuvõimaluste arvu.

Ja huvitaval kombel olen ma isiklikult seisukohal, et suured andmed on tõesti vaid jäämäe tipp. Me kipume pisut põnevil olema sellest, milline on suurandmete mõju ja milliseid valikuid meil praegu on. NoSQL-i mootoritest on meil kõike, graafikumootorid, meil on olemas kõik need erinevat tüüpi platvormid, kuhu saame andmeid koguda ja sellega asju ajada. Isegi niikaugele, et tegelikult oli üks esimestest vestlustest Eric Kavanaghiga, kes täna siin meie juures on, umbes vestlus, mis puudutas asja nimega Apache Drill, mis on avatud lähtekoodiga projekt, mis võimaldab teil teha päringuid andmed mudelis erinevad andmetüübid: kõike alates kõvakettal asuvatest toores CSE-failidest kuni HDFS-failisüsteemideni petabaiti skaalal. Ja teate, see võimaldab teil teha neid SQL-i stiilis päringuid igasuguste põnevate taimede struktureeritud ja struktureerimata andmete kohta.

Peame nägema, et „nutikast hoonest“ saab asi ja me tahaksime arvata, et meil on nutikad turvalisuse ja soojuse juhtimisega hooned, kuid ma räägin nutikatest hoonetest, mis teavad palju rohkem sellest, kes te olete ja kus te viibite, kui kõnnite ja teete sellel tasemel igasuguseid korrektseid asju, läbi nutikate linnade - terved ökosüsteemid linna tasandil -, kes teavad, kuidas asju arukalt teha. Ja peale selle on meil käes see uskumatu asi, mida ma ei usu, et keegi maailmas on täielikult mõistnud ja see on asjade interneti vorm. Viimase kümnendi jooksul on toimunud kõik need erinevad muutused ja natuke, võib-olla kahe aastakümne jooksul, kui me selle ümardame, siis need on minu arvates just andmebaaside maailmaks mõjutanud.

On olnud paar olulist asja, mis on selle isegi võimalikuks teinud. Kõvaketaste hind on dramaatiliselt langenud ja see võimaldas paljuski juhtida mõnda võrdlusarhitektuuri, näiteks Hadoopi mudelit, kuna võtame palju andmeid ja levitame seda paljudele kõvaketastele ning tee sellega nutikaid asju. Ja tegelikult muutus see minu arvates relatsiooniandmebaasi või traditsioonilise DB-üksuse mudeli varjutuseks. Ja RAM sai väga-väga odavat ja see andis meile täiesti uue võimaluse mängida erinevate referentsarhitektuuridega, näiteks mälusisesega, ja teha asju nagu väga-väga suurte andmete tükeldamine.

Ja see andis meile selle väikese pildi, mida me praegu vaatame. See on diagramm, mis näitab platvormide tüüpe, mis on saadaval, kui viibite suure andmemaastiku korral. Ja seda on väga-väga raske lugeda ja selle põhjuseks on selle kohta lihtsalt liiga palju teavet. Igasuguses vormis andmebaasisüsteemidesse andmete sisestamiseks ja päringute tegemiseks ning traditsiooniliste lugemis- ja kirjutamisvõimaluste loomiseks, mudeliks ja valmistamiseks on nii palju võimalusi. Ja nad ei ole kõik nõuetele vastavad, tegelikult vastavad väga vähesed neist isegi mõnele põhistandardile, kuid peavad end siiski andmebaasiks. Ja ma näitan teile sekundiga paar ekraani, et tutvustada teile seda, mida ma mõtlen üleminekul 90-ndate aastatelt ja Interneti-skaalalt veebi 2.0-le ning seejärel kogu kasvu suurandmete kaudu. Kui arvame, et see suur andmesidetehnoloogia maastiku graafik on põnev, kuna sellel on palju võimalusi, siis vaatame lihtsalt ühte vertikaalset klahvi.

Vaatame turundustehnoloogiat. Siin on andmebaasihaldussüsteemide või andmehalduse võimalused ainult mar-tech-ruumis, st turundusega seotud tehnoloogiaga. Nüüd oli see 2011. aastal, nii et paar aastat tagasi; viis aastat tagasi nägi selline välja maastik. Kui ma korraks tagasi ühe slaidi juurde tagasi lähenen, siis näeb selline välja tänapäeva andmemaastik erinevates brändides ja andmebaasitehnoloogia pakkumistes. See nägi välja üks vertikaalne viis aastat tagasi just turundustehnoloogia valdkonnas.

Kui ma lähen tänasele vaatele, siis see näeb välja selline ja see on täiesti läbitungimatu. Just see kaubamärkide ja valikute sein ning tuhandeid ja tuhandeid tarkvarakombinatsioone, mis peavad end andmebaasiklassi kuuluvaks, suudavad erinevates vormides andmeid hõivata, luua või salvestada ja neid hankida. Ja ma arvan, et siseneme praegu väga, väga huvitavasse ja vaprasse aega, kus kunagi võiksite teada suuremaid kaubamärke, võiksite teada viit või kuut erinevat platvormi Oracle ja Informixist, DB2-st ja nii edasi ning olla peaaegu ekspert kõigi nende brändide kohta, mis olid saadaval umbes 20 aastat tagasi. Kümme aastat tagasi läks asi pisut lihtsamaks, kuna osa kaubamärke kukkus maha ja kõik kaubamärgid ei saanud dot-com buumi ulatusega hakkama ja mõni ettevõte läks lihtsalt katki.

Täna on täiesti võimatu olla eksperdiks kogu olemasolevale andmebaasitehnoloogiale, olgu selleks siis relatsiooniandmebaasid või standardsed andmebaasihaldusplatvormid, millest oleme viimase paarikümne aasta jooksul teada saanud. Või tõenäoliselt ka moodsamad mootorid nagu Neo4j ja need tüübid. Ja nii ma arvan, et oleme sisenemas väga vaprasse maailma, kus on saadaval palju võimalusi ja meil on horisontaalselt platvormid, kas siis mälus või kettal. Kuid ma arvan, et see on keeruline aeg tehnoloogia- ja äriotsustajatele, kuna nad peavad tegema tehnoloogiapinkide osas väga suuri otsuseid, mis mõnel juhul on olnud sisuliselt vaid mitu kuud. Kaheksateist kuud vana pole mõne põnevama ja uue avatud lähtekoodiga andmebaasi platvormi jaoks nüüd hirmutav number. Ja nad hakkavad platvorme ühendama ning muutuvad veelgi uuemaks ja põnevamaks.

Ma arvan, et peame täna suurepärase vestluse selle üle, kuidas see kõik on mõjutanud traditsioonilisi andmebaasiplatvorme ja kuidas nad sellele reageerivad ning milliseid tehnoloogiaid sellele heidetakse. Ja seda silmas pidades, lähen nüüd dr Robin Bloorile ja saan tema teadmisi. Robin, sulle üle.

Robin Bloor: Olgu, tänan selle eest. Jah, see on liiga suur teema. Ma mõtlen, et kui te võtaksite lihtsalt ühe illustratsiooni, mida Dez just teile näitas, siis võiksite pikalt vestelda just ühe selle riba kohta. Kuid teate, võite minna andmebaasidesse - ma olen juba 1980ndatest alates andmebaase vaadanud, ma ei tea, ja te saate andmebaase vaadata erineval viisil. Ja üks neist asjadest, mille ma mõtlesin teha, viskan lihtsalt täna vestlusse, oli rääkida põhjusest, miks riistvara tasemel on häirivaid asju juhtunud. Ja peate meeles pidama, et ka tarkvara tasemel on tegelikult juhtunud kohutavalt palju segavaid asju, nii et see ei ole millegi täielik pilt, see on lihtsalt riistvara asi.

Ka ei kavatsenud ma eriti kaua rääkida, tahtsin teile lihtsalt riistvarapildi anda. Andmebaas oli andmete otsimisvõimalused, mis hõlmasid protsessorit, mälu ja ketast ning see on dramaatiliselt muutuv. Ja põhjus, miks ma seda ütlen, oli see, et õppisin andmebaasist aru saama, mida te tegelikult tegite. Teate, et protsessoril tegelikult olevate andmete ja mälust keskseadmesse tõmmatavate andmete ning mälust kettal olevate andmete ja keskseadme andmete vahel on latentsus erinev. Ja vanad andmebaasiarhitektuurid üritasid seda lihtsalt tasakaalustada. Teate, nad lihtsalt ütlesid: „Noh, see läheb väga aeglaselt, vahemällu salvestame ketta andmed nii, et need oleksid mälus. Proovime seda teha tõeliselt täpsel viisil, nii et tõesti suur osa küsitud andmetest on juba mälus. Ja marsime andmed protsessorile nii kiiresti kui võimalik. "

Ja vanasti kirjutati andmebaasid, masinad kirjutatakse väikeste klastrite jaoks. Ja nüüd paralleelsuse teadmatuse pärast. Sest kui kavatsete klastrist mõne etenduse välja saada, peate paralleelselt tegema mitmesuguseid asju. Parallelism on mängu osa, mitte midagi sellist nagu praegu. Ma kõnnin lihtsalt juhtunu läbi.

Esiteks ketas. Noh, ketas on läbi, tõesti. Andmebaaside osas on see peaaegu läbi. Arvan, et andmete arhiveerimisel on mitmeid miinuseid ja isegi Hadoopis töötavatel väga suurtel andmejärvedel on kõige halvem ketrav ketas tänapäeval tõenäoliselt elujõuline. Tõesti, ketramisketta probleem oli selles, et lugemiskiirus ei paranenud eriti. Ja kui protsessor tõusis Moore'i seaduse kiirusega, mis oli suurusjärgus kiirem, iga kuue aasta tagant. Ja mälu oli seda järgselt selline, et need kaks pidasid mõistlikult sammu teineteisega, see polnud veel päris sile, kuid said hakkama.

Kuid juhuslikult loetud kettal, kus pea lendab ümber ketta, pean lisaks kõigele muule silmas ka füüsilist liikumist. Ja kui teete ketast juhuslikult lugedes, on see mälust lugemisega võrreldes uskumatult aeglane, näiteks 100 000 korda aeglasem. Ja üsna hiljuti luges enamik andmebaasiarhitektuure, mida ma olen sügavuti vaadanud, tegelikult ketastelt jadamisi. Tõesti soovite ühel või teisel viisil lihtsalt ketta vahemälu vahemällu salvestada, selle aeglase seadme küljest lahti tõmmata ja kiirele seadmele panna. Ja seal on palju nutikaid asju, mida saate sellega teha, kuid see on omamoodi läbi.

Ja tahkes olekus olevad kettad või välkmäluseadmed, mis nad tegelikult on, asendavad ketramise kiiresti kiiresti. Ja see muutub jälle täielikult, kuna andmete kettale korraldamise viis on korraldatud vastavalt ketta toimimisviisile. See on tegelikult pea, mis liigub üle ketruspinna, tegelikult mitme pea, mis liigub üle mitme ketruspinna, ja andmete kogumise nende käigu korral. Tahkismäluseade on lihtsalt selliste asjade blokk, mida saate lugeda. Ma mõtlen, et esimene asi on see, et kõik traditsioonilised andmebaasid on ketramise jaoks ette nähtud ja nüüd tehakse neid SSD jaoks ümber. Tõenäoliselt saavad uued andmebaasid - igaüks, kes praegu uut andmebaasi kirjutab, võib ketramisketast ignoreerida ja sellele mitte mõelda. Kuid Samsung, SSD-de suurim tootja, ütleb meile, et SSD-d on tegelikult Moore'i seaduse kõver.

Need olid juba minu arust umbes kolm või neli korda kiiremad kui ketramine, kuid põhimõtteliselt saavad nad nüüd iga 18 kuu tagant palju kiiremini. Topeltkiirus ja kümme korda kiirem kuni umbes kuus aastat. Kui see aga just nii oleks, siis see pole nii, nagu ma ütlen teile hetke pärast. Keeratav ketas on muidugi saamas arhiivimismeediumiks.

Mälust. Esiteks, RAM. CPU suhe RAM-i vahel CPU kohta kasvab lihtsalt kogu aeg. Ja loomulikult pakub see teatud mõttes kohutavalt palju suuremat kiirust, sest ameerika mälu, mis teil nüüd on, võib talletada palju rohkem. Tegelikult see vähendab omamoodi MLTP-tüüpi rakenduste või juhusliku lugemise rakenduste survet, kuna neid on lihtsam hooldada, kuna teil on nüüd palju mälu ja nii saate vahemällu salvestada kõike, mis on tõenäoliselt loetakse mällu. Kuid teil on probleeme suurema andmehunnikuga, nii et suured andmed pole tegelikult nii lihtne.

Ja siis on meil 3D Xpointiga Intel ja IBM, mida nad nimetavad PCM-ks, mis on faasimuutusmälu, edastab midagi, mis nende arvates on - noh, see on vähemalt kümme korda kiirem kui praegused SSD-d ja nad usuvad, et see saab väga lähedal RAM-i sama kiirusele. Ja muidugi on see odavam. Nii et varem oli teil selline protsessori, mälu ja ketta andmebaasistruktuur ning nüüd liigume nelja kihi struktuuri poole. Sellel on protsessor, mälu või RAM ja siis selline SSD-st kiirem mälu, mis on tegelikult püsiv, ja siis SSD. Ja need uued tehnoloogiad on lendumatud.

Ja seal on HP mälukaart, mida veel pole, teate, sest sellest teatati umbes seitse aastat tagasi, kuid seda pole veel ilmunud. Kuid kuuldused, mida ma kuulen, on see, et HP muudab mängu natuke ka mälukaardiga, nii et teil on lihtsalt uus mälu olukord. See pole nii, nagu meil oleks kiirem kraam, see on justkui meil täiesti uus kiht. Ja siis on meil teada, et SSD-juurdepääs, saate seda paralleelselt lugeda. Te ei saa ketramiskettaga paralleelselt lugeda, välja arvatud siis, kui teil on palju erinevaid ketramiskettaid. Kuid SSD plokk, saate tegelikult paralleelselt lugeda. Ja kuna saate seda paralleelselt lugeda, läheb see palju kiiremini kui lihtsad lugemiskiirused, kui seadistate eri protsesside vahel mitu protsessi ühel protsessoril ja teil on sellega kaasas ainult SSD.

Arvatakse, et seda tehes saate RAM-i kiirusega peaaegu hakkama. Ja kõik see räägib, mäluarhitektuuri tulevik on ebaselge. Ma mõtlen, et reaalsus on see, et erinevad domineerivad müüjad, sõltumata sellest, kelleks nad osutuvad, määravad tõenäoliselt riistvara suuna. Kuid keegi ei tea, kuhu see praegu jõuab. Olen rääkinud mõnede andmebaaside inseneridega, kes ütlevad: "Ma ei karda toimuvat", kuid nad ei tea, kuidas seda optimeerida. Ja sa tegid alati omamoodi, nii et see on huvitav.

Ja siis on olemas protsessor. Noh, mitmetuumalised protsessorid ei olnud lihtsalt mitmetuumalised protsessorid. Samuti on meil märkimisväärses mahus L1, L2 ja L3 vahemälu, eriti L3, mis on, ma ei tea, kümneid megabaite. Saate sinna palju panna, teate. Seetõttu saate kiipi vahemälukandjana kasutada. See muutis mängu. Ja kindlasti on vektorite töötlemine ja andmete tihendamine, mida mitmed müüjad on tegelikult teinud, lohistanud need asjad CPU-le, et see kõik CPU-s palju kiiremini kulgeks. Siis saate teada, et GPU-ga protsessorid on analüütika kiirendamiseks tõesti head. Ja nad on teatud tüüpi päringute puhul tõesti üsna head, see sõltub lihtsalt sellest, milline on teie päring.

Võite luua tahvleid, kus on protsessorid ja GPU-d sisse lülitatud, või nagu AMD praegu teeb, toota midagi, mida nimetatakse APU-ks, mis on CPU ja GPU omamoodi abielu; sellel on mõlemat tüüpi võime. See on teist tüüpi protsessor. Ja siis Inteli hiljutine teade, et nad hakkavad FPGA-d kiibile panema, tegi see mulle pähe. Ma mõtlesin: “Kuidas maa peal see juhtub?” Sest kui sul on CPU, GPU võimalus ja teil on võimalus CPU, FPGA - ja muide, kui tõesti soovite, võiksite samale tahvlile panna CPU, GPU ja FPGA. Mul pole aimugi, kuidas te midagi sel viisil tegelikult juhiksite, kuid ma tean ettevõtteid, kes tegelevad niimoodi toimimisega ja saavad väga-väga kiireid vastuseid päringutele. See ei ole midagi, mida eiratakse, see on asi, mida hakkavad kasutama väljakujunenud müüjad ja võib-olla ka uued müüjad. DBMS-id olid alati paralleelsed, kuid nüüd on paralleelsed võimalused lihtsalt plahvatuslikult kasvanud, sest see võimaldab teil seda erinevatel viisidel paralleelselt täiendada.

Lõpuks, et laiendada või vähendada? Ulatuse suurendamine on tõesti parim lahendus, kuid ühe asja jaoks. Sõlmede jõudlus on palju parem, kui saate lihtsalt optimeerida CPU ja ühe sõlme ketta mälu. Ja te kasutate vähem sõlmi, nii et see tuleb odavam, eks? Ja seda on lihtsam hallata. Kahjuks on see riistvarast sõltuv disain ja riistvara muutudes on seda üha vähem võimalik teha, välja arvatud juhul, kui teie insenerid suudavad töötada sama kiiresti kui riistvara muutub. Ja teil tekivad probleemid töökoormusega, kuna suurendades teete mitmesuguseid eeldusi selle kohta, mida töökoormus ette võtab.

Kui skaleerite, st kui teie arhitektuur rõhutab enne laiendamist, siis peate te mõlemad tegema, lihtsalt rõhutage ühte. Siis saate parema võrgu jõudluse, sest arhitektuur tegeleb sellega. See läheb riistvara osas kallimaks, kuna sõlme on rohkem, kuid töökoormusega seotud probleeme on vähem ja paindlikum on disain.

Ja ma lihtsalt arvasin, et viskan selle sisse, sest kui te tegelikult mõtlete kõikidele riistvaramuutustele, osutasin ma lihtsalt näpuga ja siis mõtlesite, kuidas te siis plaanite seda kraami üles skaleerida? Siis saate aru, et andmebaaside insenerid on vähemalt minu arvates hästi alatasustatud. Nii et kui mõelda vaid riistvarakihile, on andmebaasi väljakutsed selged. Nüüd annan selle edasi Bertile, kes paneb meid kõiki end harituks tundma.

Eric Kavanagh: See selleks! Bert?

Bert Scalzo: Tänan teid väga. Las ma saan otse nendele slaididele. Mul on palju slaidid läbimiseks, nii et üsna paljudel neist võib mul minna üsna kiiresti. Me räägime sellest “Edasiminek: liikudes suhtest kaugemale traditsioonilisest”. See pole enam teie isa andmebaas. Asjad on muutunud ja nagu üks varasem esineja ütles, on viimase kuue kuni seitsme aasta jooksul maastik kardinaalselt muutunud.

Ise olen andmebaase teinud 80ndate keskpaigast alates. Olen kirjutanud raamatuid Oracle'i, SQL Serveri, võrdlusuuringute ja paljude muude asjade kohta. „Maailm muutub väga kiiresti. Suur ei löö enam väikest. See on kiire aeglane peksmine. ”Lisasin sõna„ kohanemiseks ”. See oli Rupert Murdochilt. Usun tõesti, et see peab paika. Te ei saa andmebaaside asju teha nii, nagu te tegite 10, 15, 20 aastat tagasi. Peate tegema seda nii, nagu ettevõte seda soovib.

Püüan jääda oma esituses pisut üldiseks, kuid enamiku funktsioonidest, millest ma räägin, leiate Oracle'ist, leiate SQL Serverist, MySQList, MariaDB-st ja mõnest teisest suurest mängijad. Relatsioonandmebaasi revolutsioon, nõustun jällegi varasemate esinejatega. Kui vaadata 2010. aasta paiku õigesti, läksime punasest võistlusautost kollase võistlusauto juurde. Seal oli oluline muutus ja tuleme 2020, ma usun, et näete veel ühte radikaalset muutust. Meil on väga huvitav aeg.

Nüüd on see slaid võti, sellepärast panin selle üles. Kogu see muutus toimub ja vasakpoolses osas on mul tehnoloogia olemas ning paremal pool on mul äri. Ja küsimus on, kumb põhjustab ja kumb toetab? Meil on kõik need riistvaramuudatused: kettad tulevad alla, ketta suurus suureneb, uut tüüpi kettad, nii et varasemate kõlaritega kaeti. Mälu hind langeb, kõik need andmebaaside uuemad versioonid. Kuid paremal küljel on meil andmekaitse ja vastavus, andmete ladustamine, äriteave, analüüs ja kohustuslik andmete säilitamine. Võrrandi mõlemad pooled sõidavad ja võrrandi mõlemad pooled hakkavad kasutama kõiki neid uusi funktsioone.

Esiteks on meil oma tüüpiline SASi ketramisketas, nüüd on need kuni 10 terabaiti. Kui te pole seda näinud, on Western Digitalil HGST-l heliumi ajamiks nimetatav seade, mis praegu ulatub umbes 10 terabaitini. Ketrusketta kulud lähevad üsna madalaks. Nagu varem mainitud, võite saada kuni kahe terabaidise mahuga tahkiskettaid, kuid Samsungil on peagi saadaval 20-terabaidine seade. Kulud muutuvad mõistlikuks. Üks asi, mida ma teistest ei räägi, on välkketaste kontseptsioon. PCIe, see on PCI Express versus NVMe, võib-olla olete sellest mittelenduvast mälukompressioonist kuulnud või mitte. Põhimõtteliselt kavatseb NVMe asendada SAS-i ja SATA-d ning see on tõesti pigem suhtlusprotokoll kui miski muu. Kuid nende ketaste maht on praegu umbes kolm terabaiti.

Võib-olla olete ka näinud, et mõnedes SAS-draivides on nüüd U.2-pistikud, mis on omamoodi erinev pistikühendus kui SAS või SATA, mis toetab NVMe-d tavalise kettaga - ketas peab seda muidugi ka toetama. Ja siis SATA koos M.2-pistikutega ja need hakkavad saama NVMe-d. Tegelikult müüvad nüüd sülearvutite müüjad sülearvuteid, milles on NVMe-mälupulk, ja need asjad karjuvad võrreldes teie varem kasutatud tehnoloogiaga.

Paljud inimesed ei tea, mis kõik need erinevad välgud on. Kui vaatate paremas alanurgas, on see näide M.2-st. Võite öelda: "Noh, hea küll, see näeb välja palju nagu mSATA draiv sellest vasakul." Kuid nagu näete, on sellel kaks tihvtipilu, mitte üks ja see on natuke suurem. Ja lisaks, M.2 võib olla kolmes erinevas suuruses.

Ja siis välkuvad PCI Express ja NVMe. Nüüd on NVMe välk ka PCI Express, kuid PCI Express on tavaliselt ikkagi SAS- või SATA-tüüpi kontrolleri algoritm, mis kirjutati ketramiseks, ja NVMe on algoritmid või tehnikad, mis kirjutati spetsiaalselt välklambi jaoks. Ja jälle näete neid kõiki.

NVMe pakub üsna palju asju. Ma arvan, et kaks suurimat parandust on paremas ülanurgas, et latentsusaega vähendatakse isegi 70 protsenti. Ma olen tegelikult sellest isegi kõrgemat näinud. Lisaks, kui vaatate paremas alanurgas, kui teie opsüsteem räägib NVMe kettaga, läbib see palju vähem tarkvara taset. Põhimõtteliselt läbite NVMe draiveri, mis on nüüd operatsioonisüsteemiga kaasas, ja see räägib otse meediaga. On palju põhjuseid, miks see tehnoloogia muudab radikaalselt andmebaasimaailma.

Ja palju kordi ütlevad inimesed: “Noh, kui kiire on NVMe?” Teate, vanad head päevad, nii 2004. kui ka enne seda, olime põnevil, kui meil oleks Ultra-320 SCSI, 300 megabaidi sekundis. Tänapäevased kiirused, tõenäoliselt on suur osa teist kiudoptil või InfiniBandil ja sellised tipptasemel. Parempoolne NVMe algab seal, kus praegused tehnoloogiad lõppevad. Mulle meeldib see, et kaheksarealise lingiga PCI Express 3.0 algab peaaegu 8000-st ja see tõuseb, kui saame PCI Expressi uuemad versioonid, neli versiooni ja nii edasi. NVMe-l pole muud üle minna kui üles.

Mis on andmebaasis muutuvatest asjadest? Nüüd panen slaidide paremasse ülanurka ärilised põhjused, mida minu arvates tehnoloogia näitas. Andmeladustamise ja kohustusliku andmete säilitamise regulatiivsete põhjuste tõttu hakkavad andmebaasid pakkumist pakkuma. Nüüd pakuvad mõned andmebaasid lisandmoodulina pakkimist, mõned pakuvad seda standardina sisseehitatud kujul, ütleme näiteks, et nende andmebaasi ettevõtte väljaanne, ja mõnel andmebaasil, näiteks Oracle'is, võiks olla isegi parem pakkimisversioon, mis on näiteks nende Exadata platvormil, nii et nad on tegelikult ehitanud riistvara, mis toetab väga spetsiifilist tihendamist ja näiteks Exadata üks saab 40x tihendusmäära ja seega on see väga oluline. Ja ma arvan, et see on kohustuslik andmete säilitamine, inimesed soovivad andmeid lihtsalt kauem. Analüüsi ja BI tegemiseks vajavad ettevõtted viimase 5, 10, 15 aasta andmeid.

Nüüd oli veel üks funktsioon, mis hakkas ilmuma umbes tol 2008., 2009. aasta perioodil, jagunemine. Jällegi leiate selle andmebaasidest nagu Oracle, SQL Server ja mõlemast, mille eest peate selle eest maksma. Oracle'is peate ostma jaotamise võimaluse ja SQL Serveris peate olema andmekeskuse väljaandes. See on teie traditsiooniline jagamise ja vallutamise tehnika ning see, mida teete, on see, et teil on selle ülaosas loogiline suur laud ja kui see plaadile pannakse, jaotatakse see ämbriteks. Ja näete, et need ämbrid on eraldatud mõne eralduskriteeriumi järgi, millele tavaliselt viidatakse või mida nimetatakse teie eraldusfunktsiooniks, ja siis võite ka mõnes andmebaasi platvormis alajaotuse anda ja võite veelgi kaugemale minna.

Jällegi arvan, et nii andmete ladustamine kui ka kohustuslik andmete säilitamine on seda edasi viinud ja mõnes neist andmebaasidest võib teil olla kuni 64 000 partitsiooni ja mõnes muus andmebaasis usun isegi kuni 64 000 alajaotust. See võimaldab teil jagada oma andmed hallatavateks tükkideks. Jagage ka indeksid; see on valik, mida te ei pea, kuid võite ka oma indeksid sektsioonida. Selle põhjuseks võib olla see, et teil on libisev andmete aken. Soovite säilitada 10-aastaseid andmeid, kuid selleks, et indekseid tänapäeva partii koormuse täitmiseks alla lasta, ei pea te indekseid igale reale alla laskma, vaid ainult nende ridade jaoks, mis on praeguses koppis. Osadeks jaotamine on tegelikult väga hea haldustööriist, isegi kui enamik inimesi arvab, et selle suureks eeliseks on partitsioonide eemaldamise katkestamine teie plaanides ja seetõttu päringute kiirendamine. See on tõesti selline koogi jäätumine.

Nüüd kuulsite arvatavasti varjutustest ja arvate tõenäoliselt: “Noh, miks sa selle slaidi siia panid?” See on üks neist NoSQL-ist - see on üks neist Hadoopi tüüpi keskkondadest. Oracle 12c andis välja kaks, mis pole veel G8, kuid mida näidatakse või eelvaadatakse, on selles tegelikult varjund. Teil on traditsiooniline andmebaasisüsteem, nagu näiteks Oracle, ja saate hakata varjutama nagu Hadoopi mudelis, ja seega on teil veel üks jagamise ja vallutamise tehnika, mis jagab teie tabelit ridade kaupa rühmadesse sõlmede kaupa ja nii see on - täpselt nagu see, mida näete mõnes oma NoSQL andmebaasis. Ja tegelikult saab MySQL tegelikult selle üsna palju ära teha, kasutades ühte nende rühmitustehnikat, kuid see jõuab traditsioonilisse andmebaasi ja ma arvan, et Microsoft ei taha sellest maha jääda. Need kaks mängivad kogu aeg hüppeliselt konna, nii et ma eeldan, et SQL Serveri järgmises versioonis võib näha varitsust.

Andmete elutsüklihaldus, jällegi kohustuslik andmete säilitamine, aga ka äriteabe ja analüüsi jaoks. Tõesti, see on jagamise ja vallutamise tehnika ning tavaliselt teevad DBA-d seda käsitsi ja see tähendab: “Ma hoian selle aasta andmeid kiirete ketaste kohta, eelmise aasta andmeid pisut aeglasemate ketaste kohta, võib-olla lähen et hoida kaks viimast aastat enne seda veelgi aeglasemalt ketastel ja siis on mul mõni arhiivimismeetod. ”Tavaliselt pole seda enam lindistatud, tavaliselt - teil on mingi võrku ühendatud mäluseade või mõni seade, millel on palju salvestusruumi ja on, tead, tasuv, kuid see on endiselt ketrav ketas.

Ja nii saate nüüd - nii Oracle'is kui ka SQL Serveris - tegelikult osta võimaluse, kus määratlete reeglid ja see juhtub lihtsalt taustal automaatselt. Te ei pea enam skripte kirjutama, te ei pea midagi tegema. Ja kui olete näinud just juunis välja tulnud SQL Server 2016, on seal uus funktsioon nimega “Venitusandmebaasid”, mis põhimõtteliselt võimaldab teil seda teha - paremas alanurgas - liikuda mitmest kihist otse pilve ja see on jällegi andmebaasi sisseehitatud funktsioon, öeldes lihtsalt midagi sellist: “Kui andmed on üle 365 päeva vanad, teisaldage need pilve ja teate, tehke see minu jaoks automaatselt.”

See saab olema väga lahe funktsioon, tegelikult ma mõtlen, et see võib olla see, mida me tulevikus näeme, milleks on teil hübriidandmebaasid, kus hoiate mõnda kohalikku ja mõned pilves. Enne seda mõtlesid inimesed: “Oh, ma teen kas eeldusi või lähen pilve.” Nüüd näeme kahe tehnoloogia abielu sellel hübriidviisil. Ma arvan, et see saab olema päris suur ja Microsoft jõudis sinna esimesena.

Parandus, see on tingitud andmekaitsest ja vastavusest. Nüüd, vanade heade aegade ajal, võisime öelda: "Hei, rakenduse arendaja, kui te seda aruandes kuvate, kui siin ekraanil kuvate, siis siin on mõned turvameetmed, mida peaksite kontrollima ja palun, teate, kuvage ainult andmeid nad peaksid nägema või maskeerima või redigeerima andmeid, mida nad ei peaks nägema. ”Noh, nagu tavaliselt, kui te rakendusele välja surute, ei tehta seda ühes kohas, nii et tehakse teisiti või ei Mõnes kohas ei tehta. Ja nüüd olete selle võimaluse oma andmebaasisüsteemides tegelikult saanud.

Nüüd on see funktsioon sisse ehitatud SQL Server 2016-sse, nii et see pole veel valikuline kuluartikkel, mis peaks olema andmekeskuse lisamisel, ma usun; ja Oracle 12-s peate ostma nende elutsüklihalduse lisandmooduli, kuid see on midagi uut ja jälle on selle ajendiks ettevõte. Ja eriti seetõttu, et hoiate praegu nii palju andmeid ja teete nii andmete otsingut kui ka BI-d ja analüütikat, olete teada saanud, kes millistele andmetele pääseb ja veenduge, et neil oleks lubatud näha vaid seda, mida neil on lubatud näha.

Samuti vaadake uuesti seda, andmekaitse ja vastavus. Leiate, et suur osa andmebaasisüsteeme loob nüüd tihendamise või on mul kahju, krüptimine otse andmebaasi ja mis on selle krüptimise juures oluline, kui vaatate alla suunatud noolt ja üles-noolt joonisel, kuhu see kirjutab, krüptitud kettale ja siis loeb see mällu tagasi ja dekrüpteerib selle. See on tegelikult üks mudel, on veel üks mudel, mis, teate, tegelikult teeks seda ainult siis, kui edastab need andmed võrgu kaudu tegelikule kliendirakendusele.

Sel juhul oleks see veel mälus olevas andmebaasiserveris krüptitav ja dekrüptitav alles siis, kui see kliendirakendusele üle saadetakse. Siin on kaks erinevat mudelit ja leiate need andmebaasidest ning tegelikult oli üks hiljuti lisandunud andmebaasidest nende versioonis 10.X MariaDB; Usun, et nad on nüüd 10.1 või 10.2 peal. Ja ma tegin tegelikult selle krüptimise osas mõned võrdlusuuringud ja selle krüptimise saamiseks kogesin läbilaskevõime või kiiruse langust ainult umbes 8 protsenti. Võrdlusuuringus ei põhjustanud krüpteerimine nii palju ja seetõttu on see väga kasulik funktsioon.

Nüüd oleme varasemalt maininud välkmälu ja SSD-sid ning selliseid asju. Üks Oracle'is ja SQL Serveris sisalduvatest funktsioonidest, mida paljud inimesed ei teadvusta, on see, et saate teha oma andmebaasiserveris oleva välklambi või SSD-faili ning öelda andmebaasile: „Kasutage seda justkui mälu. Tehke RAM-i eelistamist, kuid teesklege, et see on aeglane mälu ja kasutage seda laiendatud vahemäluna. ”Nüüd tuli see välja SQL Serveris 2014 ja seda kutsuti puhverreservi laiendamiseks, see on tasuta. Oracle'is tuli see välja 11g R2-s ja kandis nime “Database Flash Cache” ning seal oli see ka tasuta.

Minu soovitus on siiski seda funktsiooni hoolikalt proovida. Iga kord, kui muudate vahemälu otsingu tegemisel suuremaks, võtab see kauem aega. Kui paned kolme terabaidise välkmälukaardi ja ütlete andmebaasile „Lisage see oma mällu”, võite tegelikult avastada, et midagi on aeglustunud, sest vaatamise ja vaatamise aeg on välklambis, kas see on räpane või puhas? Naasmine on mõtet vähendada. Minu nõuanne on jälle see proovivõtt, vaadake, mis teie jaoks sobib, kuid jällegi on see teie andmebaasis ning Oracle'i puhul nii SQL Serveris kui ka Oracle'is on see olemas olnud juba paar aastat.

Ja siis see viib meid vanaisa juurde, mis olid mälus olevad andmebaasid ja see on sellepärast, et andmebaaside hinnad on langenud. Teine põhjus, miks te arvatavasti arvaksite, et see on toimunud, on palju analüütikat, mille kohaselt andmed peavad olema kiiresti juurdepääsetavad ja seetõttu peavad need olema mälus. Pange tähele, et algoritmid, mida andmebaasid kasutavad nendele andmetele juurdepääsu saamiseks, nende tihendamiseks, krüptimiseks ja salvestamiseks, teate, et mõnel juhul võivad mõned andmebaasid mällu jätkuvalt rida salvestada.

Mõnel juhul võivad mõned andmebaasid jagada selle veerupõhiseks ja selle põhjuseks on palju kõrgem pakkimistase (kuskil 11 kuni 12X), salvestades selle veergude järjekorras versus reas. See ilmus esimest korda SQL Server 2014-s, selle nimi oli “Hekaton”. SQL Server 2016-s on seda radikaalselt suurendatud, nad näevad seda viidates mõnele erinevale nimele ja see tuli välja Oracle 12c-s; Ma ütlen, et siin on teine väljalase, mitte R2. Oracle 12c oli kahes erinevas versioonis: 12.1.0.1 ja 12.1.0.2. See on andmebaasi R1 versiooni teine väljalase.

Ja nii, nagu te seda määratlete, on mälus olev objekt mõlemas andmebaasis sarnane. Siin näete paremas ülanurgas, et ma loon SQL Serverit ja näete, et see ütleb optimeeritud mäluga ja vastupidavus on ainult skeem. Ma ei hakka kõiki neid süntaktilisi tähendusi üle vaatama ja Oracle'is on see tegelikult veelgi lihtsam - te lihtsalt muudate tabelit ja ütlete mälus või mitte ja saate seda muuta. Võin öelda, et täna on see mälus ja homme seda pole ning seega on see väga paindlik.

Tegin mõned testid Oracle'i abil mäluseadmete tabelitega, mul oli ülemise rea kohal mõned testid, mille käivitamiseks kulus peaaegu 40 minutit. Oluline on nüüd, kui jõudsin kahte alumisse ritta, olin suurendanud käitusaega või vähendanud seda, ma peaksin ütlema, umbes viieks minutiks ja kui tihendustegurit vaatasin, olid mälus olevad andmed tegelikult 3,6 kuni 4,6 korda väiksem. See on oluline, kuna sel juhul kasutasin veerupõhist vormingut ja see on tihendamine. Ja mis siis arvata? Mahtus tegelikult minu mällu peaaegu neli kuni viis korda rohkem andmeid. Ma ei saanud mitte ainult mälusisese eelise, veerupõhise eelise, vaid ka palju rohkemate andmete eelise - mälu vahemällu on kuni viis korda rohkem andmeid, seega on see üsna võimas tehnika. Jällegi, Oracle ja SQL Server, tahate neid vaadata, need on tõesti lahedad funktsioonid. Ja sellega seoses arvan ma, et teen selle küsimuste avamiseks.

Eric Kavanagh: Noh, Bert, esiteks olete kogu selle imelise hariduse omandamisel olnud väga ennastsalgav. Kas saaksite vaid minut rääkida sellest, mida te teete? Sest teil on mõni võimaldav tehnoloogia, mis hõlbustab teie juttu. Rääkige vaid minut sellest, mida teie kutid teete, ja laseme siis Dezil ja Robinil siin esitatud võrrandisse alla minna.

Bert Scalzo: Jah, ma töötan firmas nimega IDERA. Me oleme Texases, peakontor asub Houstonis ja tegelikult istun praegu Austinis, kuid ma elan Dallases. Valmistame andmebaasi tööriistad ja andmebaasi tööriistad, mis aitavad teil probleeme lahendada. See probleem võib olla midagi nii lihtsat kui tootlikkus. Sel juhul on meil tööriist nimega DBArtisan, mis võimaldab teil teha oma andmebaasi administratiivseid ülesandeid, ja see on üks tööriist, mis võimaldab teil hallata 12 erinevat andmebaasi platvormi. Ma saan hallata SQL Serverit, ma saan hallata Oracle'i, ma saan hallata MySQL, DB2, Postgres ja ma kasutan ühte tööriista, ühte käivitatavat, ühte GUI kujundust ja ühte järjepidevat töövoogude komplekti. Valmistame ka tööriistu vastavuse tagamiseks; meil on tööriist nimega SQL Compliance Manager, mis aitab teil täita oma vastavusvajadusi. Veel üks tööriist nimega SQL Security, seega proovime teha tööriistu, mis aitavad teil tõhusust ja tulemuslikkust ning mis on meie veebisaidi külastamisel tõesti tore, meil on seal terve hunnik vabavara, nii et kui mitte midagi muud, minge alla laadima - Ma arvan, et meil on nagu 20 või 25 tasuta tarkvara. Seal on tõesti mõned head vabavaralised asjad, näiteks SQL Server ja Windowsi abikontroll, mis lihtsalt vaatavad teie tehtud asju ja ütlevad teile, kas teil on probleeme või asju, ja see on täiesti tasuta.

Eric Kavanagh: Ja sa oled tõesti selline ...

Bert Scalzo: Kindlasti esimene värk -

Eric Kavanagh: Räägite tänapäeval heterogeensusest turul, seal oli kunagi selline kõigile sobiv võrrand, et tegelikult mäletan ma dr Michael Stonebrakeri intervjueerimist juba 2005. aastal, kui ta läks suureks tõukeks Rääkides veerupõhise andmebaasiliikumise kohtuotsusest ja ta rääkis kõigest sellest, kuidas aastaid domineeris ühemõtteline relatsioonimudel ja ta ennustas, et see kõik muutub, ja poisil oli selles osas õigus. Nüüd on meil see väga mitmekesine ja huvitav keskkond, kus on palju erinevaid võimalusi ja võimalusi, kuid teil on vaja kedagi, kes seda kõike haldaks, ja mulle tundub, et teie ettevõte on keskendunud üsna teravalt matemaatikaprobleemide lahendamisele, olles seega võimaluste loomiseks heterogeensuse päis, eks?

Bert Scalzo: Absoluutselt. Ma mõtlen, et alati leidub DBA-sid, kes ütlevad: "Ma ei taha GUI-tööriista kasutada, ma teen kõike skriptidega", teate? Nad arvavad, et nad on DBA supermani tüübid ja see on hästi, kuid enamiku inimeste jaoks tahame lihtsalt tööd teha - ja teate, ma kasutan oma dokumentide kirjutamiseks Microsoft Wordi. Oma toiminguteks kasutan Microsoft Outlookit. Ma mõtlen, et mul on tööriistu ülesannete täitmiseks. Ehitame sama laadi kontseptsiooni, ehitame andmebaaside administraatoritele ja arendajatele tööriistu, mis aitavad neil keskenduda sellele, mida nad tahavad teha, mitte sellele, kuidas nad seda tegema peavad.

Eric Kavanagh: See on mõistlik, kuid lubage mul pöörduda meie asjatundjate poole ja inimesed võiksid julgelt sukelduda. Oleme paar vaatajaskonna kommentaari saanud. Võib-olla, Dez, paar küsimust ja Robin paar küsimust?

Dez Blanchfield: Muidugi. Üks esimesi küsimusi, mille tahan teile visata, võttes arvesse teie tohutut kogemustepagasit, kas näete varsti ajahetke, kui mõni neist juhtub aeglustuma? Või arvate, et oleme tõesti just selle pideva kasvutendentsi alguspunktis? Ma arvan, et üks suurimaid probleeme, millega ettevõtted silmitsi seisavad, ja siis alati, kui inimesed, kes proovivad toetada tehnoloogiat, mida neile ettevõtetele ette näha, on see, et muutuste määr on nii dramaatiline, et nad lihtsalt ei suuda kõigiga sammu pidada erinevad funktsioonid ja tarkvara ning süsteemid ja raamistikud ning arhitektuurid ja uus kood tulemas ning seejärel selle all olev riistvara, kas näete, et praegune muutuste tempo aeglustub kohe? Ma mõtlen, et teil on kogu IDERA komplektiga nii lai valik platvorme, kas me peatselt aeglustame või liigume selles hullumeelses põgenevas kaubarongis veel pikka aega?

Bert Scalzo: Arvan, et oleme sellest kasvukõverikust esimese 20 protsendi juures ja meil on veel pikk tee minna ning seda suruvad kaks asja. Tehnoloogia areneb pidevalt. Olete maininud mõnda uut mälu, mis ilmub, see saab olema fantastiline. Samsungi käes on peagi 20-terabaidine välkmälu. See muudab asju. Meil on olemas kõik need NoSQL ja pilveandmebaasid, see lihtsalt jätkub. Üks asi, mis on siiski naljakas, on see, kui ma vaatan selliseid andmebaase nagu Oracle ja SQL Server ning mõnda muud, siis pole need tegelikult enam relatsiooniandmebaasid. Saan struktureerimata andmeid Oracle'i panna ja säilitada siiski ACID-vastavuse. Kui oleksite mulle öelnud, et 20 aastat tagasi, siis ma lihtsalt ütleksin, et olete narkootikumidega seotud.

Dez Blanchfield: Jah, jah, need on lahedad. Noh, isegi need mootorid, millel on üsna kena nišš vertikaal nagu GIS, on lihtsalt paremad kui loomulikud võimalused nüüd. Tegite mõned suurepärased kommentaarid väljakutsete kohta, millega DBA-d silmitsi seisavad, ja DBA-de erinevate aegade suhtes, mida loodame kohapeal näha, kuid kuidas näeb välja maailm, kui just selline teie ettevõtte kiht on teie jaoks? Ma mõtlen, et need on inimesed, kes kasutavad erinevaid platvorme alates teie diagnostikahaldurist kuni inventeerimisvahenditeni ja kuni defragmenteerimiseni, kuidas DBA-d selle muudatusega hakkama saavad ja kuidas need lahenevad - teate , mida nad teevad teie tööriistadega, et tulla toime selle olulise muutusega nende maastikul?

Bert Scalzo: Noh, ma lähen tagasi peaaegu 20 aastat tagasi, siis ütlen, et DBA-d lahendavad organisatsioonis väga spetsiifilise rolli. Tavaliselt töötavad nad ühe, võib-olla kahe andmebaasiplatvormiga ja haldasid suhteliselt vähe andmebaase. Tänaseks ja andmebaasi administraatoriks sirvides õpib ta tegelikult tundma 10 andmebaasi platvormi. Ta haldab mõnel juhul tuhandeid andmebaase ja see pole nali. see on rohkem SQL Serveri või MySQLi maailmas. Kuid ikkagi võiksid nad Oracle'i maailmas hallata sadu andmebaase. Ja nii on neil kõik need uued funktsioonid välja tulnud, neil on kõik need uued platvormid ja kõik need andmebaasid, mille eest nad vastutavad. Nad otsivad tööriistu, mis võimaldaksid nende tootlikkust ja aitaksid neil ka mõnda asja õppida.

Ja ma annan teile näite - kui ma tahan tabeli sektsioonida, on see üsna varjatud süntaks ja kui ma tahan selle osadeks jagada, läheb süntaks veelgi raskemaks. Ma tean, mida ma teha tahan, ma tahan ämbrid luua. Kui mul on selline tööriist nagu DBArtisan, mis ütleb: „Hei, siin on kena ekraan, mis võimaldab teil keskenduda pigem sellele, mida proovite teha, kui sellele, mida proovite teha, ja oh, muide, Näita SQL nuppu, kui olete lõpetanud, ja me näitame teile, milline oli SQL, et saaksite hakata seda tegelikult õppima ja seda valdama.

DBA-d leiavad, et tööriistad, mis aitavad neil tööd teha, aga aitavad õpetada neile kogu seda uut kraami, mida nad kasutavad, ja sama oleks ka tõsi - ütleme, et ma olen Oracle'i kutt, lähen MySQL-i ja ütlen: „Olgu, looge andmebaas, DBArtisan. Näita mulle nüüd SQL-i, sest ma ei tea, mis tunne on luua MySQL-i andmebaasi ja ma õppisin just süntaksit. ”Ja nii me ei aita mitte ainult neid, et nad töötaksid kogu andmebaasi ulatuses, vaid koolitame neid ka kogu andmebaasi ulatuses.

Dez Blanchfield: See muutub veelgi huvitavamaks, kui jõuate mõne moodsama - või mitte enam kaasaegsema - see pole aus mõte öelda -, kuid ükskord on andmebaas andmebaas. Nendel päevadel näen kõike, mida te seal räägite, koos täiendava väljakutsega, milleks on tehnoloogia virnad, mida me tavaliselt näeme müüjate ja teie omamoodi avatud lähtekoodiga toodete hulgas ning et nad on head. Te ei tegele ainult andmebaasimootorite ja päringkeeltega, vaid käsitlevad ka andmetüüpe, mis on struktureeritud ja struktureerimata, teate, väljakutse, kus on vaja tegeleda kõigega, mis koosneb mitmest petaablasest koosneva HDFS-i spektri kõige otsast. keskkond väikeste pisikeste konteinerite ja pakettfailide ning erinevate logifailivormingute jaoks.

Ja ma arvan, et see on midagi, mida me praegu näeme, kus lihtsalt pole ühtegi inimest, ükskõik kui suurt hulka supermani, supernaisi, olenemata sellest, kes nad arvavad olevat, nad on füüsiliselt, nad lihtsalt ei suuda vaimselt selle muutuste määraga hakkama saada ja variatsioonide skaala. Arvan, et nüüd pakutav tööriistakomplekt jõuab punkti, kus nad asuvad peaaegu mitmel viisil vaikekomplektil, nii et me ei saa ilma nendeta andmebaasikeskkondi käitada, kuna me lihtsalt füüsiliselt ei saa nii palju keha neile peale visata. Mulle väga meeldis teie ettekanne. Ma lähen dr Robin Bloorile. Olen kindel, et tal on palju küsimusi, et ka teid visata.

Robin Bloor: Okei. Noh, mul on kindlasti küsimusi. Bert, ma ei tea, kuhu sa lähed - mul oli paar päeva tagasi tõeliselt huvitav vestlus, kus keegi hakkas mulle rääkima DU uusimast andmekaitsest ja mulle tundus nende sõnul, et see oli uskumatult uskumatu draakoniline nende asjade osas, millele nad nõudsid. Ma mõtlesin, kas te olete seda tõesti vaadanud; kas see on midagi, millega olete tuttav?

Bert Scalzo: Absoluutselt. Jah.

Robin Bloor: 2016, olgu, rääkige sellest.

Bert Scalzo: Ja ma olen tegelikult -

Robin Bloor: Sügavalt huvitav.

Bert Scalzo: Ma töötasin tegelikult mõnda aega välklambi müüja juures, nende andmebaaside piirkonnas, aidates neil andmebaaside jaoks välkprodukte luua ja võin teile öelda, et draakon läheb täielikult alla. Ma mõtlen seda, et kui mäletate oma ühte slaidi, ütlesin, et mõnes andmebaasis krüptitakse see küll, kuid see paneb serverimällu ja mõnes andmebaasis krüptimise - see on endiselt serverimälus krüptitud, dekrüptitakse alles siis, kui see saadetakse kliendile. Noh, leiate ka mõned neist valitsuse standarditest, eriti siinse USA kaitseministeeriumi või sõjaväe kohta. Samuti lähevad need välgu tasemele ja nad tahavad mitte ainult teada, et toetate krüptimist ja dekrüptimist teie riistvara, aga kui keegi varastas kiibid, mis - teate, tõmbas nad asjast välja, teie serverist välja - see, mis seal on, on krüptitud ja nii et isegi kui neil on mäluruum, ei saa see olla ja nad kuni tegeliku - mitte välklambi enda, vaid üksikute kiipideni. Nad tahtsid seda kiibi kaupa teada saada, kõik oli krüptitud.

Robin Bloor: Vau. Ma mõtlen, et on palju asju, mida te teate - minu arust oli see ainult üks või kaks slaidi, aga see oli midagi, stsenaariumi, mis on minu arvates tõesti huvitav. Näiteks teabe redigeerimine peab olema natuke kaval, kui lihtsalt varjata mitmesuguseid välju, sest eriti masinõppe abil saate tänapäeval teha deduktiivseid asju, mis võimaldavad teil pinnale tuua teavet, mida te varem ei saanud.

Kui proovite kaitsta, ütleme näiteks terviseteavet, siis see on USA-s terviseteabe osas väga-väga dramaatiline reegel, kuid tegelikult saate mitmesuguseid masinõppe tehnikaid kasutades sageli välja selgitada, kes on kellegi meditsiiniline teave. tegelikult on. Ma lihtsalt mõtlesin, kas teil on selle kohta midagi öelda, sest nad kõik arvavad, et see on huvitav valdkond.

Bert Scalzo: Jah, absoluutselt ja ma kasutan seda lihtsalt näitena, ma ei taha öelda, et üks andmebaas on parem kui teine, kuid see on väga hea näide selle kohta, mida just küsisite. Kui mul ei lubata näiteks Oracle'is näha andmerida, nagu näiteks mul pole lubatud näha John Smithi haiguslugu. Kui ma ütlen Oracle'is: „Valige see kirje”, siis mind blokeeritakse või lubatakse mul näha seda, mida mul on lubatud näha, ja see redigeeritakse. Ja kui ma ütlen: „Valige tabelist konto täht, mis võrdub John Smithiga,” saan ma nulli.

SQL Serveris saab seda redigeerida, kuid sellel on mõned augud. Kui ma ütlen: "Valige tabelist konto täht, kus see võrdub John Smithiga", siis saan selle tegelikult tagasi, nii et ma tean, et seal on John Smith. Üks on turvalisem kui teine. Nüüd loodan, et nad selle parandavad, mängivad nad alati üksteisega hüppega konna. Ja jällegi, ma ei ürita andmebaaside vahel vahet teha, vaid näidata näidet - vaadake, millest me praegu räägime, midagi nii lihtsat kui valitud konto tuleb redigeerimise teel ka lõigata, ehkki tehniliselt rääkides pole midagi redigeeritavat peale rea olemasolu.

Robin Bloor: Jaa, muidugi. See on omamoodi huvitav. Ma mõtlen, et veel üks üldine küsimus, kuna mul pole palju aega, on tegelikult seotud vaid parandustega.Ma mõtlen, et olete viibinud ühes kohas, kus ma tean, et olete meile näiteid esitanud erinevate testitulemuste kohta - kas arvate, et traditsioonilised andmebaasid, nimetagem neid domineerivateks andmebaasideks, SQL Server ja Oracle, arvad, et nad jäävad enne valmimist edasi? Või arvate, et nad satuvad tegelikult turule ühe või teise mitmesuguse häire tõttu, mis neid tegelikult tabab? Mis on Sinu arvamus?

Bert Scalzo: Mul on oma arvamus ja see on - teate, ma ütlen jälle, et see on minu arvamus - näiteks Microsoft avaldab Ballmeri järgsel ajastul muljet just elavale põrgule. Ma mõtlen seda venivat andmebaasi, kuidas saada SQL Server Linuxile, saada .NET üle Linuxile, saada PowerShell Linuxile; Ma ei usu, et traditsioonilised andmebaasimüüjad tahaplaanile jäävad. Ma arvan, et nad on otsustanud: “Hei, laske uutel kuttidel, startupidel midagi määratleda. Laske neil aru saada, mis varjutamine on ja kuidas seda täiustada tuleks. Pärast kõigi uuringute ja arendustegevuse lõppu teame täpselt, mida kasutajad soovivad, lisame nüüd varjamise Oracle'ile. ”Ma arvan, et nad saavad lihtsalt nutikaks ja öeldes: "Hei, teiseks või kolmandaks olemine pole halb, kui oled domineeriv mängija, sest siis ei rända inimesed teist ära."

Robin Bloor: Jah, ma mõtlen, et see on strateegia, mida on kasutatud. Ma mõtlen, et IBM on seda harjunud ja kogu - kogu nende tootevaliku jaoks - ja see hindab mõistlikult hästi, kuni keegi tuleb välja millegi sellisega, mis on täiesti seina taga, mida keegi pole kunagi mõelnud, kuid mida te ei saa planeerida selle vastu igatahes.

Küsimused publikult, Eric?

Eric Kavanagh: Jah, aga sul on aega, ma mõtlen, et ainult ühe jaoks ja ma tean, et Bert peab jooksma. Siin oli midagi - okei, Oracle 12c varjundiarhitektuur on see viide - või mis on see teie arvates viide sellele, mis teie arvates seal toimub?

Bert Scalzo: Noh, Oracle absorbeerib ja / ja pakub kõike seda, mida kõik muud andmebaasi müüjad on. Näiteks võin ma Oracle'i sisestada struktureerimata andmed. Ma ei tea, kuidas saate struktureerimata andmeid sisestada ja seejärel relatsiooniandmebaasiks nimetada, nii et sellel pole mingit mõtet, aga saate. Ja nüüd lisab Oracle varjestamist, nii et Oracle ütleb: “Tead mida? Mida iganes turg soovib, teeme oma andmebaasi pakkumise, sest turg soovib seda, mida turg soovib ja soovime lahenduse pakkuda, tahame, et nad jääksid meie juurde. ”

Arvan, et näete veel üksusi. Ma ei imestaks, kui nägin Hadoopi-laadseid andmebaasisõlmede rühmitusi mitte Oracle'i rackis või päris rakenduste klastris, vaid põhimõtteliselt enam kui traditsioonilises Hadoopi tüüpi klastris, mis seda varjestamist teeb. Ja nii et ma arvan, et teil on võimalik Oracle-taolist andmebaasi juurutada nagu Hadoopi puhul, ja sellised suundumused jätkuvad. Need suured andmebaaside müüjad teenivad miljardeid dollareid ja nad ei taha oma turgu kaotada, seega on nad nõus ükskõik millega kohanema või midagi vastu võtma.

Eric Kavanagh: Noh, teate, see on naljakas, sest olen juba mõnda aega jälginud avatud lähtekoodiga müüjaid ja mõelnud, et kui suurt mõju sellel on traditsioonilisele suletud uste tehnoloogiale ja mõnda aega tundis see kindlasti avatud lähtekoodiga müüjad tegid tõsiseid edusamme ja nüüd, kui ma turgu vaatan, näen ma midagi sellist, mida sa räägid: suured poisid on teinud oma matemaatikat, teritanud oma pliiatseid ja nad mõistsid, kuidas nad saavad kududa palju seda kraami nende arhitektuuridesse. Ükskõik, kas see on IBM, Oracle või SAP - olin just eelmisel kuul SapphireNow konverentsil ja Steve Lucas, kes juhib poolt seda ettevõtet, uhkustas, et SAP sisaldab nende HANA pilveplatvormis nüüd rohkem avatud lähtekoodiga komponente kui ükski nende võistlejad. Kui teete seda matemaatikat, on see üsna muljetavaldav avaldus ja see ütleb mulle, et suured poisid ei lähe peagi kuhugi.

Bert Scalzo: Ei, ma panustaksin oma rahaga mõlemale. Ma mõtlen, et kui vaadata, oli Microsofti aktsia hiljuti umbes 50 dollarit ja teate, mõni aasta tagasi oli see 25. Te ei kahekordista oma aktsia hinda lühikese aja jooksul, kui teete häid asju ja tean, see, et teeme kõike alates Windows 10 esmaaastasest tasuta kasutamisest ja lõpetades kõigi muude nutikate asjadega, on minu arvates see veniva andmebaasi funktsioon lihtsalt fenomenaalne. Ma arvan, et see, mis juhtub, on see, et paljud inimesed satuvad Azure'i, mitte otse, mitte nagu nad ütlesid: “Liigutame mu andmebaasi üle Azure'i.” See migreerub sinna võluväel, sest see arhiivitakse seal kasutades seda uut venitatavat andmebaasi funktsiooni ja nii läheb Azure'i kasutuselevõtt lihtsalt kiiresti tõusma.

Eric Kavanagh: Noh, see on üks turu suundumusi, mida isegi teie Macis näen. Kui lähete oma Macis mõnda dokumenti salvestama, on need nüüd olemas - ja uuemad Macid jälgivad neid lihtsalt läbi pilve, eks? Ma mõtlen, et sellel strateegial on palju mõtet ning ma vaatan seda ka ja lähen: “Okei, kutid, proovite mind tükkhaaval oma pilvekeskkonda meelitada ja siis ühel päeval, kui ma tahan mõnda filmi vaadata, kui mu krediitkaart on aegunud, jään hätta. ”

Bert Scalzo: Jah, aga sa teed seda edasi.

Eric Kavanagh: Jah. See on tõsi.

Bert Scalzo: Paned kõik peale.

Eric Kavanagh: Noh, mitte päris kõik.

Bert Scalzo: Ei, ma mõtlen ...

Eric Kavanagh: Jah, mine edasi.

Bert Scalzo: Need sotsiaalsed suundumused on jõudmas ettevõtetesse. Nüüd on ettevõtetel veel palju muud vajalikku teha, kuid nad näevad neid suundumusi ja teevad samamoodi. Ma ei näe, et Oracle või Microsoft kaoksid. Tegelikult hakkan ostma aktsiaid mõlemal korral, kui vähegi saab.

Eric Kavanagh: Jah, tõesti. Noh, inimesed, minge saidile idera.com, I-D-E-R-A dot com. Nagu Bert ütles, on neil seal terve hunnik tasuta kraami ja see on üks uutest suundumustest turul - andke teile tasuta kraami, millega mängida, saate konksu otsa ja siis ostate päris asju.

Inimesed, see on olnud veel üks kuum tehnoloogia. Täname teid aja eest, Bert, muidugi Dez ja ka Robin. Me räägime teiega järgmisel nädalal, inimesed, palju kraami toimub. Kui teil on ideid, võtke julgesti enda vastu,. Järgmisel korral räägime teiega, hoolitsege. Headaega.