Big Data vs Depot e të Dhënave. Cili është ndryshimi?

Teknologjia përparon me një ritëm që është e pamundur të vazhdosh, dhe drejtuesit e teknologjisë së plakjes së shpejti do të zbulojnë se të gjitha ato klasa universitare të teknologjisë po bëhen shumë të vjetruara. Nëse jeni një Zyrtar Kryesor i Teknologjisë (CTO) në një firmë të madhe, nuk keni një kohë të gjatë për të mësuar rreth teknologjive të reja sepse jeni shumë të zënë me luftimin e zjarreve dhe sigurohuni që të dukeni mirë në takimin e ardhshëm të bordit në përpara të gjithë njerëzve të tjerë që janë duke u përpjekur të bëjnë të njëjtën gjë. Në një moment në kohë, ju mund të gjeni veten duke pyetur: cili është ndryshimi midis të dhënave të mëdha kundrejt depove të të dhënave?

Professionaldo profesionist i teknologjisë do të njihet me atë që është një bazë e të dhënave. Simplyshtë thjesht një koleksion i të dhënave që rritet me kalimin e kohës, dhe nga të cilat mësoni gjëra interesante duke kërkuar. Pastaj ekziston nocioni i një depoje të të dhënave që nënkupton emri. Le të mos hyjmë në tërë bisedën "Kimball vs Inmon" dhe ta mbajmë këtë thjeshtë.

Një depo e të dhënave është një numër i të dhënave të ndryshme në një organizatë që mund të lidhen me një çelës të përbashkët. Për shembull, ne mund të lidhim rekorde nëpër baza të të dhënave të shumta duke përdorur një fushë unike të quajtur CUSTOMER_ID. Këtu janë bazat e të dhënave në departamente të ndryshme ku ekzistojnë regjistrime që ne mund të dëshirojmë të lidhim duke përdorur CUSTOMER_ID:

Duke përdorur CUSTOMER_ID, atëherë mund të printoni lehtësisht në një faqe të vetme, një listë të të gjitha faturave që nuk janë paguar dhe një listë të 10 kërkesave më të fundit të shërbimit që një person i shitjeve mund t'i marrë me vete në një takim shitjesh. Sigurisht, sot ne thjesht përdorim Salesforce për të gjitha këto, por ky shembull i thjeshtë ju jep një ide se sa e dobishme mund të jetë lidhja e burimeve të ndryshme të të dhënave. Kjo është ajo që depot e të dhënave kanë të bëjnë me të, përveçse e bëjnë atë një hap më tej dhe përdorin të dhënat e lidhura për të marrë vendime në nivele shumë të larta. Kur ndërtoni një depo të të dhënave, zakonisht dini se cilat pyetje mund të dëshironi t'i përgjigjeni sepse një person i nivelit C po kërkon disa Tregues kryesorë të performancës (KPI) për t'u matur. Ju nuk do të ndërtoni depo të të dhënave për ndërtimin e tyre sepse është një detyrë e shtrenjtë. Tani, le të flasim për "të dhënat e mëdha" dhe depot e të dhënave.

Gjëja e parë që duhet të përcaktojmë është termi "të dhëna të mëdha", i cili e përkufizon shumë vetë. Me siguri keni dëgjuar statistikën e cituar shpesh që 98% e të gjitha të dhënave janë krijuar në 2 vitet e fundit. Këto janë të dhëna të mëdha Të gjitha grupet marramendëse të shterjes së të dhënave që tani po gjenerohen mund të minohen (mbani mend të dhënat e mihjes?) Për të nxjerrë njohuri. Në botën e sotme të teknologjisë së lartë, ne mund të dëshirojmë të krijojmë njohuri që nuk e dimë se ekzistojnë. Donald Rumsfeld i quajti me mençuri këto si "të panjohur të panjohur", gjëra për të cilat ne nuk dimë se nuk dimë rreth tyre. Në botën e psikologjisë, ky koncept përmendet si Dritarja e Johari. Ju e dini atë person në shitje i cili nuk është i vetëdijshëm për faktin se ekzistenca e tyre e thjeshtë i bën të gjithë rreth tyre të duan të tërheqin një Peter Pan nga ngritja më e afërt? Fakti që personi nuk është i vetëdijshëm se sa të bezdisshëm janë ata - dhe fakti që njerëzit rreth këtij personi nuk mund ta vendosin saktësisht gishtin pse - është një "e panjohur e panjohur" në atë që askush nuk e di pse Rob në shitje është thjesht një i madh , dhjam, gjoks i bezdisshëm. Sidoqoftë, duke ecur përpara.

Postuar në 7wData.be.