Scientist vs Inxhinier i të Dhënave, cili është ndryshimi?

Shkencëtarët dhe inxhinierët e të dhënave mund të jenë tituj të rinj të punës, por rolet thelbësore të punës kanë qenë për ca kohë. Tradicionalisht, kushdo që ka analizuar të dhënat do të quhej "analist i të dhënave" dhe kushdo që krijoi platforma backend për të mbështetur analizën e të dhënave do të ishte një "Zhvillues i Inteligjencës së Biznesit" (BI).

Me shfaqjen e të dhënave të mëdha, rolet e reja filluan të shfaqen në korporata dhe qendra kërkimore - domethënë, Shkencëtarët e të Dhënave dhe Inxhinierët e të Dhënave.

Këtu është një përmbledhje e roleve të Analistit të të Dhënave, BI Developer, Scientist dhe Inxhinierit të të Dhënave.

Analisti i të dhënave

Analistët e të dhënave janë profesionistë me përvojë të të dhënave në organizatën e tyre të cilët mund të kërkojnë dhe përpunojnë të dhënat, japin raporte, përmbledhin dhe vizualizojnë të dhënat. Ata kanë një kuptim të fortë se si të shfrytëzojnë mjetet dhe metodat ekzistuese për të zgjidhur një problem, dhe t'i ndihmojnë njerëzit nga e gjithë ndërmarrja të kuptojnë pyetje specifike me raporte dhe grafika ad-hoc.

Sidoqoftë, ata nuk pritet të merren me analizimin e të dhënave të mëdha, dhe as që zakonisht pritet të kenë sfondin matematikor ose kërkimor për të zhvilluar algoritme të reja për probleme specifike.

Shkathtësitë dhe mjetet: Analistët e të dhënave duhet të kenë një kuptim bazë të disa aftësive themelore: statistika, mungesa e të dhënave, vizualizimi i të dhënave, analiza e të dhënave hulumtuese, Microsoft Excel, SPSS, SPSS Modeler, SAS, SAS Miner, SQL, Microsoft Access, Tableau, SSAS .

Zhvilluesit e inteligjencës së biznesit

Zhvilluesit e Inteligjencës së Biznesit janë ekspertë të të dhënave që bashkëveprojnë më ngushtë me palët e interesuara të brendshme për të kuptuar nevojat e raportimit, dhe më pas për të mbledhur kërkesat, hartimin dhe ndërtimin e BI dhe zgjidhjeve të raportimit për kompaninë. Ata duhet të hartojnë, zhvillojnë dhe mbështesin depot e reja dhe ekzistuese të të dhënave, paketat ETL, kube, pult, dhe raporte analitike.

Për më tepër, ata punojnë me bazat e të dhënave, si relacionale, ashtu edhe shumëdimensionale, dhe duhet të kenë aftësi të shkëlqyera të zhvillimit të SQL për të integruar të dhëna nga burime të ndryshme. Ata përdorin të gjitha këto aftësi për të përmbushur nevojat e vetë-shërbimit të ndërmarrjes. Zhvilluesit e BI zakonisht nuk pritet të kryejnë analiza të të dhënave.

Shkathtësitë dhe mjetet: ETL, zhvillimi i raporteve, OLAP, kube, inteligjenca në internet, dizenjimi i objekteve të biznesit, Tabela, mjetet e pultit, SQL, SSAS, SSIS.

Inxhinier i të Dhënave

Inxhinierët e të dhënave janë profesionistë të të dhënave që përgatisin infrastrukturën e "të dhënave të mëdha" për t'u analizuar nga Shkencëtarët e të Dhënave. Ata janë inxhinierë softuerësh që hartojnë, ndërtojnë, integrojnë të dhëna nga burime të ndryshme dhe menaxhojnë të dhëna të mëdha. Pastaj, ata shkruajnë pyetje komplekse për këtë, sigurohuni që është lehtësisht e arritshme, funksionon pa probleme, dhe qëllimi i tyre është optimizimi i performancës së ekosistemit të madh të të dhënave të kompanisë së tyre.

Ata gjithashtu mund të ekzekutojnë disa ETL (Ekstrakt, Transformim dhe Ngarkesë) në krye të të dhënave të mëdha dhe të krijojnë depo të mëdha të të dhënave që mund të përdoren për raportim ose analizë nga shkencëtarët e të dhënave. Përtej kësaj, sepse Inxhinierët e të Dhënave përqendrohen më shumë në hartimin dhe arkitekturën, ata zakonisht nuk pritet të dinë ndonjë mësim makinerie ose analitikë për të dhëna të mëdha.

Aftësi dhe mjete: Hadoop, MapReduce, Hive, Pig, MySQL, MongoDB, Cassandra, streaming streaming, NoSQL, SQL, programim.

Shkencëtar i të dhënave

Një shkencëtar i të dhënave është alkimisti i shekullit XXI: dikush që mund t'i shndërrojë të dhënat e papërpunuara në pasqyra të pastra. Shkencëtarët e të dhënave aplikojnë statistikat, mësimin e makinerive dhe metodat analitike për zgjidhjen e problemeve kritike të biznesit. Funksioni i tyre kryesor është të ndihmojnë organizatat të shndërrojnë vëllimet e tyre të të dhënave të mëdha në njohuri të vlefshme dhe të veprueshme.

Në të vërtetë, shkenca e të dhënave nuk është domosdoshmërisht një fushë e re, vetvetiu, por mund të konsiderohet si një nivel i përparuar i analizës së të dhënave që drejtohet dhe automatizohet nga mësimi i makinerive dhe shkenca e kompjuterave. Me një fjalë tjetër, në krahasim me analyst analistët e të dhënave ’, përveç aftësive analitike të të dhënave, Shkencëtarët e të dhënave pritet të kenë aftësi të forta programimi, një aftësi për të hartuar algoritme të reja, të trajtojnë të dhëna të mëdha, me disa ekspertizë në njohuritë e domenit.

Për më tepër, Shkencëtarët e të Dhënave gjithashtu pritet të interpretojnë dhe japin elokuencën e rezultateve të gjetjeve të tyre, përmes teknikave të vizualizimit, ndërtimit të aplikacioneve për shkencë të të dhënave ose duke rrëfyer histori interesante në lidhje me zgjidhjet për problemet e tyre të të dhënave (biznesit).

Shkathtësitë e zgjidhjes së problemit të një shkencëtari të të dhënave kërkojnë të kuptojnë metodat tradicionale dhe të reja të analizës së të dhënave për të ndërtuar modele statistikore ose për të zbuluar modele në të dhëna. Për shembull, krijimi i një motori rekomandimi, parashikimi i tregut të aksioneve, diagnostikimi i pacientëve bazuar në ngjashmërinë e tyre, ose gjetja e modeleve të transaksioneve mashtruese.

Shkencëtarët e të dhënave ndonjëherë mund të paraqiten me të dhëna të mëdha pa ndonjë problem të veçantë biznesi në mendje. Në këtë rast, Scientist kurioz i të Dhënave pritet të hulumtojë të dhënat, të dalë me pyetjet e duhura dhe të sigurojë gjetje interesante! Kjo është e ndërlikuar sepse, për të analizuar të dhënat, një shkencëtar i fortë i të dhënave duhet të ketë një njohuri shumë të gjerë të teknikave të ndryshme në mësimin e makinerive, minierat e të dhënave, statistikat dhe infrastrukturat e mëdha të të dhënave.

Ata duhet të kenë përvojë duke punuar me grupe të ndryshme të të dhënave me madhësi dhe forma të ndryshme, dhe të jenë në gjendje të ekzekutojnë algoritmet e tij në të dhëna me madhësi të mëdha në mënyrë efektive dhe efikase, që zakonisht nënkupton të qëndroni në azhurnim me të gjitha teknologjitë më të fundit të fundit. Kjo është arsyeja pse është thelbësore të njohësh bazat e shkencës kompjuterike dhe programimin, përfshirë përvojën me gjuhët dhe teknologjitë e të dhënave (të mëdha / të vogla).

Shkathtësitë dhe mjetet: Python, R, Scala, Apache Spark, Hadoop, mjetet dhe algoritmet e minierave të të dhënave, mësimi i makinerisë, statistikat.

MUORO - Të dhëna & Analytics Genius muoro.io