Duomenų mokslininkas

„BrainStation“ duomenų mokslininko karjeros vadovas gali padėti žengti pirmuosius žingsnius pelningos duomenų mokslo karjeros link. Skaitykite toliau, kad gautumėte duomenų mokslo srities apžvalgą ir duomenų mokslininko darbo vaidmenį.



Tapkite duomenų mokslininku

Pasikalbėkite su mokymosi patarėju ir sužinokite daugiau apie tai, kaip mūsų stovyklos ir kursai gali padėti jums tapti duomenų mokslininku.



Spustelėdami Pateikti sutinkate su mūsų Sąlygos .



Pateikti

Nepavyko pateikti! Atnaujinti puslapį ir bandyti dar kartą?

Sužinokite daugiau apie mūsų Data Science Bootcamp

Ačiū!

Greitai susisieksime.



Peržiūrėkite „Data Science Bootcamp“ puslapį

Kas yra duomenų mokslininkas?

Duomenų mokslininkai renka, tvarko ir analizuoja didelius didelių duomenų – struktūrinių ir nestruktūruotų duomenų – rinkinius, kad sukurtų veiksmingus duomenimis pagrįstus verslo sprendimus ir planus įmonėms ir kitoms organizacijoms. Derindami matematikos, informatikos ir verslo pojūtį, duomenų mokslininkai turi turėti techninių įgūdžių apdoroti ir analizuoti didelius duomenis ir verslo sumanumo, kad atskleistų tuose duomenyse slypinčias įžvalgas.

Duomenų mokslas prieš duomenų gavybą

Yra keletas skirtumų tarp duomenų mokslo ir duomenų gavybos. Pažiūrėkime atidžiau:

Duomenų mokslas

  • Tai plati sritis, apimanti mašininį mokymąsi, dirbtinį intelektą, nuspėjamą priežastinę analizę ir įsakmiąją analizę.
  • Dirba su visų rūšių duomenimis, įskaitant struktūrinius ir nestruktūruotus duomenis
  • Siekiama kurti į duomenis orientuotus produktus ir priimti duomenimis pagrįstus sprendimus
  • Daugiausia dėmesio skiriama moksliniam duomenų ir modelio tyrimui

Duomenų gavyba

  • Tai duomenų mokslo pogrupis, apimantis duomenų valymą, statistinę analizę ir modelių atpažinimą, o kartais apima duomenų vizualizavimą, mašininį mokymąsi ir duomenų transformavimą.
  • Visų pirma susijęs su struktūriniais, o ne su nestruktūriniais duomenimis
  • Siekiama paimti duomenis iš įvairių šaltinių ir padaryti juos tinkamu naudoti
  • Dėmesys verslo praktikai

Ką veikia duomenų mokslininkas?

Duomenų mokslininkas analizuoja didelius duomenų rinkinius, kad atskleistų modelius ir tendencijas, kurios veda į veiksmingą verslo įžvalgą ir padeda organizacijoms išspręsti sudėtingas problemas arba nustatyti pajamų ir augimo galimybes. Duomenų mokslininkas gali dirbti beveik visose srityse ir turi būti įgudęs tvarkyti struktūrizuotus ir nestruktūruotus duomenų rinkinius. Tai daugiadisciplinis darbas ir norėdami tapti duomenų mokslininku, turite turėti matematikos, informatikos, verslo ir komunikacijos supratimą, kad galėtumėte efektyviai atlikti savo darbą.



Nors konkrečios duomenų mokslininko pareigos ir atsakomybė labai skirsis priklausomai nuo pramonės, pareigų ir organizacijos, dauguma duomenų mokslininko pareigų apims šias atsakomybės sritis:

Tyrimas

Duomenų mokslininkas turi suprasti pramonės ir individualios įmonės galimybes ir skaudulius.

Duomenų paruošimas

Kad būtų galima rasti bet kokių vertingų įžvalgų, duomenų mokslininkas turi apibrėžti, kurie duomenų rinkiniai yra naudingi ir svarbūs, prieš rinkdamas, ištraukdamas, valydamas ir taikydamas struktūrizuotus ir nestruktūrizuotus duomenis iš įvairių šaltinių.



Modelių ir algoritmų kūrimas

Naudodamas mašininio mokymosi ir dirbtinio intelekto principus, duomenų mokslininkas turi gebėti sukurti ir taikyti algoritmus, reikalingus automatizavimo priemonėms įgyvendinti.

Duomenų analizė

Svarbu, kad duomenų mokslininkas galėtų greitai analizuoti savo duomenis, kad nustatytų modelius, tendencijas ir galimybes.

Vizualizacija ir komunikacija

Duomenų mokslininkas turi sugebėti papasakoti istorijas, atrastas naudojant duomenis, kurdamas ir tvarkydamas estetiškai patrauklias informacijos suvestines ir vizualizacijas, taip pat turėti bendravimo įgūdžių, kad įtikintų suinteresuotąsias šalis ir kitus komandos narius, kad duomenų išvadomis verta imtis veiksmų.

Naujausiame „BrainStation“ skaitmeninių įgūdžių tyrime nustatyta, kad duomenų specialistai didžiąją laiko dalį skyrė duomenų ginčams ir valymui. Respondentai taip pat padarė išvadą, kad jų darbo tikslas dažniausiai yra esamos platformos, produkto ar sistemos optimizavimas (45 proc.) arba naujų kūrimas (42 proc.).

Duomenų mokslo rūšys

Platesnė duomenų mokslo sritis apima daugybę skirtingų disciplinų, įskaitant:

Duomenų inžinerija

Projektuoti, kurti, optimizuoti, prižiūrėti ir valdyti infrastruktūrą, kuri palaiko duomenis ir duomenų srautą visoje organizacijoje.

Duomenų paruošimas

Duomenų valymas ir transformavimas.

Duomenų gavyba

Naudojamų duomenų ištraukimas (o kartais ir valymas bei transformavimas) iš didesnio duomenų rinkinio.

Nuspėjamoji analizė

Duomenų, algoritmų ir mašininio mokymosi metodų naudojimas analizuojant įvairių galimų ateities rezultatų tikimybę, remiantis duomenų analize.

Mašininis mokymasis

Automatinis analitinio modelio kūrimas duomenų analizės procese, siekiant mokytis iš duomenų, atrasti modelius ir suteikti sistemoms galimybę priimti sprendimus be didelio žmogaus įsikišimo.

Duomenų vizualizacija

Vizualinių elementų (įskaitant grafikus, žemėlapius ir diagramas) naudojimas, kad būtų galima iliustruoti duomenų įžvalgas prieinamu būdu, kad auditorija galėtų suprasti duomenų tendencijas, nuokrypius ir modelius.

Duomenų mokslo pranašumai

Visų pramonės šakų įmonės visuose pasaulio kampeliuose vis daugiau pinigų, laiko ir dėmesio skiria duomenų mokslui ir nori į savo komandą įtraukti duomenų mokslininką. Tyrimai rodo, kad įmonės, kurios tikrai priima duomenimis pagrįstą sprendimų priėmimą, yra produktyvesnės, pelningesnės ir efektyvesnės nei konkurentės.

Duomenų mokslas yra labai svarbus padedant organizacijoms nustatyti tinkamas problemas ir galimybes, kartu padedant susidaryti aiškų vaizdą apie klientų ir klientų elgesį ir poreikius, darbuotojų ir produktų našumą bei galimas ateities problemas.

Duomenų mokslas gali padėti įmonėms:

  • Priimkite geresnius sprendimus
  • Sužinokite daugiau apie klientus ir klientus
  • Pasinaudokite tendencijomis
  • Numatykite ateitį

Kaip duomenų mokslas gali pagerinti įmonės vertę?

Duomenų mokslas yra tokia vis populiaresnė investicija įmonėms, nes potenciali IG, atlaisvinant didelių duomenų vertę, yra didžiulė. Duomenų mokslas yra verta investicija, nes:

    Tai pašalina spėliones ir suteikia veiksmingų įžvalgų.Įmonės priima geresnius sprendimus remdamosi duomenimis ir kiekybiškai įvertinamais įrodymais.Įmonės geriau supranta savo vietą rinkoje.Duomenų mokslas padės įmonėms analizuoti konkurenciją, tyrinėti istorinius pavyzdžius ir pateikti skaičiais pagrįstas rekomendacijas.Jis gali būti panaudotas siekiant nustatyti geriausius talentus.Dideliuose duomenyse slypi daug įžvalgų apie produktyvumą, darbuotojų efektyvumą ir bendrą našumą. Duomenys taip pat gali būti naudojami talentams įdarbinti ir mokyti.Sužinosite viską apie savo tikslinę auditoriją, klientą ar vartotoją.Dabar visi generuoja ir renka duomenis, o įmonės, kurios tinkamai neinvestuoja į duomenų mokslą, tiesiog surenka daugiau duomenų, nei žino, ką daryti. Įžvalgos apie buvusių ar potencialių klientų elgseną, prioritetus ir pageidavimus yra neįkainojamos, ir jie tiesiog laukia, kol kvalifikuotas duomenų mokslininkas atras.

Duomenų mokslininkų atlyginimai

Nors duomenų mokslininkų atlyginimai labai skiriasi priklausomai nuo regiono ir pramonės šakos, vidutinis duomenų mokslininko atlyginimas JAV, priklausomai nuo šaltinio, yra nuo 96 000 iki 113 000 USD. Vyresnysis duomenų mokslininkas vidutiniškai gali atnešti apie 130 000 USD.

Duomenų mokslininkų paklausa

„Data Scientists“ turi didelę paklausą ir jų trūksta beveik visose pramonės šakose. Deloitte Access Economics ataskaitoje nustatyta, kad 76 procentai įmonių per ateinančius metus planuoja padidinti išlaidas duomenų analizės galimybėms, o IBM prognozavo, kad dešimtmečio pradžioje duomenų mokslo paklausa padidės 28 procentais.

JAV darbo statistikos biuras prognozavo, kad per ateinančius 10 metų duomenų mokslas išaugs 31 proc. Tuo tarpu Rinkų ir rinkų ataskaitoje nustatyta, kad prognozuojama, kad pasaulinė didelių duomenų rinka iki 2025 m. išaugs iki 229,4 mlrd. USD, o duomenų mokslo platforma iki 2024 m. išaugs 30 proc.

Panašu, kad visur pasaulyje augs investicijos į duomenų mokslą, o kartu ir duomenų mokslininkų paklausa.

Kokius įrankius naudoja duomenų mokslininkai?

Duomenų mokslininkai naudoja įvairius įrankius ir programas veiklai, įskaitant duomenų analizę, duomenų valymą ir vizualizacijų kūrimą.

Python yra geriausia duomenų mokslininkų programavimo kalba, apklausta BrainStation Digital Skills Survey. Bendrosios paskirties programavimo kalba Python yra naudinga nacionalinės kalbos apdorojimo programoms ir duomenų analizei. R taip pat dažnai naudojamas duomenų analizei ir duomenų gavybai. Sunkesniam skaičių traiškymui populiarūs yra „Hadoop“ pagrįsti įrankiai, tokie kaip „Hive“. Mašininiam mokymuisi duomenų mokslininkai gali rinktis iš daugybės įrankių, įskaitant h2o.ai, TensorFlow, Apache Mahout ir Accord.Net. Vizualizacijos įrankiai taip pat yra svarbi duomenų mokslininko arsenalo dalis. Tokios programos kaip „Tableau“, „PowerBI“, „Bokeh“, „Plotly“ ir „Infogram“ padeda „Data Scientists“ sukurti vizualiai patrauklias diagramas, šilumos žemėlapius, grafiką, sklaidos diagramas ir kt.

Duomenų mokslininkai taip pat turėtų labai gerai dirbti su SQL (naudojama įvairiose platformose, įskaitant MySQL, Microsoft SQL ir Oracle), ir skaičiuoklių programas (paprastai Excel).

Kokių įgūdžių reikia duomenų mokslininkams?

Yra keletas įgūdžių, kuriuos visi siekiantys duomenų mokslininkai turėtų išsiugdyti, įskaitant:

    Excel.„Excel“, 66 procentų „BrainStation Digital Skills Survey“ apklaustų duomenų specialistų dažniausiai naudojama priemonė duomenų mokslininkams vis dar yra labai svarbi.SQL.Ši užklausų kalba yra būtina duomenų bazių valdymui ir ją naudoja maždaug pusė duomenų respondentų.Statistinis programavimas.„Python“ ir „R“ duomenų mokslininkai dažniausiai naudoja bandymams atlikti, modeliams kurti ir didelių duomenų rinkinių analizei atlikti.Duomenų vizualizacija.Tokie įrankiai kaip „Tableau“, „Plotly“, „Bokeh“, „PowerBl“ ir „Matplotlib“ padeda duomenų mokslininkams sukurti įtikinamus ir prieinamus vaizdinius savo išvadų vaizdus.

Duomenų mokslininko karjeros keliai

Duomenų mokslininko, kaip gana naujos profesijos, karjeros keliai nėra surašyti akmenyje, o daugelis žmonių atranda kelią į duomenų mokslą iš kompiuterių mokslo, IT, matematikos ir verslo sričių. Tačiau keturios pagrindinės duomenų mokslininko karjeros kryptys yra duomenys, inžinerija, verslas ir produktas. Daugeliui daugiadisciplinių duomenų mokslo vaidmenų reikia įvaldyti kelias arba visas šias sritis.

Duomenų mokslo srityje dirbantys žmonės yra technologinių pokyčių, kurie turės didžiausią įtaką ateičiai, priešakyje. Kadangi duomenų mokslas gali prisidėti prie pažangos beveik visose kitose srityse, duomenų mokslininkai gali toliau tirti viską nuo finansų ir prekybos iki aktuarinės statistikos, žaliosios energijos, epidemiologijos, medicinos ir farmacijos, telekomunikacijų – sąrašas yra beveik begalinis. Kiekviena pramonės šaka naudoja savo skirtingų tipų duomenis, įvairiais būdais panaudodama juos skirtingiems tikslams pasiekti. Kad ir kur tai atsitiktų, duomenų mokslininkai gali padėti priimti geresnius sprendimus, nesvarbu, ar tai būtų produktų kūrimas, rinkos analizė, santykių su klientais valdymas, žmogiškieji ištekliai ar kažkas kita.

Duomenų mokslo programos yra ne tik plačios, liečiančios daugybę skirtingų sektorių, bet yra ir įvairių duomenų mokslo tipų. Visoms šioms veikloms būdinga tai, kad visos jos bando duomenis paversti žiniomis. Tiksliau, duomenų mokslininkai naudoja metodinį metodą neapdorotiems duomenims tvarkyti ir analizuoti, kad nustatytų modelius, iš kurių galima atpažinti ar gauti išvados naudingą informaciją.

Atsižvelgiant į jų poveikio mastą, nenuostabu, kad duomenų mokslininkai užima labai įtakingas ir labai paklausias pozicijas. Nors kelias tapti duomenų mokslininku gali būti sudėtingas, dabar siekiantiems duomenų mokslininkams yra daugiau išteklių nei bet kada anksčiau ir jiems daugiau galimybių kurti norimą karjerą.

Tačiau atsižvelgiant į visus būdus, kuriais duomenų mokslininkai gali prisidėti prie skirtingų pramonės šakų ir visų skirtingų duomenų mokslininko karjeros kelių, jų atliekamus darbus galima suskirstyti į keletą pagrindinių kategorijų. Ne visi duomenų mokslai puikiai tinka šioms grupėms, ypač kompiuterių mokslo priešakyje, kur nuolat laužomos naujos vietos, tačiau jie suteiks jums supratimo apie tai, kaip duomenų mokslininkai duomenis paverčia įžvalga.

Statistika

Duomenų mokslo centre statistika yra matematikos sritis, apibūdinanti skirtingas duomenų rinkinio charakteristikas, nesvarbu, ar tai skaičiai, žodžiai, vaizdai ar kita išmatuojama informacija. Didžioji statistikos dalis yra skirta paprasčiausiai identifikuoti ir aprašyti, kas ten yra – ypač esant labai dideliems duomenų rinkiniams, tiesiog žinoti, ką informacija sudaro ir ko neapima, yra užduotis savaime. Duomenų mokslo srityje tai dažnai vadinama aprašomąja analitika. Tačiau statistika gali žengti dar toliau, tikrinant, ar jūsų prielaidos apie tai, kas yra duomenyse, yra teisingos, arba, jei jos teisingos, ar tai reikšminga, ar naudinga. Tai gali apimti ne tik duomenų ištyrimą, bet ir manipuliavimą jais, kad būtų atskleistos svarbiausios jų savybės. Yra daug skirtingų būdų tai padaryti – tiesinė regresija, logistinė regresija ir diskriminacinė analizė, skirtingi atrankos metodai ir pan. atspindi tam tikrą prasmingą tiesą apie pasaulį, kurį jie atitinka.

Duomenų analizė

Nors ji pagrįsta statistikos pagrindu, duomenų analizė eina šiek tiek toliau, kalbant apie priežastingumo supratimą, vizualizavimą ir išvadų perdavimą kitiems. Jei statistikos tikslas yra apibrėžti duomenų rinkinio kas ir kada, duomenų analizė bando nustatyti, kodėl ir kaip. Duomenų analitikai tai daro išvalydami duomenis, juos apibendrindami, transformuodami, modeliuodami ir išbandydami. Kaip minėta pirmiau, ši analizė neapsiriboja vien skaičiais. Nors daugeliui duomenų analizės naudojami skaitiniai duomenys, taip pat galima atlikti ir kitų tipų duomenų analizę – pavyzdžiui, rašytinį klientų atsiliepimą, socialinių tinklų įrašus ar net vaizdus, ​​garso ir vaizdo įrašus.

Vienas iš pagrindinių duomenų analitikų tikslų yra suprasti priežastinį ryšį, kurį vėliau galima panaudoti norint suprasti ir numatyti tendencijas įvairiose programose. Atlikdami diagnostinę analizę, duomenų analitikai ieško koreliacijų, kurios rodo priežastį ir pasekmę, kurios savo ruožtu gali būti panaudotos siekiant pakeisti rezultatus. Nuspėjamoji analizė panašiai ieško modelių, bet vėliau juos išplečia, ekstrapoliuodama jų trajektorijas už žinomų duomenų, kad padėtų numatyti, kaip gali pasikeisti neišmatuoti arba hipotetiniai įvykiai, įskaitant būsimus įvykius. Pažangiausios duomenų analizės formos yra skirtos pateikti konkrečių sprendimų gaires, modeliuojant ir numatant įvairių pasirinkimų rezultatus, siekiant nustatyti tinkamiausią veiksmų kryptį.

Dirbtinis intelektas ir mašininis mokymasis

Viena didžiausių šiuo metu duomenų mokslo pažangos – ir ateityje galinti daryti didžiulę įtaką – yra dirbtinis intelektas, o tiksliau – mašininis mokymasis. Trumpai tariant, mašininis mokymasis apima kompiuterio mokymą atlikti užduotis, kurios, mūsų manymu, reikalauja tam tikros formos intelekto ar sprendimo, pavyzdžiui, gebėti atpažinti objektus nuotraukoje. Paprastai tai pasiekiama pateikus daug pavyzdžių, kokio tipo pasiryžimo mokote tinklą atlikti. Kaip jūs įsivaizduojate, tam reikia daugybės (paprastai struktūrizuotų) duomenų ir gebėjimo priversti kompiuterį suprasti tuos duomenis. Būtini stiprūs statistikos įgūdžiai ir programavimo įgūdžiai.

Naudingas mašininio mokymosi poveikis yra beveik neribotas, bet pirmiausia tai gebėjimas atlikti sudėtingas ar ilgai trunkančias užduotis greičiau nei bet kuris žmogus, pavyzdžiui, atpažinti konkretų piršto atspaudą iš milijonų vaizdų saugyklos arba atlikti kryžmines nuorodas. dešimtys kintamųjų tūkstančiuose medicininių bylų, siekiant nustatyti asociacijas, kurios gali pasiūlyti užuominų apie ligą. Turėdami pakankamai duomenų, mašininio mokymosi ekspertai gali net išmokyti neuroninius tinklus kurti originalius vaizdus, ​​gauti reikšmingų įžvalgų iš didžiulių rašytinių tekstų, prognozuoti būsimas išlaidų tendencijas ar kitus rinkos įvykius ir paskirstyti išteklius, kurie priklauso nuo labai sudėtingo paskirstymo, pvz., energijos. , su maksimaliu efektyvumu. Mašininio mokymosi naudojimas šioms užduotims atlikti, priešingai nei kitos automatizavimo formos, yra tas, kad neprižiūrimas A.I. sistema gali automatiškai mokytis ir laikui bėgant tobulėti – net ir be naujo programavimo.

Verslo žvalgyba

Kaip galėjote atspėti iš ankstesnės nuorodos į rinkos įvykius, verslo ir finansų pasaulis yra viena iš vietų, kur mašininis mokymasis padarė vieną iš ankstyviausių ir didžiausių padarinių. Dėl didžiulio turimų skaitinių duomenų kiekio – rinkodaros duomenų bazių, apklausų, bankininkystės informacijos, pardavimų duomenų ir tt, kurių dauguma yra gerai organizuoti ir su jais gana paprasta dirbti – duomenų mokslininkai gali naudoti statistiką, duomenų analizę ir mašininis mokymasis, leidžiantis gauti įžvalgų apie daugybę verslo pasaulio aspektų, padedančių priimti sprendimus ir optimizuoti rezultatus, iki to, kad verslo žvalgyba tapo savarankiška duomenų mokslo sritimi.

Gana dažnai verslo žvalgybos kūrėjai ne tik žiūri į bet kokius turimus duomenis, kad pamatytų, ką gali atrasti; jie aktyviai renka duomenis ir kuria metodus bei produktus, kad atsakytų į konkrečius klausimus ir pasiektų konkrečius tikslus. Šia prasme verslo žvalgybos kūrėjai ir analitikai yra labai svarbūs strateginei plėtrai verslo ir finansų pasaulyje – padeda vadovybei priimti geresnius sprendimus ir juos priimti greičiau, suprasti rinką, nustatyti verslo galimybes ir iššūkius bei pagerinti bendrą verslo efektyvumą. verslo sistemos ir veikla, kurių pagrindinis tikslas – įgyti konkurencinį pranašumą ir padidinti pelną.

Duomenų inžinerija

Paskutinė pagrindinė studijų sritis, kurioje dažnai dirba duomenų mokslininkai, apima daugybę skirtingų pareigybių pavadinimų – duomenų inžinierius, sistemų architektas, programų architektas, duomenų architektas, įmonės architektas arba infrastruktūros architektas. Kiekvienas iš šių vaidmenų turi savo pareigų rinkinį: vieni kuria programinę įrangą, kiti kuria IT sistemas, o treti derina įmonės vidinę struktūrą ir procesus su technologijomis, kurias ji naudoja savo verslo strategijoms įgyvendinti. Juos visus sieja tai, kad šioje srityje dirbantys duomenų mokslininkai taiko duomenis ir informacines technologijas kurdami arba tobulindami sistemas, atsižvelgdami į konkrečią funkciją.

Pavyzdžiui, programų architektas stebi, kaip verslas ar kita įmonė naudoja konkrečius technologinius sprendimus, tada projektuoja ir kuria programas (įskaitant programinę įrangą ar IT infrastruktūrą), kad pagerintų našumą. Duomenų architektas panašiai kuria programas – šiuo atveju duomenų saugojimo, administravimo ir analizės sprendimus. Infrastruktūros architektas gali sukurti visapusiškus sprendimus, kuriuos įmonė naudoja kasdienei veiklai vykdyti, siekdama užtikrinti, kad tie sprendimai atitiktų įmonės sistemos reikalavimus, nesvarbu, ar tai būtų neprisijungus, ar debesyje. Duomenų inžinieriai savo ruožtu daugiausia dėmesio skiria duomenų apdorojimui, duomenų srautams, kurie renka, tvarko, saugo, nuskaito ir apdoroja organizacijos duomenis, sukūrimą ir įgyvendinimą. Kitaip tariant, šios plačios duomenų mokslo kategorijos bruožas yra tas, kad ji apima dalykų projektavimą ir kūrimą: sistemas, struktūras ir procesus, kuriais vykdomas duomenų mokslas.

Kokie yra paklausiausi duomenų mokslo darbai?

Duomenų mokslas apskritai yra labai paklausus įgūdis, todėl kiekvienoje srities srityje ir specialybėje yra labai daug galimybių. Tiesą sakant, 2019 m. „LinkedIn“ įtraukė „Data Scientist“ kaip perspektyviausią metų darbą, o „QuantHub“ prognozavo, kad ateinančiais metais labai trūks kvalifikuotų duomenų mokslininkų.

Pagrindinis žodis čia yra kvalifikuotas. Dažnai techniniai reikalavimai, kuriuos turi atitikti duomenų mokslininkas, yra tokie specifiniai, kad gali prireikti kelių metų patirties dirbant pramonėje, norint įgyti reikiamą kompetencijų spektrą, pradedant nuo bendrininko, o po to palaipsniui pridedant vis daugiau gabumų ir gebėjimų. jų įgūdžių rinkinys.

Tai tik keletas dažniausiai pasitaikančių būdų, kaip duomenų mokslininkai gali tai padaryti – potencialių karjeros kelių yra tiek pat, kiek yra duomenų mokslininkų, tačiau kiekvienu atveju karjeros pažanga priklauso nuo to, ar laikui bėgant įgyjama naujų įgūdžių ir patirties.

Duomenų analitikas

Kaip rodo pavadinimas, duomenų analitikai analizuoja duomenis, tačiau šis trumpas pavadinimas atspindi tik nedidelę dalį to, ką duomenų analitikai iš tikrųjų gali pasiekti. Pirma, duomenys retai pateikiami lengvai naudojama forma, o dažniausiai duomenų analitikai yra atsakingi už reikalingų duomenų identifikavimą, jų rinkimą ir surinkimą, o tada jų valymą ir tvarkymą – konvertavimą į naudotiną formą, nustatyti, kas iš tikrųjų yra duomenų rinkinyje, pašalinti sugadintus duomenis ir įvertinti jų tikslumą. Tada yra pati analizė – naudojant skirtingus metodus duomenims tirti ir modeliuoti, ieškoti šablonų, išskirti iš tų modelių prasmę ir juos ekstrapoliuoti arba modeliuoti. Galiausiai duomenų analitikai daro savo įžvalgas prieinamas kitiems, pateikdami duomenis prietaisų skydelyje arba duomenų bazėje, kurią gali pasiekti kiti žmonės, ir pranešdami apie savo išvadas kitiems per pristatymus, rašytinius dokumentus, diagramas, grafikus ir kitas vizualizacijas.

Duomenų analitiko karjeros kelias

Duomenų analitikas yra puikus įėjimo taškas į duomenų mokslo pasaulį; tai gali būti pradinio lygio pareigos, atsižvelgiant į reikalingų žinių lygį. Nauji duomenų analitikai paprastai pradeda dirbti iš karto baigę mokyklą – įgiję statistikos, matematikos, informatikos ar panašaus išsilavinimo – arba pereina prie duomenų analizės iš susijusios srities, pavyzdžiui, verslo, ekonomikos ar net socialinių mokslų, paprastai atnaujindami savo karjeros viduryje įgyti įgūdžiai per duomenų analizės „bootcamp“ ar panašią sertifikavimo programą.

Tačiau nesvarbu, ar tai neseniai baigę absolventus, ar patyrę profesionalai, keičiantys karjerą, naujieji duomenų mokslininkai paprastai pradeda atlikti įprastas užduotis, tokias kaip duomenų gavimas ir manipuliavimas tokia kalba kaip R arba SQL, duomenų bazių kūrimas, pagrindinė analizė ir generavimas. vizualizacijas naudojant tokias programas kaip Tableau. Ne kiekvienas duomenų analitikas turės žinoti, kaip atlikti visus šiuos dalykus – gali būti specializacija, net ir eidamas jaunesnes pareigas, bet jūs turėtumėte sugebėti atlikti visas šias užduotis, jei tikitės pažangos savo karjeroje. Lankstumas yra didelis privalumas šiame ankstyvame etape.

Tai, kaip tobulėsite kaip duomenų analitikas, tam tikru mastu priklauso nuo pramonės, kurioje dirbate – pavyzdžiui, rinkodaros ar finansų. Priklausomai nuo sektoriaus ir atliekamo darbo tipo, galite specializuotis programuojant Python arba R, tapti duomenų valymo profesionalu arba susikoncentruoti tik į sudėtingų statistinių modelių kūrimą arba gražių vaizdų generavimą; kita vertus, jūs taip pat galite nuspręsti išmokti šiek tiek visko, kad galėtumėte užimti vadovaujančias pareigas, kai užimsite vyresniojo duomenų analitiko vardą. Turėdamas didelę ir pakankamai gilią patirtį, vyresnysis duomenų analitikas yra pasirengęs imtis vadovaujančio vaidmens, prižiūrėdamas kitų duomenų analitikų komandą ir galiausiai tapti skyriaus vadovu arba direktoriumi. Papildomai mokydami įgūdžius duomenų analitikai taip pat turi tvirtą padėtį, kad galėtų pereiti į pažangesnes duomenų mokslininko pareigas.

Duomenų mokslininkas

Tikrieji duomenų mokslininkai paprastai gali padaryti viską, ką gali padaryti duomenų analitikai, ir dar keletą dalykų – iš tikrųjų, turėdamas tinkamą mokymą ir patirtį, duomenų analitikas galiausiai gali tapti duomenų mokslininko pareigomis. Taigi taip, duomenų mokslininkai turėtų mokėti gauti, išvalyti, manipuliuoti, saugoti ir analizuoti duomenis, bet taip pat suprasti ir dirbti su skirtingais mašininio mokymosi metodais, taip pat mokėti programuoti Python, R ar panašia statistinio programavimo kalba, kurti ir įvertinti pažangesnius modelius.

Duomenų mokslininko karjeros kelias

Daugelis žmonių pradeda dirbti kaip duomenų analitikai prieš įgydami patirties ir papildomų įgūdžių, reikalingų norint vadintis duomenų mokslininkais. Tada, iš Junior Data Scientist, kitas žingsnis paprastai yra vyresnysis duomenų mokslininkas – nors toks paprastas pavadinimo pakeitimas prieštarauja darbui, kurio reikia šiam perėjimui atlikti; Vyresnysis duomenų mokslininkas puikiai išmanys beveik visus duomenų mokslo aspektus – A.I., duomenų saugyklą, duomenų gavybą, debesų kompiuteriją ir pan. , arba jie specializuotis vienoje iš šių sričių, turėdami guru lygio patirtį.

Verta paminėti, kad nors kai kurie duomenų mokslininkai pradeda savo karjerą analitikos srityje ir eina į aukštesnes pareigas specializuotose srityse, tokiose kaip psichologija, rinkodara, ekonomika ir pan., o kiti pradeda kaip profesionalai vienoje iš tų skirtingų sričių, prieš pereidami į duomenų bazę. mokslo vaidmenį.

Daugeliui vyresnysis duomenų mokslininkas yra pagrindinis karjeros tikslas; Tai jau yra toks pažangus vaidmuo, kad bent jau duomenų mokslo srityje tai dažnai yra aukščiausia pareiga, kurią galima pasiekti – jūs tiesiog tampate geresniu, pajėgesniu vyresniuoju duomenų mokslininku, kurio specializacija yra didesnė. Tačiau kai kuriems, ypač tiems, kurie laikosi bendresnio požiūrio, galima toliau siekti vadovo pareigų, pavyzdžiui, vadovaujančio duomenų mokslininko, vadovaujančio komandai ar skyriui arba net vyriausiajam duomenų pareigūnui, vadovaujančiam institucijos duomenų strategijai aukščiausiu lygiu. ir atsakydamas tik generaliniam direktoriui.

Duomenų inžinierius

Duomenų inžinierius iš kitų duomenų srityje dirbančių specialistų išskiria tai, kad jie kuria ir kuria ištisas sistemas, įskaitant infrastruktūrą ir procesus, kuriuos įmonė naudoja siekdama maksimaliai išnaudoti tuos duomenis. Tai yra, duomenų inžinieriai yra žmonės, kurie nustato būdus, kuriais kiti duomenų mokslininkai gali atlikti savo darbą. Kokių formų duomenis gali talpinti įmonės sistema? Kokie metodai naudojami renkant duomenis iš pardavimų ir rinkodaros arba sveikatos priežiūros tyrimo rezultatų ir pateikiant juos analizei? Norėdami tai padaryti, duomenų inžinieriai turi būti gerai susipažinę su kitų duomenų mokslo profesionalų – duomenų bazių administratorių, duomenų analitikais, duomenų architektais ir tt – atliekamais darbais, kad duomenų inžinieriai dažnai galėtų atlikti kiekvieną iš šių vaidmenų kaip gerai. Tačiau kadangi jie yra kūrėjai, duomenų inžinieriai paprastai daugiau laiko skiria kūrimui nei kiti duomenų mokslo profesionalai – rašo programinės įrangos programas, kuria reliacines duomenų bazes arba kuria įrankius, leidžiančius įmonėms dalytis duomenimis tarp padalinių.

Duomenų inžinieriaus karjeros kelias

Kaip ir kitose duomenų srityse, pirmas žingsnis norint tapti duomenų inžinieriumi dažnai yra universitetinis laipsnis (dažniausiai inžinerijos, informatikos ar matematikos bakalauro arba magistro laipsnis), bet ne visada. Asmuo, turintis daug IT ar programinės įrangos kūrimo patirties, gali pastebėti, kad jis jau turi visus reikiamus įgūdžius, kad galėtų tapti duomenų inžinieriumi, išskyrus pačius duomenų įgūdžius. Tokiu atveju kai kurių įgūdžių perkvalifikavimas, pvz., duomenų įkrovos stovykla, gali padėti jiems įgyti. iki greičio. Daugelį duomenų inžinieriui reikalingų įgūdžių (pvz., SQL, UNIX ir Linux, ETL kūrimo ar IT sistemų konfigūravimo) galima išsiugdyti dirbant gretimoje srityje; kitiems (pvz., mašininiam mokymuisi ar duomenų perdavimo vamzdynų kūrimui) reikės kryptingesnio mokymosi.

Nepaisant to, dauguma duomenų inžinierių pradeda savo karjerą dirbdami tam tikroje informatikos posrityje, kol įgyja visus įgūdžius, kurių reikia norint tapti jaunesniuoju duomenų inžinieriumi – iš tikrųjų daugumai jaunesniųjų duomenų inžinierių darbo skelbimų reikia nuo vienerių iki penkerių metų darbo patirties. Tada kitas logiškas žingsnis yra vyresniojo duomenų inžinieriaus ir vadovaujančio duomenų inžinieriaus link. Tačiau žinant tiek daug IT, programinės įrangos inžinerijos ir duomenų mokslo aspektų, duomenų inžinieriai taip pat gali užimti daugybę kitų pareigybių, įskaitant duomenų architektą, sprendimų architektą ar programų architektą. Tiems, kurie nori dirbti mažiau praktinio darbo ir daugiau valdyti darbuotojus, kitos galimybės yra produktų vystymo vadovas arba, galų gale, turint reikiamų žmonių įgūdžių, net vyriausiasis duomenų pareigūnas arba vyriausiasis informacijos pareigūnas.

Ar duomenų mokslininkai gali dirbti iš namų?

Kaip ir daugelis darbų technologijų srityje, duomenų mokslininko vaidmenis dažnai galima atlikti nuotoliniu būdu, tačiau tai galiausiai priklauso nuo įmonės, kurioje dirbate, ir nuo to, kokio darbo dirbate.

Kada duomenų mokslininkai gali dirbti nuotoliniu būdu?

Duomenų mokslo pozicijos, kuriose dirbama su labai jautriais arba konfidencialiais duomenimis ir informacija (įskaitant daug jų, net ir už privatumo labai svarbių sričių, tokių kaip bankininkystė ir sveikatos priežiūra, nes nuosavybės teise saugomi duomenys gali būti vienas vertingiausių didelės įmonės turtų), atras susiduria su daug daugiau apribojimų, susijusių su nuotoliniu darbu. Tokiais atvejais greičiausiai turėsite dirbti biure darbo valandomis.

Kai kurie kiti veiksniai, į kuriuos reikia atsižvelgti:

  • Kokia tradicinė jūsų įmonė. Didesnės, senesnės įmonės paprastai nėra tokios patogios nuotoliniu būdu, nors COVID galėjo atnešti didelių pokyčių šioje srityje.
  • Kaip lengvai galite dirbti su kitais komandos draugais ir skyriais nuotoliniu būdu. Jei jūsų darbas labai susijęs su bendradarbiavimu, labiau tikėtina, kad turėsite pasirodyti asmeniškai.
  • Duomenų mokslininkai, dirbantys pagal sutartį ar net konsultuojantys, taip pat gali turėti daugiau lankstumo pasirenkant savo vietą.

Kategori: Žinios