Diena duomenų mokslininko gyvenime
„BrainStation“ duomenų mokslininko karjeros vadovas gali padėti žengti pirmuosius žingsnius pelningos duomenų mokslo karjeros link. Skaitykite toliau, kad sužinotumėte, kaip duomenų mokslininkai praleidžia dienas darbe.
Tapkite duomenų mokslininku
Pasikalbėkite su mokymosi patarėju ir sužinokite daugiau apie tai, kaip mūsų stovyklos ir kursai gali padėti jums tapti duomenų mokslininku.
Spustelėdami Pateikti sutinkate su mūsų Sąlygos .
Pateikti
Nepavyko pateikti! Atnaujinti puslapį ir bandyti dar kartą?
Sužinokite daugiau apie mūsų Data Science BootcampAčiū!
Greitai susisieksime.
Peržiūrėkite „Data Science Bootcamp“ puslapį
Diena duomenų mokslininko gyvenime
Iš visų „Brainstation“ skaitmeninių įgūdžių tyrime išnagrinėtų disciplinų duomenų mokslas gali apimti plačiausią pritaikymo spektrą. Tačiau nors duomenų mokslas egzistavo dešimtmečius, jis tik neseniai suklestėjo. Duomenų prieinamumui išsiplėtus, įmonės suprato, koks svarbus gali būti duomenų mokslas, sako Briana Brownell, „Pure Strategy“ įkūrėja ir generalinė direktorė bei 13 metų duomenų tyrinėtoja. Kiekviena įmonė dabar turi skirti dalinį dėmesį technologijoms. Pavyzdžiui, šią savaitę „McDonald's“ sumokėjo maždaug 300 milijonų USD, kad įsigytų savo didžiųjų duomenų įmonę.
Todėl nenuostabu, kad konkurencija dėl duomenų mokslininkų yra neįtikėtinai didelė. Tikimasi, kad vos per dvejus metus paklausa išaugs 28 proc., o tai prilygs apie 2,7 mln. naujų darbo vietų. Tai daugiau laisvų vietų, nei galės užpildyti nauji absolventai – tai reiškia, kad kitų sričių technologijų darbuotojai turės tobulinti savo įgūdžius ir pereiti prie duomenų, kad patenkintų šį poreikį.
Tiesą sakant, mūsų apklausa rodo, kad tai jau vyksta. Maždaug keturi iš penkių duomenų profesionalų pradėjo savo karjerą darydami ką nors kita, o 65 procentai visų duomenų mokslininkų šioje srityje dirba penkerius ar mažiau metų. Šis didžiulis naujų protų antplūdis turi dvipusį poveikį, sako Brownell; viena vertus, atsiranda daug naujų idėjų, sako ji. Kai žiūriu į tam tikrą duomenų mokslo bendruomenės turinį, nustebau, kiek daug naujovių yra. Tačiau atvirkštinė pusė yra polinkis išradinėti dviratį iš naujo.
Didelis duomenų mokslininkų poreikis yra puikus, jei esate toks (arba galvojate juo tapti), tačiau darbdaviams įdarbinimas gali būti nelengvas iššūkis. Šiuo atveju perkvalifikavimas yra akivaizdus sprendimas; gali būti ekonomiškiau perkvalifikuoti esamą darbuotoją duomenų mokslo srityje, nei ieškoti naujo.
Tačiau net jei planuojate samdyti naują duomenų mokslo komandą, jūsų organizacijai gali tekti patobulinti savo duomenų raštingumą, įspėja Brownell. Visi nori dirbti tai, kas turi įtakos jų darbo vietai ir pagerina žmonių gyvenimą, sako ji. Jei jūsų įmonės kultūra nėra tokia, kad [jūsų duomenų mokslininkai] galėtų turėti įtakos, pasamdyti beveik neįmanoma. Vadovavimas turi būti pajėgus ne tik pranešti potencialiems samdomiems darbuotojams, kaip jie galės prisidėti, bet ir suprasti pasiūlymus, kuriuos galiausiai pateikia jų duomenų mokslo komanda.
Deja, Brownell sako, kad nepatogi dauguma yra įmonės, kurios nieko neišsiaiškino. Mūsų apklausa tai patvirtina: dauguma respondentų (52 proc.) duomenų raštingumo lygį savo organizacijose apibūdino kaip pagrindinį, o tarpinis – kitas dažniausiai pasitaikantis atsakymas (31 proc.). Tai rodo, kad kai kurie pagrindiniai duomenų mokslo mokymai gali būti naudingi daugumai įmonių, ypač vadovaujant.
Šį poreikį gerinti duomenų raštingumą ir bendravimą padidina tai, kad dauguma duomenų mokslo komandų yra suskirstytos į atskirą komandą, kurioje paprastai yra 10 ar mažiau žmonių (71 procento respondentų teigimu), ir dažnai penki ar mažiau (38 procentai). ). Šios glaudžios komandos negali sau leisti būti izoliuotos. Asmenys, dirbantys didesnėse įmonėse, paprastai priklauso nedidelei duomenų mokslui būdingai grupei, o jų klientai yra vidiniai – kitos organizacijos dalys, aiškina Brownell, taigi, tai komanda, kuri turi veikti įvairiose organizacijos srityse.
Kas tiksliai yra duomenų mokslas?
Brownell sako, kad paplitęs suvokimas (kad duomenų mokslininkai negaili skaičių) nėra per daug nutolęs nuo ženklo. Yra daug duomenų rinkinių, kurių įžvalgos turi būti atskleistos, o tai apima daugybę veiksmų, pvz., modelio kūrimą ir duomenų valymą, ir netgi tiesiog apsisprendimą, kokių duomenų jums reikia. Tačiau galiausiai šios pastangos yra orientuotos į tikslą: iš esmės jūs turite ką nors daryti su duomenimis.
Šiuo atveju duomenys ne visada yra skaičiai. Nors dauguma respondentų (73 proc.) nurodė, kad dirba su skaitiniais duomenimis, 61 proc. teigė, kad dirba ir su tekstu, 44 proc. – su struktūriniais duomenimis, 13 proc. – su vaizdais ir 12 proc. – su grafika (o nedidelės mažumos dirba net su vaizdo ir garso įrašais). – atitinkamai 6 ir 4 procentai). Šie apklausos rezultatai rodo, kaip duomenų mokslas plečiasi toli už finansinių lentelių, pritraukia žmones į tokius projektus, kaip maksimaliai padidinti klientų pasitenkinimą arba gauti vertingų įžvalgų iš socialinės žiniasklaidos ugnies žarnos.
Dėl to duomenų mokslo srityje yra didžiulė įvairovė, sako Brownell. Kiekviena pramonės šaka turi savo požiūrį į tai, su kokio tipo duomenimis dirba duomenų mokslininkai, kokių rezultatų jie tikisi ir kaip tai dera į jų įmonės vadovavimo struktūrą. Tačiau kiekvienu atveju tikslas yra panaudoti duomenis, kad padėtų įmonei priimti geresnius sprendimus. Tai galėtų būti produktų tobulinimas, rinkos, į kurią jie nori patekti, supratimas, daugiau klientų išlaikymas, jų darbo jėgos panaudojimo supratimas, supratimas, kaip gerai samdyti – visokie skirtingi dalykai.
Duomenų mokslo darbai
Kai kuriose technologijų srityse tapti generalistu gali būti geriausia jūsų koja – ne taip su duomenų mokslu. Darbdaviai paprastai ieško savo pramonės įgūdžių. Kadangi duomenų mokslas yra labai įvairus, mūsų apklausa buvo gilesnė, nagrinėjant penkias pagrindines darbo kategorijas: duomenų analitikas, tyrinėtojas, verslo analitikas, duomenų ir analizės vadovas ir duomenų mokslininkas.
Visuose šiuose pareigybių pavadinimuose duomenų ginčai ir valymas atima didžiąją laiko dalį, bet kam? Dažniausiai siekiama optimizuoti esamą platformą, produktą ar sistemą (45 proc.), arba kurti naujas (42 proc.). Gilindamiesi pastebėjome, kad esamų sprendimų optimizavimas dažniausiai tenka verslo analitikams ir duomenų analitikams, o naujų sprendimų kūrimas dažniau tenka duomenų mokslininkams ir tyrėjams.
Duomenų mokslininkų naudojami metodai taip pat skiriasi įvairiose specializacijose. Tiesinė regresija buvo įprastas įrankis visose kategorijose, kurį nurodė 54 procentai respondentų, tačiau buvo keletas netikėtumų, kai pažvelgėme į žmonių naudojamą programinę įrangą.
„Excel“ – duomenų rinkinių manipuliavimo arkliukas – yra beveik visur, jį nurodė 81 procentas visų respondentų, ir pati populiariausia priemonė kiekvienoje kategorijoje, išskyrus pačius duomenų mokslininkus (kurie dažniausiai remiasi Python), taip pat nurodė didesnį įrankių rinkinį nei kitos kategorijos. ). Dėl ko „Excel“ tokia neišvengiama net 2019 m.?
„Excel“ man patinka tai, kaip ji leidžia matyti duomenis ir intuityviai juos pajusti, paaiškino Brownell. Taip pat naudojame daug Python, ir tokiu atveju, kai atliekate duomenų failo analizę, jis yra paslėptas; nebent specialiai užprogramuojate dalį savo kodo, kad atliktumėte tam tikrą analizuojamų neapdorotų duomenų vizualizavimą, to nematote. Tuo tarpu naudojant „Excel“ tai yra tiesiai prieš jus. Tai turi daug privalumų. Kartais galite pastebėti duomenų failo problemas. Nematau, kad „Excel“ dingtų iš analizės.
Nepaisant to, vis dar yra ilgas kitų šioje srityje naudojamų programų sąrašas – tai nenuostabu, atsižvelgiant į jų įvairovę. SQL (43 proc.) ir Python (26 proc.) pirmauja pagal populiarumą, o „Tableau“ (23 proc.), „R“ (16 proc.), „Jupyter Notebooks“ (14 proc.) ir keletas kitų pasiekia reikšmingų skaičių – jau nekalbant apie didžiulius 32 procentai respondentų, kurie nurodė kitas priemones, net atsižvelgiant į šį ir taip ilgą sąrašą.
Kokia yra duomenų mokslo ateitis?
Galiausiai paklausėme, kokios tendencijos formuos skaitmeninį kraštovaizdį per ateinančius penkerius–10 metų. Mašinų mokymasis ir dirbtinis intelektas – abu turi duomenų mokslo taikomąsias programas – daugiausia respondentų tikisi turėti didžiausią poveikį – atitinkamai 80 ir 79 proc. Tai nepaisant to, kad šiuo metu mažiau nei ketvirtadalis (23 proc.) jų dirba su AI.
Dirbtinis intelektas gali visiškai pakeisti duomenų mokslą, patvirtina Brownell, kurio įmonė kuria dirbtinio intelekto produktus. Tai tikrai neprižiūrimų mokymosi metodų šlovė. Turime tik tiek laiko peržiūrėti šiuos duomenų rinkinius, o ypač su dideliais, labai sunku viską padaryti. AI įrankiai gali padėti atskleisti tai, ko galbūt net nebūtų pagalvojęs ieškoti. Mums tikrai taip nutiko.
Kitos tendencijos, kurias Duomenų mokslininkai tikisi artimiausiu metu dominuoti: daiktų internetas (51 proc.), blokų grandinė (50 proc.) ir elektroninė prekyba (36 proc.), papildyta realybė ir virtualioji realybė (38 proc. ir 27 proc.) ir net balso. pagrįsta patirtimi (25 proc.) – visi reikšmingi pasirodymai ir visos sritys, kuriose duomenų mokslas gali būti tinkamai panaudotas.