Duomenų mokslo interviu klausimai

„BrainStation“ duomenų mokslininko karjeros vadovas gali padėti žengti pirmuosius žingsnius pelningos duomenų mokslo karjeros link. Skaitykite toliau, kad sužinotumėte įprastus interviu klausimus, susijusius su duomenų mokslo darbu, ir kaip į juos geriausiai atsakyti.

Tapkite duomenų mokslininku

Pasikalbėkite su mokymosi patarėju ir sužinokite daugiau apie tai, kaip mūsų stovyklos ir kursai gali padėti jums tapti duomenų mokslininku.



Spustelėdami Pateikti sutinkate su mūsų Sąlygos .



Pateikti

Nepavyko pateikti! Atnaujinti puslapį ir bandyti dar kartą?

Sužinokite daugiau apie mūsų Data Science Bootcamp

Ačiū!

Greitai susisieksime.



Peržiūrėkite „Data Science Bootcamp“ puslapį

Duomenų mokslo interviu procesai gali skirtis priklausomai nuo įmonės ir pramonės. Paprastai jie apims pradinį telefono patikrinimą su nuomos vadovu, po kurio įvyks vienas ar keli pokalbiai vietoje.

Turėsite atsakyti į techninius ir elgesio duomenų mokslo interviu klausimus ir greičiausiai užbaigsite su įgūdžiais susijusį projektą. Prieš kiekvieną pokalbį turėtumėte peržiūrėti savo gyvenimo aprašymą ir aplanką, taip pat pasiruošti galimiems pokalbio klausimams.

Duomenų mokslo interviu klausimai patikrins jūsų statistikos, programavimo, matematikos ir duomenų modeliavimo žinias bei įgūdžius. Darbdaviai įvertins jūsų techninius ir minkštuosius įgūdžius bei tai, kaip gerai tiktumėte jų įmonėje.



Parengę kai kuriuos įprastus duomenų mokslo interviu klausimus ir atsakymus, galite drąsiai įeiti į interviu. Yra keletas skirtingų duomenų mokslininko klausimų, su kuriais galite susidurti per duomenų mokslo pokalbį.

Duomenų mokslo interviu klausimų sąrašas: su duomenimis susiję klausimai

Darbdaviai ieško kandidatų, kurie gerai išmanytų duomenų mokslo metodus ir koncepcijas. Su duomenimis susiję interviu klausimai skirsis priklausomai nuo pareigų ir reikalingų įgūdžių.

Štai keletas su duomenimis susijusių interviu klausimų ir atsakymų pavyzdžių:



Kuo skiriasi prižiūrimas ir neprižiūrimas mokymasis?

Didžiausias skirtumas tarp prižiūrimo ir neprižiūrimo mokymosi yra pažymėtų ir nepažymėtų duomenų rinkinių naudojimas. Prižiūrimas mokymasis naudoja išvesties ir įvesties duomenis, kurie yra pažymėti, o neprižiūrimo mokymosi algoritmai – ne. Kitas skirtumas yra tas, kad prižiūrimas mokymasis turi grįžtamojo ryšio mechanizmą, o mokymasis neprižiūrimas neturi. Galiausiai, dažniausiai naudojami prižiūrimi mokymosi algoritmai apima logistinę regresiją, paramos vektorių mašiną ir sprendimų medžius, o neprižiūrimi mokymosi algoritmai yra k-means klasterizavimas, hierarchinis klasterizavimas ir apriori algoritmas.

Kuo skiriasi gilusis mokymasis ir mašininis mokymasis?

Į šį klausimą gali būti sunku aiškiai atsakyti, nes akivaizdu, kad čia yra tam tikras sutapimas. Pradėkite paaiškindami, kad gilusis mokymasis iš esmės yra mašininio mokymosi polaukis ir abu patenka į dirbtinio intelekto skėtį. Kai mašininis mokymasis naudoja algoritmus duomenims analizuoti ir galiausiai išmokti priimti sprendimus, remdamasis tuo, ką jis išduoda iš duomenų, giluminio mokymosi sluoksnius tie algoritmai sukuria dirbtinius neuroninius tinklus, galinčius mokytis ir priimti pagrįstus sprendimus.

  • Ar galite pateikti išsamų sprendimų medžio algoritmo paaiškinimą?
  • Kas yra atranka? Su kiek atrankos metodų esate susipažinę?
  • Kaip atskirti I ir II tipo klaidas?
  • Apibrėžkite tiesinę regresiją.
  • Ką reiškia terminai p reikšmė, koeficientas ir r kvadrato reikšmė? Kodėl kiekvienas komponentas yra reikšmingas?
  • Apibrėžkite pasirinkimo šališkumą.
  • Apibrėžkite statistinę sąveiką.
  • Ar galite pateikti duomenų rinkinio su ne Gauso skirstiniu pavyzdį?
  • Paaiškinkite binominės tikimybės formulę.
  • Ar galite paaiškinti skirtumą tarp k-NN ir k-means klasterizacijos?
  • Koks jūsų požiūris kuriant logistinės regresijos modelį?
  • Kas yra 80/20 taisyklė? Kaip svarbu modeliuoti patvirtinimą?
  • Apibrėžkite tikslumą ir prisiminimą. Kaip jie susiję su ROC kreive?
  • Paaiškinkite, kaip atskirti L1 ir L2 reguliavimo metodus?
  • Prieš taikydami mašininio mokymosi algoritmus, kokius veiksmus reikia atlikti norint supainioti duomenis ir išvalyti duomenis?
  • Ar galite paaiškinti skirtumą tarp histogramos ir langelio diagramos?
  • Kaip apibrėžiate kryžminį patvirtinimą?
  • Ar galite paaiškinti, kas yra klaidingas teigiamas ir klaidingas neigiamas? Ką, jūsų nuomone, geriau turėti: per daug klaidingų teigiamų rezultatų ar per daug klaidingų neigiamų?
  • Kuriant mašininio mokymosi modelį, kas svarbiau: modelio tikslumas ar modelio našumas?
  • Jūsų nuomone, kas geriau: 50 mažų sprendimų medžių ar didelis?
  • Ar galite galvoti apie duomenų mokslo projektą mūsų įmonėje, kuris jus sudomintų?
  • Ar galėtumėte sugalvoti kelis geriausios duomenų mokslo praktikos pavyzdžius?

Duomenų mokslo interviu klausimų sąrašas: techninių įgūdžių klausimai

Duomenų mokslo interviu techninių įgūdžių klausimai naudojami jūsų duomenų mokslo žinioms, įgūdžiams ir gebėjimams įvertinti. Šie klausimai bus susiję su konkrečiomis duomenų mokslininko pareigų pareigomis.

Techninių duomenų mokslo interviu klausimai gali turėti vieną teisingą atsakymą arba kelis galimus sprendimus. Spręsdami problemas norėsite parodyti savo mąstymo procesą ir aiškiai paaiškinti, kaip gavote atsakymą.

Techninių duomenų mokslo įgūdžių interviu klausimų pavyzdžiai:

Kokie yra geriausi duomenų mokslininko įrankiai ir techniniai įgūdžiai?

Duomenų mokslas yra labai techninė sritis, todėl įdarbinimo vadovui norėsite parodyti, kad esate įgudęs naudotis visais naujausiais pramonės standartų įrankiais, programine įranga ir programavimo kalbomis. Iš įvairių duomenų moksle naudojamų statistinio programavimo kalbų duomenų mokslininkai dažniausiai naudoja R ir Python. Abi gali būti naudojamos statistinėms funkcijoms, tokioms kaip netiesinio arba tiesinio modelio kūrimas, regresinė analizė, statistiniai testai, duomenų gavyba ir kt. Kitas svarbus duomenų mokslo įrankis yra „RStudio Server“, o „Jupyter Notebook“ dažnai naudojamas statistiniam modeliavimui, duomenų vizualizavimui, mašininio mokymosi funkcijoms ir kt. Žinoma, yra nemažai specialių duomenų vizualizavimo įrankių, kuriuos plačiai naudoja duomenų mokslininkai, įskaitant „Tableau“, „PowerBI“. , Bokeh, Plotly ir Infogram. Duomenų mokslininkams taip pat reikia daug patirties naudojant SQL ir Excel.

Jūsų atsakyme taip pat turėtų būti nurodytos konkrečios priemonės ar techninės kompetencijos, kurių reikia darbui, dėl kurio einate pokalbį. Peržiūrėkite darbo aprašymą ir, jei yra kokių nors įrankių ar programų, kurių nenaudojote, galbūt verta susipažinti su jais prieš pokalbį.

Kaip vertinate išskirtines vertybes?

Kai kurių tipų nukrypimus galima pašalinti. Šiukšlių vertybės arba vertybės, kurios, kaip žinote, negali būti tikros, gali būti atmestos. Taip pat galima pašalinti nukrypimus, kurių kraštutinės reikšmės yra toli už likusių duomenų taškų, sugrupuotų į rinkinį. Jei negalite atsisakyti nuokrypių, galite dar kartą pagalvoti, ar pasirinkote tinkamą modelį, galite naudoti algoritmus (pvz., atsitiktinius miškus), kuriems neturės didelio poveikio išskirtinės reikšmės, arba galite pabandyti normalizuoti duomenis.

  • Papasakokite apie originalų savo sukurtą algoritmą.
  • Kokia yra jūsų mėgstamiausia statistikos programinė įranga ir kodėl?
  • Ar dirbote su duomenų mokslo projektu, kuriam reikėjo didelio programavimo komponento? Ką pasiėmėte iš patirties?
  • Aprašykite, kaip efektyviai pateikti duomenis naudojant penkis matmenis.
  • Turite sukurti nuspėjamąjį modelį naudodami daugialypę regresiją. Koks yra jūsų šio modelio patvirtinimo procesas?
  • Kaip užtikrinti, kad algoritmo pakeitimai būtų patobulinti?
  • Pateikite metodą, kaip tvarkyti nesubalansuotą duomenų rinkinį, kuris naudojamas numatymui (t. y. daug daugiau neigiamų klasių nei teigiamų).
  • Koks yra jūsų požiūris į modelio, kurį sukūrėte, kad sukurtumėte nuspėjamą kiekybinio rezultato kintamojo modelį, naudojant daugialypę regresiją, patvirtinimą?
  • Turite du skirtingus palyginamo skaičiavimo našumo ir tikslumo modelius. Paaiškinkite, kaip nuspręsite, kurį pasirinkti gamybai ir kodėl.
  • Jums pateikiamas duomenų rinkinys, kurį sudaro kintamieji, kurių didelės dalies trūksta reikšmių. Koks jūsų požiūris?

Duomenų mokslo interviu klausimų sąrašas: asmeniniai klausimai

Tikrinant jūsų duomenų mokslo žinias ir įgūdžius, darbdaviai greičiausiai taip pat užduos bendrųjų klausimų, kad geriau jus pažintų. Šie klausimai padės jiems suprasti jūsų darbo stilių, asmenybę ir tai, kaip galėtumėte prisitaikyti prie jų įmonės kultūros.

Asmens duomenų mokslininko interviu klausimai gali būti:

Kas yra geras duomenų mokslininkas?

Jūsų atsakymas į šį klausimą daug pasakys samdos vadovui apie tai, kaip matote savo vaidmenį ir kokią vertę teikiate organizacijai. Savo atsakyme galėtumėte kalbėti apie tai, kad duomenų mokslas reikalauja reto kompetencijų ir įgūdžių derinio. Geras duomenų mokslininkas turi derinti techninius įgūdžius, reikalingus duomenims analizuoti ir kurti modelius, turinčius verslo supratimo, reikalingo suprasti problemas, kurias jie sprendžia, ir atpažinti savo duomenų įžvalgas. Savo atsakyme taip pat galite aptarti duomenų mokslininką, į kurį žiūrite, nesvarbu, ar tai kolega, kurį pažįstate asmeniškai, ar įžvalgus pramonės veikėjas.

  • Prasau pasakyk man apie save.
  • Kokios yra geriausios jūsų profesinės savybės? Kokios yra jūsų silpnybės?
  • Ar yra vienas duomenų mokslininkas, kuriuo labiausiai žavitės?
  • Kas paskatino jus domėtis duomenų mokslu?
  • Kokius unikalius įgūdžius ar savybes atsinešate, kurie padėtų komandai?
  • Kas paskatino jus palikti paskutinį darbą?
  • Kokio dydžio atlygio tikitės iš šio darbo?
  • Ar jums labiau patinka dirbti vienas ar kaip duomenų mokslininkų komandos dalis?
  • Kur matote savo karjerą po penkerių metų?
  • Koks jūsų požiūris į stresą darbe?
  • Kaip rasti motyvaciją?
  • Koks jūsų sėkmės matavimo metodas?
  • Kaip apibūdintumėte savo idealią darbo aplinką?
  • Kokios jūsų aistros ar pomėgiai už duomenų mokslo ribų?

Duomenų mokslo interviu klausimų sąrašas: lyderystė ir komunikacija

Vadovavimas ir bendravimas yra du vertingi duomenų mokslininkų įgūdžiai. Darbdaviai vertina kandidatus į darbą, kurie gali parodyti iniciatyvą, dalytis savo patirtimi su komandos nariais ir pranešti apie duomenų mokslo tikslus ir strategijas.

Štai keletas lyderystės ir komunikacijos duomenų mokslo interviu klausimų pavyzdžių:

Kas tau patinka dirbant daugiadisciplininėje komandoje?

Duomenų mokslininkas bendradarbiauja su įvairiais žmonėmis, atlikdamas techninius ir netechninius vaidmenis. Neretai duomenų mokslininkas dirba su kūrėjais, dizaineriais, produktų specialistais, duomenų analitikais, pardavimų ir rinkodaros komandomis bei aukščiausio lygio vadovais, jau nekalbant apie klientus. Taigi atsakydami į šį klausimą turite iliustruoti, kad esate komandos žaidėjas, kuris mėgaujasi galimybe susitikti ir bendradarbiauti su žmonėmis visoje organizacijoje. Pasirinkite situacijos pavyzdį, kai pranešėte aukščiausio lygio įmonės žmonėms, kad parodytumėte ne tik, jog jums patogu bendrauti su bet kuo, bet ir parodytumėte, kokios vertingos buvo jūsų duomenimis pagrįstos įžvalgos praeityje.

  • Ar galite įsivaizduoti profesinę situaciją, kai turėjote galimybę pademonstruoti lyderystę?
  • Koks jūsų požiūris į konfliktų sprendimą?
  • Koks jūsų požiūris į profesinių santykių su kolegomis kūrimą?
  • Kokį sėkmingo pristatymo pavyzdį pateikėte? Kodėl tai buvo taip įtikinama?
  • Jei kalbatės su kolega ar klientu iš netechninio išsilavinimo, kaip paaiškinate sudėtingas technines problemas ar iššūkius?
  • Prisiminkite situaciją, kai teko tvarkyti neskelbtiną informaciją. Kaip priėjote prie situacijos?
  • Kaip įvertintumėte savo bendravimo įgūdžius iš savo perspektyvos?

Duomenų mokslo interviu klausimų sąrašas: elgesys

Elgsenos interviu klausimais darbdaviai ieško konkrečių situacijų, kurios parodytų tam tikrus įgūdžius. Pašnekovas nori suprasti, kaip sprendėte situacijas praeityje, ko išmokote ir ką galite suteikti jo įmonei.

Elgesio klausimų duomenų mokslo interviu pavyzdžiai:

Ar prisimenate situaciją, kai turėjote išvalyti ir tvarkyti didelį duomenų rinkinį?

Tyrimai parodė, kad duomenų mokslininkai didžiąją laiko dalį skiria duomenims ruošti, o ne duomenų gavybai ar modeliavimui. Taigi, jei turite duomenų mokslininko patirties, beveik neabejotina, kad turite patirties valant ir tvarkant didelį duomenų rinkinį. Taip pat tiesa, kad tai yra užduotis, kuri tikrai patinka nedaugeliui. Tačiau duomenų valymas taip pat yra vienas iš svarbiausių bet kurios įmonės žingsnių. Taigi jūs turėtumėte įtraukti įdarbinimo vadybininką į procesą, kurio laikotės ruošdami duomenis: pašalinkite pasikartojančius stebėjimus, ištaisykite struktūrines klaidas, filtruokite nuokrypius, pašalinkite trūkstamus duomenis ir patvirtinkite duomenis.

  • Prisiminkite duomenų projektą, kuriame dirbote, kai susidūrėte su problema ar iššūkiu. Kokia buvo situacija, kokia buvo kliūtis ir kaip ją įveikėte?
  • Pateikite konkretų duomenų naudojimo pavyzdį siekiant pagerinti kliento ar suinteresuotosios šalies patirtį?
  • Nurodykite konkrečią situaciją, kai pasiekėte tikslą. Kaip jums tai pavyko?
  • Nurodykite konkrečią situaciją, kai nepavyko pasiekti tikslo. Kas nutiko?
  • Koks jūsų požiūris į valdymą ir griežtų terminų laikymąsi?
  • Ar prisimenate atvejį, kai darbe susidūrėte su konfliktu? Kaip su tuo susitvarkei?

Duomenų mokslo interviu klausimų sąrašas iš geriausių įmonių („Amazon“, „Google“, „Facebook“, „Microsoft“)

Kad suprastumėte kai kuriuos kitus klausimus, kurie gali iškilti pokalbio metu, sudarėme duomenų mokslo interviu klausimų iš kai kurių geriausių technologijų įmonių sąrašą.

  • Kuo skiriasi paramos vektoriaus mašina ir logistinė regresija? Pateikite situacijų pavyzdžių, kai pasirinktumėte naudoti vieną, o ne kitą.
  • Jei pašalinus trūkstamas reikšmes iš duomenų rinkinio atsiranda šališkumo, ką darytumėte?
  • Kokius rodiklius įvertintumėte žiūrėdami į produkto sveikatą, įsitraukimą ar augimą?
  • Kokius rodiklius įvertintumėte bandydami spręsti ar išspręsti su mūsų produktu susijusias verslo problemas?
  • Kaip vertinate produkto našumą?
  • Kaip sužinoti, ar naujas pastebėjimas yra išskirtinis?
  • Kaip apibrėžtumėte šališkumo ir dispersijos kompromisą?
  • Koks yra jūsų būdas atsitiktinai atrinkti pavyzdį iš produkto vartotojų populiacijos?
  • Koks yra jūsų duomenų ginčų ir valymo procesas prieš taikant mašininio mokymosi algoritmus?
  • Kaip vertintumėte nesubalansuotą dvejetainę klasifikaciją?
  • Kaip atskirti gerą ir blogą duomenų vizualizaciją?
  • Sukurkite funkciją, kuri patikrintų, ar žodis yra palindromas.

Kategori: Žinios