10 Najčešća pitanja o razgovoru znanstvenika s podacima

Područje znanosti o podacima stalno se razvija i obuhvaća nekoliko industrija i zahtijeva veliku skupinu vještina koja uključuje matematiku, statistiku, programiranje i marketing. Kao takav, za dobivanje podataka, potreban je impresivan spoj tehničke vještine, kreativnosti i komunikacije.

Opisi poslova za znanstvenike podataka mogu se uvelike razlikovati, mada svi traže kandidate sa dugačkim popisom najpoželjnijih vještina posla poput kritičkog razmišljanja, rješavanja problema, analitike podataka, emocionalne inteligencije, pažnje na detalje i timskog rada. To znači da pitanja za intervjue za znanstvenike s podacima mogu obuhvaćati nekoliko različitih tema i raspona od tipičnih upita za rješavanje vještina do izrazito tehničkih rasprava.

Intervjui o znanosti o podacima zahtijevaju veliku pripremu. Bez obzira jeste li svježi iz vrhunske škole informatike ili se želite prebaciti u drugu tvrtku ili industriju, trebalo bi vam vremena da prođete kroz glavne koncepte svog rada. Kao što znate kako voziti, ali možda imate problema s recitiranjem određenih pravila puta, možda ćete se zaglaviti u intervjuu pokušavajući artikulirati kako funkcionira određeni algoritam.

Da bismo vam pomogli u pripremi, sastavili smo 10 najčešćih pitanja o intervjuu znanstvenika s podacima. Od ranih projekcija do videozapisa u drugom i trećem stupnju i intervjua na licu mjesta, naići ćete na širok izbor ispitivanja poput ovih svojih tehničkih vještina, komunikacijskih sposobnosti i stila rada.

1. 'Recite nam nešto više o posljednjem projektu iz vašeg portfelja.'

Znanstvenici za podatke traženi su u mnogim industrijskim granama, ali tvrtke često traže nekoga s vrlo specifičnim vještinama i dobrom kulturom. Detaljan internetski portfelj koji prikazuje vrstu posla za koji ste sposobni, kao i snažna prisutnost na društvenim medijima i osobni brend, pomažu vam da se istaknete od ostalih kandidata kao i da vas povežu s zaposljavanjem menadžera i regrutova za posao za koji ste savršeno pogodno za.

Budite spremni na bilo koji znanstveno-istraživački intervju kako biste opširno razgovarali o svim elementima svog životopisa, portfelja ili web stranice. Prilagodite svoje odgovore o projektu kako bi odgovarali vašoj publici. Ako je to početni pregled ili panel s sudionicima iz raznih odjela, vaš fokus bi trebao biti na način na koji je vaš rad stvorio pozitivne rezultate za klijenta i njegovo poslovanje.

Kada dođete do dijela postupka intervjuiranja u kojem se sastajete s drugim znanstvenikom podataka, inženjerom, analitičarom ili drugom tehničkom osobom, potreban je detaljniji opis podataka i procesa koji su uključeni u vaš rad.

2. 'Zašto želite raditi za ovu tvrtku?'

Čak i ako vas se izravno kontaktira putem vašeg internetskog portfelja ili LinkedIn profila i pozovete na razgovor za otvorenu poziciju, tvrtka će i dalje htjeti znati zašto ste prihvatili i zašto mislite da ćete se dobro uklopiti u posao.

Osim što ćete brinuti o svojim tehničkim vještinama, vaša priprema za intervju trebala bi uključivati ​​i istraživanje o poslu na koji se prijavljujete. Informacije o njihovoj industriji, misiji, osoblju, točno onome što rade i koliko dobro rade, pomoći će vam da osmislite posebno prilagođeni odgovor na ovo pitanje.

Otkrijte kako će vam vještina pomoći da postignu svoje ciljeve. Pronađite način da izrazite strast prema jednom ili više aspekata vaše uloge u poslu, uključujući misiju, filozofiju, inovaciju ili liniju proizvoda. Ako je ovo vaš posao iz snova, može biti vrijedno vremena za sastavljanje projekta za znanost o podacima prije intervjua koji će za njih riješiti problem - poput privlačenja novih demografskih ili zakazivanja isporuka učinkovitije.

3. 'Nazovite podatke znanstvenike kojima se najviše divite i objasnite zašto.'

Iako je ovo vrlo osobno pitanje na koje tehnički nema pravi odgovor, odgovori koje odaberete su vrlo važni. Vaše istraživanje o tvrtki, kao i istraživanje na ploči za razgovore, mogu vam pomoći da napravite dobar prvi dojam samo s ovim pitanjem.

Poznavanje ljudi koji su istaknuti na terenu, kao i onih koji trenutno prave valove, pokazaće anketarima da ste oboje upućeni i strastveni u industriji. Korisno je razgovarati o znanstvenicima s podacima koji se cijene u specifičnoj areni karijere za koju se prijavljujete, poput financija, medicine ili na burzi.

Ovo je pitanje više nego impresivan popis imena. Dio jednadžbe 'zašto' također će pokazati potencijalnim poslodavcima što cijenite u svom području i kako ćete pristupiti svom poslu. Ako je vaše istraživanje pokazalo da tvrtka cijeni inovativnost, integritet ili čak određenu statističku metodu, ovo je odlična prilika da im daju do znanja da dijelite te iste vrijednosti.

4. 'Kako biste objasnili mehanizam preporuka nekome iz odjela marketinga?'

Jedna od važnih osobina koja znanstvenike podataka izdvaja od ostalih tehničkih genija je mogućnost pretvaranja, prikazivanja i objašnjenja podataka na način koji netehnički ljudi mogu razumjeti. Zbog toga je ovo pitanje poput jednog od najvažnijih pitanja o intervjuu znanstvenika s kojim ćete se susresti. Sugovornici žele vidjeti koliko dobro možete komunicirati s konceptima poput modeliranja podataka, stablima odluka i linearnom regresijom bilo kojoj publici.

U ovom konkretnom slučaju prvo ćete na jednostavan način objasniti kako funkcionira mehanizam preporuka s primjerima filtriranja na temelju sadržaja i kolaborativnog filtriranja. Tada ćete htjeti razgovarati o tome kako možete raditi s marketinškim odjelom kako biste kombinirali njihove vještine privlačenja kupaca snagom algoritma koji koristi prikupljene podatke kako bi pomogao u određivanju onoga što potrošači žele.

5. 'Koje su razlike između učenja pod nadzorom i izvan nadzora?'

Možete početi sažetkom da je glavna razlika između ove dvije stvari to što nadzirano učenje ima podatke o treningu iz kojih algoritam može učiti i pružiti odgovore. Učenje bez nadzora treba grupirati stvari po sličnosti, uobičajenim anomalijama i drugim procesima traženja uzoraka, a ne po tvrdim i brzim podacima.

Sugovornik će vas htjeti detaljnije upoznati, stoga je važno navesti specifične razlike i biti u mogućnosti govoriti o različitim korištenim algoritmima.

Nadzirano učenje

  • koristi poznate i označene podatke kao ulaz
  • ima mehanizam povratnih informacija
  • koristi se za predviđanje
  • njegovi zajednički algoritmi uključuju stablo odlučivanja, logističku regresiju, linearnu regresiju, stroj za podršku vektora i slučajnu šumu

Učenje bez nadzora

  • kao neoznačene podatke koristi kao ulaz
  • nema mehanizam povratnih informacija
  • koristi se za analizu
  • njegovi zajednički algoritmi uključuju K-znači grupiranje, hijerarhijsko grupiranje, autoenkoder i pravila pridruživanja

Morat ćete imati neke primjere, bilo generičke ili iz određenog projekta na kojem ste radili, kako biste ilustrirali razlike između ove dvije vrste strojnog učenja i u kojim se slučajevima svaki može koristiti. Na primjer, nekontrolirano učenje može se koristiti prilikom lansiranja novog proizvoda tamo gdje demografija kupaca kojoj bi se mogao svidjeti nepoznata.

pretplatiti

Prijavite se na naš newsletter za još sjajniji sadržaj i dobiti 20% popusta na našem testu karijere!

pretplatiti

6. 'Kako izbjegavati pristranost odabira?'

Ovo pitanje može imati puno oblika u razgovoru o znanosti o podacima. Od vas će se možda tražiti da definirate pristranost odabira, kako to izbjeći ili da date određeni primjer kako je igrao ulogu u projektu na kojem ste radili.

Glavni problem pristranosti odabira je da su zaključci izvedeni iz slučajnog uzorka. Očito je da je najlakše rješenje uvijek odabrati iz nasumičnog uzorka jasno definirane populacije. Morat ćete objasniti zašto to nije uvijek moguće.

Imajte na umu da budući da pristranosti odabira mogu biti namjerne - s odabirom predmeta ili uklanjanjem podataka koji su namijenjeni dokazu unaprijed zamišljene teorije ili projekcije - ovo bi mogao biti neizravan način da tim za zapošljavanje postavi jedno od onih teških pitanja o intervjuu u vezi etike i integriteta na poslu.,

Na kraju ćete htjeti naglasiti kako je pristranost odabira češće slučaj nenamjernih ili neizbježno pristranih podataka. Obavezno razradite neka od područja na kojima mogu nastupiti pristranosti odabira, uključujući uzorkovanje, vremenski interval, podatke i protjerivanje. Zatim navedite nekoliko primjera kako vam tehnike upotrebe preoblikovanja i poticanja mogu pomoći u rješavanju slučajnih uzoraka.

Ako ste u dijelu intervjua kada razgovarate s predstavnicima manje tehničkih odjela, poslužite se lako probavljivim primjerom koji jasno prikazuje pristranost odabira. Znanstvenik podataka Eric Hollingsworth spominje lekciju naučenu iz epidemije ptičje gripe 2011. godine u kojoj su u statistički uzorak 'potvrđenih slučajeva' ubrojene 'samo vrlo bolesne jedinke'. Rezultat toga je da je 80% smrtnih slučajeva, tako strašno zbog pristranosti odabira, stvorilo znatan strah.

7. "Kako se mogu tretirati vanjske vrijednosti?"

Ovo je uobičajeno pitanje za intervjue znanstvenicima, jer otkriva kako koristite podatke koje ste dobili, metode koje koristite za obradu tih podataka i da li ste spremni uložiti vrijeme za procjenu svakog dijela tih podataka.

Najprije ćete htjeti razgovarati o tome što predstavlja vanjski oblik, kao brojevi koji postoje izvan granica podataka na grafikonu, kao 2–3 standardna odstupanja od srednje vrijednosti, i tako dalje. Sljedeći korak s rješavanjem stranih osoba je ocjena zašto su se dogodila.

Mala količina odmetnika koja se može pripisati jednostavnoj ljudskoj ili strojnoj pogrešci lako se eliminira. Međutim, imajte na umu da čak i jedan vanjski lijek može biti ključna točka podataka, a ne problem, jer može ukazivati ​​na uspjeh jedne marketinške taktike, novog sastojka lijeka ili linije proizvoda.

Dalje, morat ćete objasniti kako se nositi s velikim brojem odmetnika, za što su potrebna složenija rješenja. Na primjer, možda ćete trebati promijeniti model koji koristite, normalizirati podatke na prosjek ili upotrijebiti slučajni šumski algoritam. Još jednom pokušajte upotrijebiti slučaj iz stvarnog života iz svog iskustva kao znanstvenik podataka kako biste objasnili ispravne taktike.

8. 'Zašto je čišćenje podataka važno?'

Prikupljanje i čišćenje podataka dominantan su dio vašeg posla kao znanstvenika podataka, zauzimajući do 80% vašeg vremena. Bez obzira na to na koju se industriju prijavljujete, pitanja za intervju uvijek će sadržavati pitanje zašto je čišćenje podataka važno. Sugovornici će vas pitati i o vašim preferiranim tehnikama i programima čišćenja.

Trebali biste naglasiti koliko su čisti podaci potrebni kako biste izvukli ispravne zaključke, ali ne radi se samo o brojkama. Objasnite kako započinjanje s cjelovitim, točnim, valjanim i jednoličnim podacima izravno utječe na njihovo poslovanje. Ključne prednosti koje treba raspravljati uključuju:

  • poboljšane odluke o ciljevima tvrtke
  • brže kupnje i preusmjeravanje prošlih kupaca
  • ušteda vremena i resursa zbog uklanjanja netočnih ili duplikata podataka
  • poboljšana produktivnost
  • pojačan moral tima zahvaljujući opetovanim učinkovitim i točnim rezultatima

9. 'Koji je cilj A / B testiranja?'

Pitanja o A / B testiranju tijekom razgovora za položaj znanstvenika za podatke mogu započeti općenitijom referencom korištenja eksperimentalnog dizajna za odgovor na jedno pitanje o ponašanju ili sklonostima korisnika. Cilj testiranja varijable dizajna web stranica, aplikacija ili biltena jednostavno je procijeniti hoće li promjena povećati stopu interesa, angažmana i konverzije.

Jedan od načina da se izdvojite u odgovaranju na ove vrste pitanja za intervju je rasprava o tome kako bi drugi znanstvenici mogli izvući pogrešne zaključke iz A / B testiranja. Moguće zamke uključuju:

  • ne prikuplja dovoljno podataka tijekom dovoljno dugog razdoblja
  • testiranje previše varijabli odjednom
  • ne uzimajući u obzir vanjske čimbenike koji mogu utjecati na promet tijekom razdoblja ispitivanja
  • zanemarujući male dobitke koji se mogu vremenom povećati i kombinirati s ostalim pozitivnim promjenama za povećani prihod
  • nedostaju tumačenja velike slike poput neto financijske dobiti ili gubitka u odnosu na stope konverzije

Osim što ćete ukazivati ​​na ove probleme, morat ćete izraziti kako biste ih riješili - ili, još bolje, kako ste ih već izbjegli u svojim prethodnim projektima iz područja znanosti o podacima.

10. "Imate 48 sati da riješite ovaj izazov kodiranja."

Izazov kodiranja može biti početni način provjere potencijalnih znanstvenika podataka ili je možda drugi korak u razgovornom procesu nakon što ste prvu prepreku očistili s regrutom ili upraviteljem zapošljavanja. Ovo može biti test na licu mjesta koji traje 30 minuta do 2 sata, a kod pregledavača koji se kodira kodiranje na ploči ili na tipkovnici. Često vam se daje izbor jezika, ali budite spremni za kodiranje u SQL ili Python.

Neke tvrtke dodjeljuju duže zadatke, s rokovima do tjedan dana. Izazovi na bijeloj ploči mogu zahtijevati pisanje prilično jednostavnih SQL upita, ali duži su testovi, naravno, složeniji. Obično će vam se dati podaci i tražiti da napravite određena predviđanja pomoću tih podataka i morat ćete pokazati svoj posao. Na primjer, nedavni intervju s znanstvenikom podataka dobio je Airbnb podatke i tražio da predvidi cijene kuća na temelju značajki smještaja.

Sugovornici će htjeti s vama razgovarati o vašem izboru, pretpostavkama koje ste dali, funkcijama koje ste odabrali, zašto ste koristili određene algoritme i još mnogo toga. Često je odgovor na koji stižete manje važan od vašeg procesa, kreativnosti, čitljivosti koda i dizajna.

To može biti nervozno iskustvo intervjua, stoga se pripremite kreiranjem i dovršavanjem prakse kodiranja izazova s ​​prijateljima ili kolegama na polju podataka o znanosti. Možete i posjetiti web mjesta poput Leetcode-a i SQLZOO radi vježbi kodiranja. Stvarni ismijani intervjui koji uključuju algoritamske probleme i probleme u dizajnu sustava dostupni su besplatno putem Interviewing.io.

Kao što vidite, pitanja za intervjuiranje znanstvenika s podacima mogu biti teška, a cjelokupni proces može biti dugotrajan i naporan. Jedan od najvažnijih savjeta za razgovor je ostati pozitivan, čak i ako mislite da je dio postupka intervjuiranja prošao loše. Često smo teže prema sebi nego drugima, a još uvijek biste mogli spustiti posao iako niste dobili svaki odgovor savršen kao što biste željeli.

Ako propustite priliku, tražite povratne informacije i iskoristite je za poboljšanje vašeg sljedećeg iskustva s intervjuima. Uostalom, mnogi dobro uspostavljeni podaci znanstvenici su odbijeni s nekoliko pozicija i još uvijek su išli dalje do uspjeha u poslovima koji su na kraju bili u najboljem redu!

S kojim ste se pitanjima i izazovima kodiranja susreli dok ste pokušali započeti posao znanosti o podacima? Pridružite se raspravi u komentarima ispod i pomozite kolegama koji se bave podacima da se pripreme za sljedeći intervju!

Ostavite Komentar

Please enter your comment!
Please enter your name here