Въпроси за интервю за Google Data Science: Всичко, което трябва да знаете, за да го пробиете



Тази статия ви предоставя куп въпроси за интервюта на Google за наука за данни, процеса на интервю и предпоставките за кандидатстване за работа в Google.

Наемането на работа в глобално известна компания като Google е работа на мечта за много хора. Те са имали едни от най-талантливите учени в областта на ИИ, и в света. Няма много източници за Google Интервюирайте въпроси онлайн и не е лесно да си намерите работа там. И така, в тази статия ще разгледам следните теми:

Описание на длъжността и изисквания

Със средна заплата от $ 169 067 , включително бонус. Заплатата на Google Data Scientist варира от 120 000 - 280 000 долара . С тази висока заплата трябва да знаете правилните изисквания за работата, която кандидатствате. Въпреки че изискванията варират от позиция до позиция, по-долу са някои от най-често срещаните:

Минимално изискване:





google

  • Магистърска степен по количествена дисциплина (статистика, оперативни изследвания, компютърни науки)
  • 2 години трудов опит в областта на анализа на данни
  • Опит със статистически софтуер (напр. R , , MATLAB, Pandas) и
  • Опит с езици на бази данни (напр. SQL )

Отговорности:



задаване на път на класа за java
  • Работете с големи, сложни набори от данни. Решаване на трудни, нерутинни аналитични проблеми, като се прилагат съвременни аналитични методи, ако е необходимо
  • Провеждане на анализ, който включва събиране на данни и спецификация на изискванията, обработка, анализ, текущи резултати и презентации
  • Изграждане и прототип на конвейери за анализ итеративно, за да предостави прозрения в мащаб
  • Развийте всеобхватни познания за структурите и показателите на данни на Google, застъпвайки се за промени, когато това е необходимо за разработване на продукти
  • Взаимодействайте междуфункционално, като правите бизнес препоръки (напр. Разходи-ползи, прогнозиране, анализ на експеримента)
  • Проучете и разработете методи за анализ, прогнозиране и оптимизиране, за да подобрите качеството на продуктите на Google, ориентирани към потребителите

Процес на интервю за Google Data Science

Изчистването на краткия списък само по себе си е трудна задача, която изцяло зависи от вашите Автобиография, мотивационно писмо и Опит . Google Наука за данните Въпросите за интервю са комбинация от мозъчни тийзъри и технически въпроси. Обикновено първият процес е телефонен интервю.

Телефонен интервю:

Състои се от Въпроси, базирани предимно на (конкретни и теоретични) и силно базирани на . Въпросите също варират в зависимост от проектите, по които сте работили.
  • Случай 1: Интервютата бяха попитали за техниките за извличане на характеристики, PCA (използвани в проекти), корелационен анализ, някои използвани техники за класификация (SVM, GBM, невронна мрежа). Защо не логистична регресия, защо GBM? - Основно въпросите се въртят около разделянето на класовете.
  • Случай 2: Защо да използвам избора на функции? Ако два предиктора са силно корелирани, какъв е ефектът върху коефициентите в логистичната регресия? Какви са доверителните интервали на коефициентите?
  • Случай 3: Дискът се върти на шпиндел и вие не знаете посоката, по която се върти дискът. Осигурен ви е комплект щифтове. Как ще използвате щифтовете, за да опишете по какъв начин се върти диска?
След телефонните интервюта това са Face to Face и кодиращи кръгове. И така, нека обсъдим някои от най-често срещаните въпроси за интервюта в Google Data Science. Въпреки че тези въпроси може да не се задават точно както е дадено по-долу, аз се опитах да обхвана много от тях.

Въпроси за интервю за Google Data Science

Тези въпроси не са озадачаващи, тъй като Google е спрял да ги задава вместо това, те имат подобни въпроси, които те наричат Въпроси за решаване на проблеми . Задават се много въпроси за машинно обучение, от общите до практическите. Google основно покрива широчината на темите, а не дълбочината. Q1. Вие сте в казино и имате два зарове, с които да играете. Печелите $ 10 всеки път, когато хвърлите 5. Ако играете, докато спечелите и след това спрете, какво е очакваното изплащане? Q2. На път сте да се качите на самолет за Лондон, искате да знаете дали трябва да си вземете чадър или не. Обаждате се на трима от вашите случайни приятели и като всеки един от тях, ако вали. Вероятността приятелят ви да казва истината е 2/3, а вероятността да ви изиграят шега с лъжа е 1/3. Ако и трите от тях казват, че вали, тогава каква е вероятността в Лондон да вали. Q3. Как бих добавил ново Facebook членове в базата данни на членовете и да кодират връзките им с другите в базата данни? Q4. Как ще проверите дали има повишена вероятност потребителят да остане активен след 6 месеца, като се има предвид, че потребителят има повече приятели сега? Q5. Получават се 40 карти с четири различни цвята - 10 зелени, 10 червени, 10 сини и 10 жълти картона. Картите от всеки цвят са номерирани от една до десет. Две карти се избират на случаен принцип. Разберете вероятността избраните карти да не са с еднакъв брой и един и същи цвят. Q6. Създайте програма на език по ваш избор за четене на текстов файл с различни туитове. Резултатът трябва да бъде 2 текстови файла - един, който съдържа списък на всички уникални думи сред всички туитове, заедно с броя на повторените думи, а вторият файл трябва да съдържа средния брой уникални думи за всички туитове. Q7. Какво ще направите, ако премахването на липсващите стойности от набора от данни води до пристрастия? Q8. Дискът се върти на шпиндел и вие не знаете посоката, по която се върти дискът. Осигурен ви е комплект щифтове. Как ще използвате щифтовете, за да опишете по какъв начин се върти диска? В9. Как ще проектирате механизъм за препоръки за работни места? Q10. Какъв продукт искате да създадете в Google? Q11. Автомобилите са имплантирани със скоростен тракер, за да могат застрахователните компании да проследяват състоянието ни на шофиране. Въз основа на тази нова схема на какъв вид бизнес въпроси може да се отговори? Q12. Как можете да решите дали единият алгоритъм е по-добър от другия? Q13. Кутия има 12 червени и 12 черни карти. Друга кутия има 24 червени и 24 черни карти. Искате да изтеглите две карти на случаен принцип от една от двете кутии, която кутия има по-голяма вероятност да получите карти от един и същи цвят и защо? Q14. Каква е разликата между модел в торби и усилен модел? Q15. Създавате отчет за качване на потребителско съдържание всеки месец и наблюдавате внезапно нарастване на броя на качванията за месец януари. Увеличението на качванията е, особено при качванията на изображения. Какво мислите, че ще бъде причината за това и как ще тествате този внезапен скок? Q16. Вие притежавате предприятие за облекло и искате да подобрите своето място на пазара. Как ще го направите от нивото на земята? Q17. Как ще решите кои версии на двата алгоритъма за ценови пренапрежение работят по-добре за всяка авиационна компания? Q18. Каква е степента на свобода за ласо? Q19. Каква е разликата между разбирането на итератор, генератор и списък в Python? Q20. Като се има предвид набор от уеб страници и промени на уебсайта, как ще тествате новата функция на уебсайта, за да определите дали промяната работи положително? Q21. Като се има предвид матрица с размери MxN с всяка клетка, съдържаща азбука, намерете дали в нея се съдържа низ или не. Q22. Как ще изградите кешираща система, използвайки усъвършенствана структура от данни като hashmap? Q23. Ако можете да получите набора от данни по всяка интересуваща тема, независимо от методите или ресурсите за събиране, как би изглеждал наборът от данни и какво ще направите с него? Q24. Какви са методите за откриване на аномалии? Q25. Как работи кеширането и как го използвате в науката за данни? И така, момчета, с това приключваме тази статия. Въпросите за интервю за Google Data Science са предимно базиран на сценарий и изискват да имате Способности за решаване на проблеми и освен това трябва да знаете как да приложите Data Science към тези ситуации. Надявам се, че това ще ви даде перспектива да бъдете подготвени за интервю за наука за данни в бъдеще. Било то Google, Microsoft, Apple или Uber. Всички технологични гиганти задават подобни видове въпроси, когато става въпрос за Data Science, тъй като това е огромно и в същото време ново поле. ви прави владеещи инструментите и системите, използвани от специалистите по Data Science. Включва обучение по статистика, наука за данни, Python, Apache Spark & ​​Scala, Tensorflow и Tableau. Учебната програма е определена от обширни изследвания върху над 5000 описания на длъжности по целия свят. Ако имате някакви въпроси, не се колебайте да споменете в раздела за коментари по-долу.