се очерта като едно от най-популярните полета в последно време. Нараства с невероятни темпове, както и търсенето на Data Scientist. Ролята на учен по данни е изключително динамична, за тях два дни не са еднакви и точно това го прави толкова уникален и вълнуващ. Тъй като това е ново поле, има както вълнение, така и объркване. И така, нека изчистим тези митове на изследователите на данни в следния ред:
Кой е Data Scientist?
Въпреки че има няколко определения за на разположение, основно те са професионалисти, които практикуват изкуството на науката за данни. Данните учени разбиват сложни проблеми с данните с техния опит в научните дисциплини. Това е позиция на специалисти.
Те са специализирани в различни видове умения като реч, анализ на текст (NLP), обработка на изображения и видео, медицина и симулация на материали и др. Всяка от тези роли на специалист е много ограничена по брой и следователно стойността на такъв специалист е огромна. Всичко, което набира скорост, бързо се превръща в това, за което всички говорят. И колкото повече хора говорят за нещо, толкова повече заблуди и митове се трупат. Така че нека развенчаем някои митове на Data Scientist.
какво е pojo клас в Java
Митове на Data Scientist срещу реалността
- Трябва да сте доктор на науките Притежател
Докторска степен е много голямо постижение без съмнение. Необходими са много упорита работа и отдаденост за извършване на изследвания. Но необходимо ли е да станете Data Scientist? Зависи от типа работа, за която искате да отидете.
Ако ще Роля на приложната наука за данни което се основава предимно на работа със съществуващи алгоритми и разбиране как работят. Повечето хора се вписват в тази категория и повечето от отворите и длъжностните характеристики, които виждате, са само за тези роли. За тази роля вие НЕДЕЙ нуждаете се от докторска степен степен.
Но ако искате да влезете в Изследователска роля , тогава може да се наложи докторска степен Степен. Ако работата по алгоритми или писането на хартия е вашето нещо, тогава докторска степен. е пътят.
- Data Scientist скоро ще бъде заменен от AI
Ако смятате, че куп учени за данни могат да направят всичко, свързано с Проект за AI / ML . Това не е практично решение, защото ако се съсредоточите върху някакъв проект за ИИ, към него има множество работни места. е много сложно поле с много различни роли, свързани с него като:
- Статистик
- Експерт по домейни
- IoT специалист
Учените по данни сами не могат да решат всичко и AI също не е възможно да направи това. Така че, ако сте от тези, които се страхуват от това, ДОНТ. AI все още не е в състояние да прави такива неща, имате нужда от огромно количество знания за различните домейни.
- Повече данни осигуряват по-висока точност
Съществува много голямо погрешно схващане и един от големите митове на изследователите на данни, че „колкото повече данни имате, толкова повече ще бъде точността на модела“. Повече данни не превежда с по-висока точност. От друга страна, малките, но добре поддържани данни може да имат по-добро качество и точност. Най-важното е разбирането на данните и тяхната използваемост. Това е Качество това има най-голямо значение.
- Дълбокото обучение е предназначено само за големи организации
Един от най-често срещаните митове е, че се нуждаете от значително добро количество хардуер, за да стартирате задачи за дълбоко обучение. Е, това не е съвсем невярно, моделът за задълбочено обучение винаги ще работи по-ефективно, когато има мощна хардуерна настройка, на която да работи. Но можете да го стартирате на вашата локална система или Google Colab (GPU + CPU). Просто обучението на модела на вашата машина може да отнеме повече време от очакваното.
- Събирането на данни е лесно
Данните се генерират с невероятна скорост от около 2.5 Квинтилион Байта на ден и събиране на правилни данни в правилния формат е все още тежка задача. Трябва да изградите a правилен тръбопровод за вашия проект. Има много източници за получаване на данни. Разходите и качеството имат голямо значение. Поддържането на целостта на данните и конвейера е много важна част, с която не бива да се бъркате.
- Учените по данни работят само с Инструменти / Всичко е свързано с Инструментите
Хората обикновено започват да учат инструмент, мислейки, че ще си намерят работа в науката за данни. Е, изучаването на инструмент е важно за работа като Data Scientist, но както споменах по-рано, че тяхната роля е много по-разнообразна. Учените по данни трябва да надхвърлят използването на инструмент за извличане на решения вместо това, те трябва да овладеят основни умения. Да, овладяването на инструмент създава надежда за лесно навлизане в Data Science, но компаниите, наемащи Data Scientist, вместо това няма да разглеждат само експертизата на инструмента, те търсят професионалист, придобил комбинация от технически и бизнес умения.
- Трябва да имате опит в кодирането / компютърните науки
Повечето учени по данни се справят добре с кодирането и може да имат опит в компютърните науки, математиката или статистиката. Това не означава, че хора от други среди не могат да бъдат изследователи на данни. И така, едно нещо, което трябва да имате предвид, е, че тези хора от този произход имат предимство, но това е само в началните етапи. Просто трябва да поддържате всеотдайността и упоритата работа и скоро и за вас ще бъде лесно.
плитко копие и дълбоко копие в java
- Състезанията по наука за данни и проектите в реалния живот са еднакви
Тези състезания са чудесно начало в дългото пътуване на Data Science. Можете да работите с големи масиви от данни и алгоритми. Всичко е наред, но да го разгледате като проект и да го включите в автобиографията си със сигурност не е добра идея защото тези състезания не са никак близки до реалния проект. Не можете да почистите разхвърляните данни или да създадете такива тръбопроводи или проверете ограничението за време. Важно е само точността на модела.
- Всичко е свързано с изграждането на предсказуем модел
Хората обикновено мислят, че учените по данни предсказват бъдещ резултат. Предсказуемото моделиране е много важен аспект на науката за данни, но само по себе си не може да ви помогне. Във всеки проект има такива няколко стъпки участва в цял цикъл като се започне от Събиране на данни, пререкания, анализ на данни, обучение на алгоритъма, изграждане на модел, тестване на модела и накрая внедряване. Трябва да знаете цялото процес от край до край . Нека да разгледаме финалните митове на изследователите на данни.
- AI ще продължи да се развива, след като бъде построен
Често срещано заблуждение е, че ИИ продължава да расте, да се развива и обобщава сам. Е, Sci-Fi филмите постоянно изобразяват едно и също послание. Това изобщо не е вярно, всъщност изоставаме. Максималното, което можем да направим, е да обучаваме модели, които се обучават сами, ако към тях се подават нови данни. Те не могат да се адаптират към промените в околната среда и нов тип данни.
Така. ако мислите, че еднодневните машини ще вършат цялата работа? Е, трябва да се махнеш от филмите!
Надявам се, че всички ваши митове за учени по данни вече са изчистени. Edureka също предоставя a . Включва обучение по статистика, наука за данни, Python, Apache Spark & Scala, Tensorflow и Tableau.
Имате въпрос към нас? Моля, споменете го в раздела за коментари в статията „Митове на учените по данни“ и ние ще се свържем с вас.