Двама анализатори от LinkedIn въведоха термина „учен за данни“ през 2008 г. Те просто се опитваха да опишат какво правят, т.е. да извлекат бизнес стойност от масивните данни, генерирани от уебсайта им. В процеса те в крайна сметка назоваха длъжността, която ще види невероятно търсене през следващите години и дори ще бъде наречена ‘Най-секси работа от 21-теулвек. “
Сега организации, които считат „данните“ за ценен актив, търсят тези експерти по данни или „учени“, които да ги водят в бъдещето.
И така, какво е необходимо, за да бъдеш велик учен по данни? ... Разнообразие от набори от умения!
Кратък поглед върху основните умения на учен по данни.
Процесът на науката за данни включва 3 етапа.
- Заснемане на данни
- Анализ на данни
- Презентация
Нека разгледаме по-отблизо ролята на учен по данни във всеки от тези етапи.
Заснемане на данни
- Умения за програмиране и база данни
Първата стъпка от извличането на данни е да се уловят правилните данни. Така че, за да сте учен по данни, е много важно да сте запознати с инструменти и технологии, особено тези с отворен код като Hadoop, Java, Python, C ++ и технологии за бази данни като SQL, NoSQL, HBase и т.н.
- Бизнес домейн и опит
Данните се различават в зависимост от бизнеса. Следователно разбирането на бизнес данните се нуждае от експертиза, която идва само чрез работа в определен домейн от данни.
Например: Данните, събрани от медицинската област, ще бъдат напълно различни от данните в магазина за дрехи на дребно.
- Моделиране на данни, склад и неструктурирани умения за данни
Организациите събират огромно количество данни чрез различни ресурси. Данните, уловени по този начин, са неструктурирани и трябва да бъдат организирани преди анализ. Следователно, учен по данни трябва да бъде опитен в моделирането на неструктурирани данни.
Анализ на данни
- Статистически умения
Основното умение на учения за данни е да знае как да използва статистическите инструменти като R, Excel, SAS и т.н. Тези инструменти са необходими за смилане на уловените данни и тяхното анализиране.
- Математически умения
Само познанията по компютърни науки не са достатъчни, за да сте учен по данни. Профилът на учения за данни изисква някой, който може да разбира мащабни алгоритми и програмиране на машинно обучение, като същевременно е опитен статистик. Това се нуждае от опит в други научни и математически дисциплини, освен компютърните езици.
Презентация
- Умения за инструменти за визуализация
Може да сте в състояние да добиете и моделирате събраните данни, но можете ли да ги визуализирате?
Ако искате да бъдете успешен учен за данни, трябва да можете да работите с някои инструменти за визуализация на данни, за да представите визуално анализи на данни. Някои от тях включват R, Flare, HighCharts, AmCharts, D3.js, Processing и API за визуализация на Google и др.
Но това не е краят! Ако наистина искате да станете учен по данни, трябва да притежавате и следните умения:
- Комуникационни умения: Статистиката и Excel са сложните за справяне. Учените по данни трябва да могат да представят данните по начин, който да съобщава резултатите на бизнес потребителите.
- Бизнес умения : Учените по данни ще трябва да играят множество роли. Те ще трябва да общуват с различни хора в организацията. Следователно наличието на силни бизнес умения, които включват комуникация, планиране, организиране и управление, ще бъде от голяма помощ. Това включва разбиране на изискванията за бизнес и приложения и съответното тълкуване на информацията. Освен това той трябва да има цялостно разбиране за ключовите предизвикателства в бранша и да знае финансовите коефициенти за по-добро вземане на решения. В крайна сметка, учен по данни, който също мисли „Бизнес“.
- Умения за решаване на проблеми: Това изглежда очевидно, тъй като науката за данните е свързана с решаване на проблеми. Ефективният учен за данни трябва да отдели време и да разгледа задълбочено проблема и да намери възможно решение, което да отговаря на потребителя.
- Умения за прогнозиране: Ученият за данни също трябва да бъде ефективен предсказвач. Той трябва да има широки познания за алгоритмите, за да избере правилния, за да се побере правилно модела на данните. Това включва определено количество креативност за използване и разумно представяне на данните.
- Хакване: Знам, че звучи страшно, но различни хакерски умения като манипулиране на текстови файлове в командния ред, разбиране на векторизирани операции и алгоритмично мислене ще ви направят по-добър учен за данни.
Разглеждайки горните набори от умения, става ясно, че да си учен по данни не е само да знаеш всичко за данните. Това е профил на работата с обединяване на умения за данни, математически умения, бизнес умения и комуникативни умения. С всички тези умения заедно, Data Scientist може с право да бъде наречен Рок звездата в областта на ИТ.
как да стана ai инженер -
Проверете списъка, за да станете страхотен и ефективен учен за данни:
Ние разгледахме уменията, необходими за да станете учен по данни. Има огромна разлика просто да станете учен по данни и да станете страхотен и ефективен учен по данни. Следните умения, заедно с гореспоменатите умения, ви отличават от това да сте нормален или дори посредствен учен за данни.
- Математически умения - Изчисления, матрични операции, числена оптимизация, стохастични методи и др.
- Статистически умения - Регресионни модели, трес, класификации, диагностика, приложна статистика и др.
- Комуникация - Визуализация, презентация и писане.
- База данни - Освен CouchDB, знания в нетрадиционни бази данни като MongoDB и Vertica.
- Програмни езици - Pig, Hive, Java, Python и др.
- Обработка на естествен език и Извличане на данни.
Edureka има специално подготвен което ви помага да придобиете опит в алгоритмите за машинно обучение като клъстери K-Means, дървета за вземане на решения, случайна гора, наивни Bayes. Ще научите понятията за статистика, времеви редове, извличане на текст и въведение в дълбокото обучение. Скоро започват нови партиди за този курс !!