Абсолютно! Никога не е имало по-добър момент да добавите умения за Hadoop към автобиографията си. Нека установим това с няколко факта и примера.
Чудили ли сте се някога каква технология стои зад функцията за автоматично маркиране на Facebook? Какво ще кажете за камери за наблюдение, които могат да генерират безупречни изображения дори при слаба светлина? Отговорът е Hadoop и неговите новаторски способности да съхранява, обработва и извлича данни.
Съхраняването на данни е едно, но обработката и заявката им е съвсем различна игра с топка. Ако Big Data е отбор по ръгби, тогава Hadoop е най-добрият защитник, който можете да намерите!
Благодарение на Hadoop, Facebook може да съхранява цялата информация за даден човек и посочва точния час и дата на дейност в неговия / нейния профил. Цялата информация за даден човек е Big Data и Hadoop помага да се изобрази цялата.
Всички данни на Hadoop се съхраняват върху HDFS (Hadoop Distributed File System), която може да съхранява както структурирани, така и неструктурирани данни. Конкурентите на Hadoop (като RDBMS и Excel) могат да съхраняват само структурирани данни. Това е основният фактор, поради който Hadoop е големият татко, който дава традиционни инструменти за обработка на данни да търсят пари. Hadoop извършва обработката в близост до данните, докато RDBMS има нужда данните да бъдат прехвърлени през мрежата чрез I / O за обработка на същите данни.
python __init__ самостоятелно
Храна за размисъл: Може ли Hadoop да предвиди резултатите от ситуацията въз основа на набор от данни?
Тази графика показва експоненциалния ръст на данните през годините. Погледнете го отблизо и ще забележите, че неструктурираните данни представляват 90% от всички данни в света. Просто прилагайте принципа на търсенето и предлагането и ние можем да осъзнаем, че все повече и повече неструктурирани данни, които се носят наоколо, само пораждат професионалисти, които могат да поправят тези данни. Това е достатъчна причина човек да търси работа, занимаваща се с неструктурирани данни, известни още като Big Data. Не се съмнявайте изобщо, че е точното време да научите Hadoop.
може ли конструктор да бъде частен
В действителност, колко ефективен е Hadoop в сравнение с RDBMS?
Hadoop избива всеки друг инструмент за обработка на данни направо извън парка. RDBMS и Excel може да са ефективни при управлението на данни, които не надвишават няколкостотин листа на Excel, но какво ще кажете за хиляда такива файлове, които трябва да се поддържат? Да се върнем отново към примера на Facebook. Дневникът с данни, съдържащ подробности за активността на потребител на Facebook, не може да се съхранява в Excel, поне не всички исторически данни на потребител, датиращи от десетилетия. Също така в Hadoop данните могат да бъдат свободно структурирани, но RDBMS изисква данните да бъдат по-последователни и в разпознаваем формат.
Разгледайте сравнението между RDBMS и Hadoop и сами ще разберете кои цени са по-добри.
Имам една окончателна статистика за вас, която ще запечата всички съмнения дали Hadoop е добър избор в кариераталед.
Тази графика е илюстрация на нарастващото търсене на професионалисти от Hadoop и тя ще нарасне едва през следващите седмици.
За съжаление, вие и аз не можем да променим технологията. В най-добрия случай можем да сме в крак с него и да научим развиващите се технологии и да станем незаменими за нашите работни места. Точният момент е да научите Hadoop и да яхнете вълната Big Data.
Имате въпрос към нас? Моля, споменете го в раздела за коментари и ние ще се свържем с вас.
Подобни публикации:
Имате ли нужда от Java, за да научите Hadoop?
е магистър следдипломна степен