Както се казва, че цялата Вселена и нашата галактика са се образували поради експлозията на Големия взрив, по подобен начин, поради толкова много технологични постижения, данните също нарастват експоненциално, което води до експлозия на Големите данни. Тези данни идват от различни източници, имат различни формати, генерират се с променлива скорост и могат също да съдържат несъответствия. По този начин можем просто да определим експлозията на такива данни като .Ще обясня следните теми в този блог, за да ви дам представа за Анализ на големи данни:
- Защо Анализ на големи данни?
- Какво представлява Big Data Analytics?
- Инструменти за големи данни
- Домейни за големи данни
- Случаи за използване на големи данни
- Тенденции в анализа на големи данни
Защо Анализ на големи данни?
Преди да скоча, за да ви разкажа какво е Анализ, позволете ми да ви разкажа защо е необходим. Позволете ми също да ви разкрия, че ние създаваме около 2,5 квинтилиона байта данни всеки ден! Така че сега, когато сме натрупали Големи данни, нито можем да ги игнорираме, нито да оставим да остане без работа и да ги накара да отидат на вятъра.
Различни организации и сектори по целия свят започнаха да възприемат Big Data Analytics, за да получат множество предимства. Big Data Analytics дава информация, която много компании превръщат в действия и реализират огромни печалби, както и открития. Ще изброя четири такива причини заедно с интересни примери.
Първата причина е,
- По-интелигентна и по-ефективна организация
Позволете ми да ви разкажа за една такава организация, полицейското управление в Ню Йорк (NYPD). NYPD използва брилянтно големи данни и анализи за откриване и идентифициране на престъпления, преди те да се случат. Те анализират исторически модели на арести и след това ги картографират със събития като федерални празници, заплати, трафик потоци, валежи и т.н.Това им помага да анализират информацията незабавно, като използват тези модели на данни. Стратегия за големи данни и анализпомагате идентифицират местата на престъпления, чрез които разполагат своите служители на тези места. По този начин, достигайки до тези места преди извършването на престъпленията, те предотвратяват появата на престъпление.
- Оптимизирайте бизнес операциите, като анализирате поведението на клиентите Повечето организации използват поведенчески анализ на клиентите, за да осигурят удовлетвореност на клиентите и следователно да увеличат своята клиентска база. Най-добрият пример за това е Amazon. Amazon е един от най-добре използваните уебсайтове за електронна търговия с клиентска база от около 300 милиона. Те използват клиентски данни за кликване и исторически данни за покупки, за да им предоставят персонализирани резултати на персонализирани уеб страници. Анализирам кликванията на всеки посетител на уебсайта му им помага да разберат поведението си при навигация на сайта, пътищата, по които потребителят е закупил продукта, пътищата, които са ги накарали да напуснат сайта и други. Цялата тази информация помага на Amazon да подобри потребителския си опит, като по този начин подобрява продажбите и маркетинга си.
- Намаляване на разходите Технологиите за големи данни и технологичния напредък като облачните изчисления носят значителни предимства при разходите, когато става въпрос за съхранение и обработка на големи данни. Позволете ми да ви кажа как здравеопазването използва Big Data Analytics, за да намали разходите си. В днешно време пациентите използват нови сензорни устройства, когато са у дома или отвън, които изпращат постоянни потоци от данни, които могат да бъдат наблюдавани и анализирани в реално време, за да помогнат на пациентите да избегнат хоспитализация чрез самоуправление на техните условия.За хоспитализирани пациенти лекарите могат да използват прогнозни анализи за оптимизиране на резултатите и намаляване на реадмисиите.Болница Паркленд използва аналитика и прогнозно моделиране за идентифициране на високорискови пациенти и прогнозиране на вероятни резултати, след като пациентите бъдат изпратени у дома. В резултат на това Parkland намали 30-дневните реадмисии за пациенти със сърдечна недостатъчност с 31%, спестявайки 500 000 $ годишно.
Продукти от ново поколение
С възможността да се измерват нуждите и удовлетвореността на клиентите чрез анализ, идва силата да се даде на клиентите това, което те искат. Тук намерих три толкова интересни продукта, които да цитирам. Първо , Googleсамоуправляваща се колакоето прави милиони изчисления при всяко пътуване, които помагат на колата да реши кога и къде да се обърне, дали да намали скоростта или да ускори и кога да смени лентата - същите решения, които човешкият шофьор взема зад волана.
The второ един еNetflix, който се ангажира в продължение на два сезона от изключително популярното си шоу House of Cards, като напълно се довери на Big Data Analytics! Миналата година Netflix увеличи своята абонатна база в САЩ с 10% и добави близо 20 милиона абонати от цял свят.
The трето пример е едно от наистина страхотните нови неща, на които съм попадал, е умна йога постелка. Първият път, когато използвате вашия Smart Mat, той ще ви преведе през поредица от движения, за да калибрирате формата на тялото, размера и личните си ограничения. Тази информация за личния профил се съхранява във вашето приложение Smart Mat и ще помогне на Smart Mat да разпознае кога сте изравнени или балансирани. С течение на времето той автоматично ще се развива с актуализирани данни, докато подобрявате йога практиката си.
Какво представлява Big Data Analytics?
Сега нека дефинираме официално „Какво представлява Анализът на големите данни?“ Анализът на големи данни изследва големи и различни видове данни, за да разкрие скрити модели, корелации и други прозрения. По принцип Big Data Analytics се използва до голяма степен от компаниите, за да улесни техния растеж и развитие. Това включва основно прилагане на различни алгоритми за извличане на данни върху дадения набор от данни, които след това ще им помогнат за по-добро вземане на решения.
Етапи в анализа на големи данни
Това са следните етапи, включени в процеса на анализ на големи данни:
Видове анализ на големи данни
Има четири типа:
- Описателен анализ: Той използва агрегиране на данни и извличане на данни, за да даде представа за миналото и да отговори: „Какво се е случило?“ Дескриптивният анализ прави точно това, което подсказва името, те „описват“ или обобщават сурови данни и ги правят интерпретируеми от хората.
- Предсказуем анализ: Той използва статистически модели и техники за прогнози, за да разбере бъдещето и да отговори: „Какво може да се случи?“ Предсказуемият анализ предоставя на компаниите полезна информация, базирана на данни. Той предоставя оценки за вероятността от бъдещ резултат.
- Анализ на предписанията: Той използва алгоритми за оптимизация и симулация, за да даде съвети за възможни резултати и отговори: „Какво да правим?“ Позволява на потребителите да „предписват“ редица различни възможни действия и да ги насочват към решение. Накратко, този анализ е свързан с предоставяне на съвети.
- Диагностичен анализ: Използва се за определяне защо нещо се е случило в миналото. Характеризира се с техники като пробиване, откриване на данни, извличане на данни и корелации. Диагностичната аналитика разглежда по-задълбочено данните, за да разбере първопричините за събитията.
Голяма информация Инструменти
Това са някои от следните инструменти, използвани за Анализ на големи данни: Hadoop , , Apache HBase , Apache Spark , , , Apache Hive , Кафка .
Домейни за големи данни
- Здравеопазване: Здравеопазването използва анализ на големи данни, за да намали разходите, да прогнозира епидемии, да избегне предотвратими заболявания и да подобри качеството на живот като цяло. Един от най-разпространенитеприложението на големи данни в здравеопазването е Електронна здравна карта (EHRs).
- Телеком: Те са един от най-значимите участници в Big Data. Телекомуникационната индустрия подобрява качеството на услугата имаршрутизира трафика по-ефективно. Анализирайки записите на данните за обажданията в реално време, тези компании могат да идентифицират измамно поведение и да действат незабавно върху тях. Маркетинговото подразделение може да модифицира своите кампании, за да насочи по-добре своите клиенти и да използва получената информация за разработване на нови продукти и услуги.
- Застраховка: Тези компании използват анализ на големи данни за оценка на риска, откриване на измами, маркетинг, прозрения за клиентите, опит на клиентите и др.
- Правителство: Индийското правителство използва анализ на големи данни, за да получи оценка на търговията в страната. Те използваха централните фактури за данък върху продажбите, за да анализират степента, в която държавите търгуват помежду си.
- Финанси: Банките и фирмите за финансови услуги използват анализи, за да разграничат измамни взаимодействия от легитимни бизнес транзакции. Системите за анализ предлагат незабавни действия, като например блокиране на нередовни транзакции, което спира измамата преди да се случи и подобрява рентабилността.
- Автомобил: Rolls Royce, който е приел Big Data, като е поставил стотици сензори в своите двигатели и задвижващи системи, които записват всяка малка подробност за тяхната работа. Промените в данните в реално време се докладват на инженери, които ще решат най-добрия начин на действие, като например планиране на техническо обслужване или изпращане на инженерни екипи.
- Образование: Това е едно поле, в което Анализът на големите данни се усвоява бавно и постепенно.Изборът на технология, базирана на големи данни, като инструмент за обучение вместо традиционните лекционни методи, подобри обучението на учениците, както и помогна на учителите да проследят по-добре представянето си.
- На дребно: Търговията на дребно, включително електронна търговия и магазини, широко използва Анализ на големи данни, за да оптимизира своя бизнес. Например Amazon, Walmart и др.
Случаи за използване на големи данни
Първият случай на употреба, който взех тук, е на Starbucks.
Вторият случай на употреба, който искам да споделя с вас, е на Procter & Gamble.
Тенденции в анализа на големи данни
Изображението по-долу изобразява пазарни приходи от Big Data вмилиардЩатски долари от 2011 г. до 2027 г.
Ето няколко Факти и статистика от Форбс :
Перспективи за кариера в Анализ на големи данни:
- Аспекти на заплатите: Средната заплата на аналитичните работни места е около 94 167 долара. Data Scientist е обявен за най-добрата работа в Америка от три години насам, със средна основна заплата от 110 000 долара и 4524 работни места. В Индия процентът на специалистите по аналитика, които командват заплати по-малко от INR 10 Lakhs, е по-нисък. 17% през 2016 г. до двадесет и едно% през 2017 г. до 22,3% през 2018г.
- Огромни възможности за работа: Компании като Google, Apple, IBM, Adobe, Qualcomm и много други наемат професионалисти от Big Data Analytics.
Набор от умения
Това са някои от уменията, които се изискват в зависимост от ролята в областта на Big Data Analytics:
- Основно програмиране: Човек трябва да има познания за поне някакъв език за програмиране с общо предназначение като Java и Python.
- Статистически и количествен анализ: Да имате представа за статистиката и количествения анализ е идеално.
- Съхранение на данни: Необходими са познания за SQL и NoSQL бази данни.
- Визуализация на данни: Много е важно да знаете как да визуализирате данните, за да можете да разберете прозренията и да ги приложите в действие.
- Специфични бизнес знания: Човек задължително трябва да е наясно с бизнеса, в който прилага анализи, за да оптимизира своите операции.
- Изчислителни рамки: За предпочитане е човек да знае поне един или два инструмента, които са необходими за Big Data Analytics.
След като вече знаете Анализ на големи данни, разгледайте от Edureka, доверена компания за онлайн обучение с мрежа от над 250 000 доволни учащи, разпространени по целия свят. Курсът за обучение по сертифициране на големи данни Hadoop на Edureka помага на обучаващите се да станат експерти в HDFS, прежди, MapReduce, Pig, Hive, HBase, Oozie, Flume и Sqoop, като използват случаи в реално време за търговия на дребно, социални медии, авиация, туризъм, финанси.
създаване на копие на обект Java
Имате въпрос към нас? Моля, споменете го в раздела за коментари и ние ще се свържем с вас.