Голяма Информация

Spark срещу Hadoop: Коя е най-добрата рамка за големи данни?

Тази публикация в блога говори за apache spark срещу hadoop. Това ще ви даде представа коя е правилната рамка за големи данни, която да изберете в различни сценарии.

Стартиране на приложението Scala в Eclipse IDE с помощта на Sbteclipse

Този блог ви помага да разберете как да инсталирате и настроите приставката sbteclipse с инструкции стъпка по стъпка за стартиране на приложението Scala в Eclipse IDE.

Овладяхте Hadoop? Време е да започнете с Apache Spark

Тази публикация в блога обяснява защо трябва да започнете с Apache Spark след Hadoop и защо изучаването на Spark след овладяване на hadoop може да направи чудеса за вашата кариера!

Пробиване на тренировка Apache, New-Age Query Engine

Този урок за Apache Drill ви дава цялата информация, от която се нуждаете, за да започнете с машината за заявки на Apache Drill, използване с Hadoop, Big Data & Apache Spark.

Apache Spark комбинацияByKey Обяснено

Този блог на Spark Hadoop ви разказва всичко, което трябва да знаете за Apache Spark combByKey. Намерете средния резултат на ученик, използвайки метода combByKey.

Apache Falcon: Нова платформа за управление на данни за екосистемата Hadoop

Apache Falcon е нова платформа за управление на данни за екосистемата Hadoop, която опростява вградената обработка на фуражи и управлението на фуражи в клъстерите на hadoop. Научете как да го настроите.

Обяснени искрови акумулатори: Apache Spark

Този блог на Apache Spark обяснява подробно акумулаторите на Spark. Научете използването на акумулатор Spark с примери. Акумулаторите на искри са като броячите на Hadoop Mapreduce.

Apache Flink: Следващото поколение рамка за анализ на големи данни за обработка на потоци и партиди данни

Научете всичко за Apache Flink и настройка на Flink клъстер в този блог. Flink поддържа обработка в реално време и периодично и е задължителна технология за големи данни за Big Data Analytics.

Разпределено кеширане с излъчвани променливи: Apache Spark

Тази публикация в блога обсъжда разпределеното кеширане с излъчвани променливи и ви дава началото на ефективното разпространение на големи стойности в програмирането на Spark.

Сертификати за CCA и CCP от Cloudera: Всичко, което трябва да знаете

CCA и CCP сертификатите от Cloudera са заменили CCDH и CCSHB изпитите. Този блог ви разказва всичко, което трябва да знаете за новите сертификати.

Състоятелни трансформации с прозорци в Spark Streaming

Тази публикация в блога обсъжда трансформации със състояние с прозорци в Spark Streaming. Научете всичко за проследяването на данни между партиди, използвайки D-потоци с пълно състояние.

Кумулативна трансформация на състоянието в Apache Spark Streaming

Тази публикация в блога обсъжда трансформации със състояние в Spark Streaming. Научете всичко за кумулативно проследяване и повишаване на уменията за кариера в Hadoop Spark.

Големи данни в здравеопазването: Как Hadoop революционизира анализа на здравеопазването

Технологиите Hadoop & Big Data революционизират анализа на здравеопазването. Този блог за големи данни в здравеопазването обсъжда как анализът на големи данни може да подобри медицинското обслужване.

Hadoop Streaming: Писане на програма Hadoop MapReduce в Python

Тази публикация в блога на Hadoop Streaming е ръководство стъпка по стъпка, за да се научите да пишете програма Hadoop MapReduce в Python за обработка на огромни количества големи данни.

Урок за големи данни: Всичко, което трябва да знаете за големите данни!

Този блог в Big Data Tutorial ви дава пълен преглед на Big Data, неговите характеристики, приложения, както и предизвикателствата с Big Data.

Урок за HDFS: Въведение в HDFS и неговите характеристики

Този блог с уроци за HDFS ще ви помогне да разберете HDFS или Hadoop разпределена файлова система и нейните функции. Също така ще разгледате накратко основните му компоненти.

Splunk срещу ELK срещу Sumo Logic: Кое работи най-добре за вас?

В този урок за Splunk разберете разликите между Splunk срещу ELK срещу Sumo Logic и определете кой от тези инструменти ви подхожда най-добре.

Случай за използване на Splunk: Историята на успеха на Domino

В този блог за случаи на използване на Splunk ще разберете как пицата на Domino's е използвала Splunk, за да получи информация за поведението на потребителите и да формулира своите бизнес стратегии.

Инсталиране на Hadoop: Настройване на единичен възел Hadoop клъстер

Този урок е ръководство стъпка по стъпка за инсталиране на клъстер Hadoop и конфигуриране на един възел. Всички стъпки за инсталиране на Hadoop са за машина CentOS.

HDFS команди: Hadoop Shell команди за управление на HDFS

Този блог говори за различните HDFS команди като fsck, copyFromLocal, expunge, cat и др., Които се използват за управление на файловата система Hadoop.

Голяма Информация

Топ Статии

Категория

Интересни Статии