Обработка на големи данни с Apache Spark & ​​Scala



Apache Spark се появи като голямо развитие в обработката на големи данни.

услуга сега билет инструмент урок

IST: 7:00 - 08:00, 17 октомври’14





PDT: 18:30 - 19:30, 16 октомври ’14

Ограничени места !! Попълнете формата отдясно и резервирайте слота си още днес.



Здравейте всички, провеждаме безплатен уебинар на Apache Spark и Scala на 18 октомври’14. Заглавието на уебинара е ‘Обработка на големи данни с Apache Spark и Scala’ . В този уеб семинар ще бъдат обсъдени основните теми, свързани с Apache Spark и Scala. Всички въпроси или съмнения могат да бъдат изяснени по време на сесията.

Теми, които трябва да бъдат обхванати:

  • Какво представляват големите данни?
  • Какво е Spark?
  • Защо Spark?
  • Искра екосистема
  • Бележка за Скала
  • Защо Scala?
  • Hello Spark - Ръцете

Защо Spark?

Apache Spark е клъстерна изчислителна рамка с отворен код за клъстери на общността на Hadoop. Той се квалифицира като един от най-добрите механизми за анализ и обработка на данни за мащабни данни със своята несравнима скорост, лекота на използване и усъвършенстван анализ. Следват предимствата и характеристиките, които правят Apache Spark кросоувър хит както за оперативна, така и за разследваща аналитика:

  • Програмите, разработени през Spark, работят 100 пъти по-бързо от тези, разработени в Hadoop MapReduce.
  • Spark компилира 80 оператори на високо ниво.
  • Spark Streaming позволява обработка на данни в реално време.
  • GraphX ​​е библиотека за графични изчисления.
  • MLib е библиотеката за машинно обучение за Spark.
  • Основно написана на Scala, Spark може да бъде вградена във всяка операционна система, базирана на JVM, като в същото време може да се използва и по начин REPL (четене, оценка, обработка и зареждане).
  • Притежава мощни възможности за кеширане и постоянство на диска.
  • Spark SQL му позволява ефективно да обработва SQL заявки
  • Apache Spark може да бъде внедрен чрез Apache Mesos, Yarn в HDFS, HBase, Cassandra или Spark Cluster Manager (собствен клъстер мениджър на Spark).
  • Spark симулира API на функционалния стил и колекции на Scala, което е голямо предимство за разработчиците на Scala и Java.

Нужда от Apache Spark:

Spark предоставя огромни ползи за индустрията по отношение на скоростта, разнообразието от задачи, които може да изпълнява, гъвкавост, качествен анализ на данните, ефективност на разходите и т.н., които са нуждите на деня. Той предоставя решения за анализ на големи данни от висок клас в реално време на ИТ индустрията, отговарящи на нарастващото търсене на клиенти. Анализът в реално време използва бизнес възможности до купчини. Съвместимостта му с Hadoop улеснява компаниите бързо да го възприемат. Има остра нужда от експерти и разработчици, научени от Spark, тъй като това е сравнително нова технология, която все повече се възприема.