ПРОГРАМИРАНЕ НА СВИНЕ | СЪЗДАЙТЕ СВОЯ ПЪРВИ APACHE PIG SCRIPT

Програмиране на прасета: Създайте своя първи Apache Pig скрипт

В нашата , сега ще научим как да създадем Apache Pig скрипт. Скриптовете Apache Pig се използват за колективно изпълнение на набор от команди Apache Pig. Това помага за намаляване на времето и усилията, вложени в писането и изпълнението на всяка команда ръчно, докато правите това в програмирането на Pig.Той също е неразделна част от .Този блог е ръководство стъпка по стъпка, което ще ви помогне да създадете първия си Apache Pig скрипт.

Режими за изпълнение на скрипт Apache Pig

Местен режим : В „локален режим“ можете да изпълните скрипта за свиване в локална файлова система. В този случай не е необходимо да съхранявате данните във файловата система Hadoop HDFS, а можете да работите с данните, съхранявани в самата локална файлова система.

Режим MapReduce : В режим „MapReduce“ данните трябва да се съхраняват във файлова система HDFS и можете да обработвате данните с помощта на свински скрипт.

Apache Pig Script в режим MapReduce

Да кажем, че нашата задача е да четем данни от файл с данни и да показваме необходимото съдържание на терминала като изход.

Файлът с примерни данни съдържа следните данни:

Информационен txt файл - Apache Pig Script - Edureka

Запазете текстовия файл с името ‘information.txt’

Файлът с примерни данни съдържа пет колони Първо име , Фамилия , MobileNo , Град , и Професия разделени от ключ за раздела . Нашата задача е да прочетем съдържанието на този файл от HDFS и да покажем всички колони на тези записи.

scrum master роли и отговорности pdf

За да обработите тези данни с помощта на Pig, този файл трябва да присъства в Apache Hadoop HDFS.

Команда : hadoop fs –copyFromLocal /home/edureka/information.txt / edureka

Етап 1: Писане на Pig скрипт

Създайте и отворете Apache Pig скриптов файл в редактор (например gedit).

Команда : sudo gedit /home/edureka/output.pig

Тази команда ще създаде файл ‘output.pig’ вътре в домашната директория на потребителя на edureka.

Нека напишем няколко PIG команди във файл output.pig.

A = LOAD '/edureka/information.txt' с помощта на PigStorage ('') като (FName: chararray, LName: chararray, MobileNo: chararray, City: chararray, Професия: chararray) B = FOREACH A генерира FName, MobileNo, професия DUMP Б.

Запазете и затворете файла.

Първата команда зарежда файла ‘information.txt’ в променлива A с индиректна схема (FName, LName, MobileNo, City, Profession).
Втората команда зарежда необходимите данни от променлива A към променлива B.
Третият ред показва съдържанието на променлива B на терминала / конзолата.

Стъпка 2: Изпълнете Apache Pig Script

c ++ програма за сортиране на масив във възходящ ред

За да изпълните скрипта за свине в режим HDFS, изпълнете следната команда:

Команда : pig /home/edureka/output.pig

След като изпълнението приключи, прегледайте резултата. Тези изображения по-долу показват резултатите и тяхната междинна карта и функции за намаляване.

Под изображението се вижда, че скриптът е изпълнен успешно.

По-долу изображението показва резултата от нашия скрипт.

Поздравления за изпълнението на първия ви скрипт Apache Pig успешно!

Сега знаете как да създадете и изпълните Apache Pig скрипт. Следователно, следващият ни блог в ще обхваща как създайте UDF (потребителски функции) в Apache Pig и го изпълнете в режим MapReduce / HDFS.

След като създадохте и изпълнихте Apache Pig Script, разгледайте от Edureka, доверена компания за онлайн обучение с мрежа от над 250 000 доволни учащи, разпространени по целия свят. Курсът за обучение по сертифициране на големи данни Hadoop на Edureka помага на обучаващите се да станат експерти в HDFS, прежди, MapReduce, Pig, Hive, HBase, Oozie, Flume и Sqoop, като използват случаи в реално време за търговия на дребно, социални медии, авиация, туризъм, финанси.

Имате въпрос към нас? Моля, споменете го в раздела за коментари и ние ще се свържем с вас.

Програмиране на прасета: Създайте своя първи Apache Pig скрипт

Прочетете тази публикация в блога, за да създадете първия си Apache Pig скрипт. Скриптовете Apache Pig се използват за колективно изпълнение на набор от команди Apache Pig.

Програмиране на прасета: Създайте своя първи Apache Pig скрипт

Режими за изпълнение на скрипт Apache Pig

Apache Pig Script в режим MapReduce

Категории

Popular Articles

Урок за дълбоко обучение: Изкуствен интелект, използващ дълбоко обучение

Ръководство стъпка по стъпка как да настроите Eclipse IDE в Windows?

Как да приложим претоварване на оператора в c ++?

Всичко за извличането на данни в PHP

Как да станете разработчик на Front End?

Управление на качеството на проекта - Как да оптимизираме качеството на проекта

UiPath кариери - Научете как да изградите кариера в RPA

Всичко, което трябва да знаете за променливите в Java

Урок за Ethereum - по-задълбочен поглед към Ethereum!

Разпознаване на образци: По какво се различава от машинното обучение

Python Iterators: Какво представлява Iterator в Python и как да го използвам?

Какво представлява ъгловият материал и как да го приложим?