Как да стартирам скриптове за кошери?



Това е урок за това как да стартирате Hive Scripts. Изпълнението на този скрипт ще намали времето и усилията, които полагаме за ръчно писане и изпълнение на всяка команда.

Като пакет за съхранение на данни, изграден върху Hadoop, Apache Hive все повече се използва за анализ на данни, извличане на данни и прогнозно моделиране. Организациите търсят професионалисти, които твърдо държат . В тази публикация нека разгледаме как да стартираме скриптове за кошери. По принцип ние използваме скриптовете, за да изпълним набор от изрази наведнъж. Сценариите за кошери се използват почти по същия начин. Това ще намали времето и усилията, които полагаме за ръчно писане и изпълнение на всяка команда.

как да използвам подниза в java -

Hive Scripts се поддържат във версиите Hive 0.10.0 и по-нови. Тъй като версията на Hive 0.90 е инсталирана в CDH3, не можем да стартираме скриптове на Hive в CDH3. Можете да опитате стъпките по-долу в CDH4, тъй като в тях е инсталирана версията на Hive 0.10.0. Знаете ли как да създадете скрипт за кошер? Ако не, щракнете за да получите повече пояснения.





Master-Hive-Now

Сега нека видим как да напишем скриптовете в Hive и да ги стартираме в CDH4:



Стъпка 1: Писане на скрипт за кошер.

За да напишете Hive Script, файлът трябва да бъде запазен с разширение .sql. Отворете терминал във вашата дистрибуция Cloudera CDH4 и дайте следната команда, за да създадете скрипт за кошери.
Команда: sudo gedit sample.sql

При изпълнение на горната команда тя ще отвори файла със списъка на всички команди Hive, които трябва да бъдат изпълнени.



В този скрипт ще бъде създадена, описана таблица и данните ще бъдат заредени и извлечени от таблицата.

1. Създаване на таблицата в кошер:

Команда: създаване на продукт на таблица (productid: int, productname: низ, цена: плувка, категория: низ) редове форматирани разграничени полета, прекратени с ‘,’

Тук product е името на таблицата, а {productid, productname, price, category} са колоните на тази таблица.

Полета, прекратени с „,“ показват, че колоните във входния файл са разделени със символа „,“.

По подразбиране записите във входния файл са разделени с нов ред.

2. Описване на таблицата:

Команда: опишете продукта

3. Зареждане на данните в таблицата.

За да заредим първо данните в таблицата, трябва да създадем входен файл, който съдържа записите, които трябва да бъдат вмъкнати в таблицата.

как да конвертирате двоичен в десетичен в Java

Нека създадем входен файл.

Команда: sudo gedit input.txt

Редактирайте съдържанието във файла, както е показано на фигурата.

4. Извличане на данните:

За извличане на данните се използва командата select.

Команда: Изберете * от продукта

Горната команда се използва за извличане на стойността на всички колони, присъстващи в таблицата. Сценарият трябва да е такъв, както е показан на изображението по-долу.

Сега приключихме с писането на скрипта Hive. Файлът sample.sql вече може да бъде запазен.

Стъпка 2: Стартиране на Hive Script

Следва командата за стартиране на скрипта Hive:

Команда: кошер –f /home/cloudera/sample.sql

обединяване сортиране c ++ масив

Докато изпълнявате скрипта, уверете се, че е налице целият път на местоположението на файла на скрипта.

Виждаме, че всички команди се изпълняват успешно.

Ето как се изпълняват и изпълняват скриптове на Hive в CDH4.

Hive е критичен компонент на Hadoop и вашият опит в Hive може да ви осигури най-високо платените работни места в Hadoop! Edureka има специално подготвен курс Hadoop, който ви помага да овладеете концепции като MapReduce, прежда, прасе, кошер, HBase, Oozie, Flume и Sqoop. Щракнете върху бутона по-долу, за да започнете.

Имате въпрос към нас? Моля, споменете ги в раздела за коментари и ние ще се свържем с вас.

Подобни публикации:

Кошери Команди

Модели на данни за кошери