SQL за наука за данни: едно решение за начинаещи



Тази публикация в блога за SQL за наука за данни ще ви помогне да разберете как SQL може да се използва за съхраняване, достъп и извличане на данни за извършване на анализ на данни.

Тъй като Data Science е класиран на номер 1 като най-обещаващата работа на епохата, всички ние се опитваме да се включим в надпреварата на . Тази публикация в блога за SQL за наука за данни ще ви помогне да разберете как SQL може да се използва за съхраняване, достъп и извличане на данни за извършване на анализ на данни.

Ето списък с теми, които ще бъдат обхванати в този блог:





    1. Защо е необходим SQL за науката за данни?
    2. Какво е SQL?
    3. Основи на SQL
    4. Инсталиране на MySQL
    5. Практически

Защо е необходим SQL за науката за данни?

Знаете ли, че генерираме повече от 2,5 квинтилиона байта данни всеки ден? Този темп на генериране на данни е причината за популярността на висок клас технологии като Наука за данни , , и така нататък.

Получаването на полезна информация от данните е това, което се нарича наука за данни. Data Science включва извличане, обработка и анализ на тонове данни. В момента това, от което се нуждаем, са които могат да се използват за съхраняване и управление на това огромно количество данни.



Какво е наука за данни - Edureka

Това е където Влиза SQL.

SQL може да се използва за съхраняване, достъп и извличане на огромни количества данни, за да се извърши по-гладко целия процес на Data Science.



Какво е SQL?

SQL което означава „Структуриран език за заявки“ е език за заявки, предназначен за управление на релационни бази данни.

Но какво точно представлява релационната база данни?

Релационната база данни е група от добре дефинирани таблици, от които могат да се осъществява достъп, редактиране, актуализиране и т.н., без да се налага промяна на таблиците в базата данни. SQL е стандартът (API) за релационни бази данни.

Връщайки се към SQL, SQL програмирането може да се използва за извършване на множество действия върху данни като заявки, вмъкване, актуализиране, изтриване на записи от база данни. Примери за релационни бази данни, които използват SQL, включват MySQL база данни, Oracle и др.

За да научите повече за SQL, можете да преминете през следните блогове:

  1. Разбиране на типовете данни на SQL - всичко, което трябва да знаете за типовете данни на SQL
  2. СЪЗДАЙТЕ ТАБЛИЦА в SQL - Всичко, което трябва да знаете за създаването на таблици в SQL

Преди да започнем с демонстрация на SQL, нека се запознаем с основните SQL команди.

Основи на SQL

SQL предоставя набор от прости команди за модифициране на таблици с данни, нека разгледаме някои от основните SQL команди:

  • СЪЗДАЙ БАЗАТА ДАННИ - създава нова база данни
  • СЪЗДАЙТЕ МАСА - създава нова таблица
  • ВЪВЕДЕТЕ В - вмъква нови данни в база данни
  • ИЗБЕРЕТЕ - извлича данни от база данни
  • АКТУАЛИЗИРАНЕ - актуализира данни в база данни
  • ИЗТРИЙ - изтрива данни от база данни
  • ИЗМЕНЕТЕ БАЗАТА ДАННИ - модифицира база данни
  • ALTER TABLE - променя таблица
  • ТАБЛИЦА ЗА ПАДАНЕ - изтрива таблица
  • СЪЗДАВАНЕ НА ИНДЕКС - създава индекс за търсене на елемент
  • ИНДЕКС НА ПАДАНЕ - изтрива индекс

За да разберем по-добре SQL, нека инсталираме MySQL и да видим как можете да играете с данни.

Инсталиране на MySQL

Инсталирането на MySQL е проста задача. Ето ръководство стъпка по стъпка това ще ви помогне да инсталирате MySQL във вашата система.

След като приключите с инсталирането MySQL, следвайте раздела по-долу за проста демонстрация, която ще ви покаже как можете да вмъквате, манипулирате и модифицирате данни.

SQL за наука за данни - Демо на MySQL

В тази демонстрация ще видим как да създаваме бази данни и да ги обработваме. Това е демонстрация на ниво начинаещи, за да започнете с анализ на данни на SQL.

php вмъкване в $ table

Така че нека да започнем!

Стъпка 1: Създайте SQL база данни

SQL базата данни е склад за съхранение, където данните могат да се съхраняват в структуриран формат. Сега нека създадем база данни с помощта на MySQL :

СЪЗДАЙТЕ БАЗАТА ДАННИ edureka ИЗПОЛЗВАЙ edureka

В горния код има две SQL команди:

Забележка : SQL командите са дефинирани с главни букви и се използва точка с двоеточие за прекратяване на SQL команда.

  1. CREATE DATABASE: Тази команда създава база данни, наречена ‘edureka’

  2. УПОТРЕБА: Тази команда се използва за активиране на базата данни. Тук активираме базата данни „edureka“.

Стъпка 2: Създайте таблица с необходимите функции за данни

Създаването на таблица е толкова просто, колкото създаването на база данни. Трябва само да дефинирате променливите или характеристиките на таблицата със съответните им типове данни. Нека да видим как това може да се направи:

СЪЗДАЙТЕ ТАБЛИЦИ играчки (TID INTEGER НЕ НУЛЕН ПЪРВИЧЕН КЛЮЧ AUTO_INCREMENT, Име на артикул TEXT, Цена INTEGER, Количество INTEGER)

В горния кодов фрагмент се случват следните неща:

  1. Използвайте командата ‘CREATE TABLE’, за да създадете таблица, наречена играчки.
  2. Масата за играчки съдържа 4 функции, а именно TID (ID на транзакция), Име на артикул, Цена и Количество.
  3. Всяка променлива е дефинирана със съответните типове данни.
  4. Променливата TID е декларирана като първичен ключ. Първичен ключ основно обозначава променлива, която може да съхранява уникална стойност.

Можете допълнително да проверите подробностите на дефинираната таблица, като използвате следната команда:

ОПИСЕТЕ играчки

Стъпка 3: Вмъкване на данни в таблицата

След като създадохме таблица, нека я попълним с някои стойности. По-рано в този блог споменах как можете да добавяте данни в таблица, като използвате само една команда, т.е. INSERT INTO.

Нека да видим как се прави това:

ВЪВЕДЕТЕ В СТОЙНОСТИ за играчки (NULL, 'Train', 550, 88) INSERT INTO VALUES VALUE (NULL, 'Hotwheels_car', 350, 80) INSERT INTO VALUE VALUE (NULL, 'Magic_Pencil', 70, 100) INSERT INTO VALUES VALUE ( NULL, 'Dog_house', 120, 54) ВМЪКНЕТЕ В СТОЙНОСТИ за играчки (NULL, 'Skateboard', 700, 42) ВЪВЕЖДЕТЕ В СТОЙНОСТИ за играчки (NULL, 'GI Joe', 300, 120)

В горния кодов фрагмент просто вмъкнахме 6 наблюдения в нашата таблица „играчки“ с помощта на командата INSERT INTO. За всяко наблюдение, в скобите, съм посочил стойността на всяка променлива или функция, която е била дефинирана при създаването на таблицата.

Променливата TID е зададена на NULL, тъй като тя автоматично се увеличава от 1.

Сега нека покажем всички данни, присъстващи в нашата таблица. Това може да стане с помощта на командата по-долу:

ИЗБЕРЕТЕ * ОТ играчки


Стъпка 4: Променете записите с данни

Да кажем, че сте решили да увеличите цената на G.I. Джо, тъй като ти носи много клиенти. Как бихте актуализирали цената на променливата в база данни?

Това е просто, просто използвайте командата по-долу:

АКТУАЛИЗИРАНЕ НА ИГРАЧКИ КОМПЛЕКТ Цена = 350 WHERE TID = 6

Командата UPDATE ви позволява да модифицирате всички стойности / променливи, съхранявани в таблицата. Параметърът SET ви позволява да изберете определена функция, а параметърът WHERE се използва за идентифициране на променливата / стойността, която искате да промените. В горната команда актуализирах цената на въвеждането на данни, чийто TID е 6 (G.I. Joe).

Сега нека разгледаме актуализираната таблица:

ИЗБЕРЕТЕ * ОТ играчки

Можете също така да промените това, което искате да се показва, като просто се обърнете към колоните, които искате да видите. Например, командата по-долу ще покаже само името на играчката и съответната цена:

ИЗБЕРЕТЕ Име на артикул, Цена ОТ играчки

Стъпка 5: Извличане на данни

Така че след като вмъкнете данните и ги промените, най-накрая е време да извлечете и извлечете данните според бизнес изискванията. Тук могат да се извличат данни за по-нататъшен анализ на данни и моделиране на данни.

Имайте предвид, че това е прост пример за започване на работа с SQL, но в реални сценарии данните са много по-сложни и големи по размер. Въпреки това, SQL командите остават същите и това прави SQL толкова прост и разбираем. Той може да обработва сложни набори от данни с набор от прости SQL команди.

Сега нека извлечем данни с няколко модификации. Вижте кода по-долу и се опитайте да разберете какво прави, без да гледате изхода:

ИЗБЕРЕТЕ * ОТ играчки ГРАНИЦА 2

Ти го отгатна! Той показва първите две наблюдения, присъстващи в моята таблица.

Нека опитаме нещо по-интересно.

ИЗБЕРЕТЕ * ОТ играчки ПОРЪЧКА ПО ЦЕНА ASC

Както е показано на фигурата, стойностите са подредени по възходящ ред на ценовата променлива. Ако искате да потърсите трите най-често купувани артикула, какво бихте направили?

Наистина е съвсем просто!

ИЗБЕРЕТЕ * ОТ играчки ПОРЪЧКА ПО КОЛИЧЕСТВО ОГРАНИЧЕНИЕ 3

Нека опитаме още един.

ИЗБЕРЕТЕ * ОТ играчки КЪДЕ Цена> 400 ПОРЪЧКА ПО ЦЕНА ASC


Тази заявка извлича подробности за играчките, чиято цена е повече от 400 и подрежда продукцията във възходящ ред на цената.

Така че можете да обработвате данни с помощта на SQL. След като вече знаете основите на SQL за Data Science, сигурен съм, че сте любопитни да научите повече. Ето няколко блога, за да започнете:

  1. Какво е наука за данните? Ръководство за начинаещи за науката за данни
  2. Урок за MySQL - Ръководство за начинаещи за изучаване на MySQL

Ако искате да се запишете за пълен курс по изкуствен интелект и машинно обучение, Edureka има специално подготвен което ще ви накара да владеете техники като контролирано обучение, учене без надзор и обработка на естествен език. Включва обучение за най-новите постижения и технически подходи в областта на изкуствения интелект и машинното обучение като дълбоко обучение, графични модели и обучение за подсилване.