Защо трябва да се смесвате, когато вече можете да се присъедините към таблицата?



Смесване на данни в Tableau - метод, използван, когато има свързани данни в множество източници на данни, които искате да анализирате заедно в един изглед.

В свят, който генерира и консумира 2,5 квинтилиона байта данни на ден, организациите са длъжни да търсят нови методи за трансформиране и комбиниране на данни, за да постигнат оптимална ефективност. Един такъв метод за комбиниране на данни е Смесване на данни в таблицата .

Сега, тъй като това служи на толкова важна цел в цикъла на данни на дадена организация, това създава много важен модул в повечето . В този блог ще обсъдим следните концепции:





Защо се нуждаете от смесване на данни в Tableau?

Да предположим, че сте a Таблица за разработчици който има данни за транзакции, съхранявани в Salesforce, и данни за квоти, съхранявани в Access. Данните, които искате да комбинирате, се съхраняват в различни бази данни и детайлността на данните, уловени във всяка таблица, е различна в двата източника на данни, така че смесването на данни е най-добрият начин за комбиниране на тези данни.

Смесването на данни е полезно при следните условия:



  1. Искате да комбинирате данни от различни бази данни, които не се поддържат от кръстосани бази данни.

    Кръстосаните бази данни не поддържат връзки с кубове (например Oracle Essbase) или с някои връзки само с извличане (например Google Analytics). В този случай настройте отделни източници на данни за данните, които искате да анализирате, и след това използвайте смесване на данни, за да комбинирате източниците на данни на един лист.

  2. Данните са на различни нива на детайлност.

    Понякога един набор от данни улавя данни, използвайки различни нива на детайлност т.е. по-голяма или по-малка детайлност от другия набор от данни.

    Да предположим например, че анализирате данни за транзакции и данни за квоти. Транзакционните данни могат да обхванат всички транзакции. Данните от квотите обаче могат да обобщават транзакциите на тримесечно ниво. Тъй като транзакционните стойности се улавят на различни нива на детайлност във всеки набор от данни, трябва да използвате смесване на данни, за да комбинирате данните.



Какво представлява смесването на данни в Tableau?

Смесването на данни е много мощна функция в Борд . Използва се, когато има свързани данни в множество източници на данни, които искате да анализирате заедно в един изглед. Това е метод за комбиниране на данни, който допълва таблица с данни от един източник на данни с колони с данни от друг източник на данни.

Обикновено използвате съединения, за да извършите този вид комбиниране на данни, но има моменти, в зависимост от фактори като вида на данните и тяхната детайлност, когато е по-добре да използвате смесване на данни.

По какво се различава от обединяването на данни?

Смесването на данни симулира традиционно ляво съединение. Основната разлика между двете е кога съединението се извършва по отношение на агрегирането.

Ляво присъединяване

Когато използвате ляво съединение за комбиниране на данни, заявка се изпраща към базата данни, където се извършва обединението. Използването на ляво съединение връща всички редове от лявата таблица и всички редове от дясната таблица, която има съответстващо съответствие на редове в лявата таблица. След това резултатите от присъединяването се изпращат обратно и обобщават от Tableau.

проектирайте модели в php с пример

Да предположим например, че имате следните таблици. Ако общите колони са Потребителски идентификатор , лявото съединение взема всички данни от лявата таблица, както и всички данни от дясната таблица, тъй като всеки ред има съответстващ ред в лявата таблица.

Обединяване на данни - смесване на данни в Tableau - EdurekaСмесване на данни

Когато използвате смесване на данни за комбиниране на данни, заявка се изпраща към базата данни за всеки източник на данни, който се използва на листа. Резултатите от заявките, включително обобщените данни, се изпращат обратно и се комбинират от Tableau. Изгледът използва всички редове от първичния източник на данни, лявата таблица и обобщените редове от вторичния източник на данни, дясната таблица, въз основа на измерението на полетата за свързване.

Можете да промените полето за свързване или да добавите повече полета за свързване, за да включите различни или допълнителни редове данни от вторичния източник на данни в комбинацията, като промените агрегираните стойности.

Да предположим например, че имате следните таблици. Ако полетата за свързване са Потребителски идентификатор и в двете таблици смесването на вашите данни взема всички данни от лявата таблица и допълва лявата таблица с данните от дясната таблица. В този случай не всички стойности могат да бъдат част от получената таблица поради следното:

  • Ред в лявата таблица няма съответстващ ред в дясната таблица, както е посочено от нулевата стойност.
  • В редовете в дясната таблица има множество съответстващи стойности, както е посочено със звездичката (*).

Да предположим, че имате същите таблици, както по-горе, но вторичният източник на данни съдържа ново поле, наречено Цели . Отново, ако полето за свързване е Потребителски идентификатор , смесването на вашите данни отнема всички данни от лявата таблица и ги допълва с данни от дясната таблица. В този случай виждате същата нулева стойност и звездички в предишния пример в допълнение към следното:

  • Защото Цели полето е мярка, виждате стойностите на реда заЦелиполе, обобщено преди данните в дясната таблица да се комбинират с данните в лявата таблица.
  • Както при предишния пример, ред в лявата таблица няма съответния ред за Цели поле, както е посочено от втората нулева стойност.

Кога да замените присъединяването за Смесване

1. Данните се нуждаят от почистване.

Ако вашите таблици не съвпадат правилно една с друга след обединяване, настройте източници на данни за всяка таблица, направете необходимите персонализации (т.е. преименувайте колони, променете типовете данни на колони, създайте групи, използвайте изчисления и т.н.) и след това използвайте смесване на данни, за да комбинирате данните.

2. Обединенията причиняват дублирани данни.

Дублиращи се данни след обединяване са симптом на данни на различни нива на детайлност. Ако забележите дублирани данни, вместо да създавате съединение, използвайте смесване на данни, за да ги смесите в обща величина.

3. Имате много данни.

Обикновено обединенията се препоръчват за комбиниране на данни от същата база данни. Обединенията се обработват от базата данни, което позволява на обединенията да използват някои от родните възможности на базата данни. Ако обаче работите с големи набори от данни, обединенията могат да натоварят базата данни и значително да повлияят на производителността. В този случай смесването на данни може да помогне. Тъй като Tableau обработва комбинирането на данните, след като данните са обобщени, има по-малко данни за комбиниране. Когато има по-малко данни за комбиниране, като цяло производителността се подобрява.

Смесване на вашите данни в Tableau

Можете да използвате смесване на данни, когато имате данни в отделни източници на данни, които искате да анализирате заедно на един лист. Tableau има два вградени източника на данни с име Проба-супермаркет и Примерна верига за кафе.mdb което ще се използва за илюстриране на смесването на данни.

Стъпка 1: Свържете се с вашите данни и настройте източниците на данни

  • Свържете се с набор от данни и настройте източника на данни на страницата с източник на данни. Аз in вграден източник на данни Примерна верига за кафе.mdb ,който е файл на базата данни на MS Access, ще се използва за илюстриране на смесването на данни.
  • Отидете на Данни > Нов източник на данни, свържете се с втория набор от данни.Този пример използва Проба - Superstore източник на данни. ткокошка настрои източника на данни.
  • Щракнете върху раздела лист, за да започнете да изграждате изгледа си.

Стъпка 2: Определете основен източник на данни

system.exit (1) java
  • Плъзнете поне едно поле от вашия първичен източник на данни в изгледа, за да го определите като основен източник на данни. В Данни щракнете върху източника на данни, който искате да определите като основен източник на данни. В този пример Примерна верига за кафе е избрано.
  • Следващата екранна снимка показва различните таблици и обединения, налични във файла.

Стъпка 3: Определете вторичен източник на данни

  • Полета, използвани в изгледа от източници на данни, които не са първичен източник на данни или активни връзки, автоматично определят следващите източници на данни като вторичен източник на данни. В този случай, Sample Superstore.

Стъпка 4: Смесете данни

  • Сега можете да интегрирате данните от двата източника въз основа на общо измерение ( Щат , в такъв случай). Имайте предвид, че до измерението - състояние се появява изображение на малка връзка. Това показва общото измерение между двата източника на данни.
  • Да предположим, че създавате стълбовидна диаграма с Коефициент на печалба в рафта на колоната и Щат в Редовия рафт диаграмата показва как съотношението на печалбата варира за всеки щат както в супермаркета, така и във веригите кафенета.

Ограничения на смесването на данни в таблицата

  1. Има някои ограничения за смесване на данни около неадитивни агрегати, като например МЕДИАНА , и RAWSQLAGG .
  2. Смесването на данни компрометира скоростта на заявката при висока гранулираност.
  3. Когато се опитате да сортирате по изчислено поле, което използва смесени данни, изчисленото поле не е изброено в падащия списък Поле на диалоговия прозорец Сортиране.
  4. Източниците на данни Cube могат да се използват само като основен източник на данни за смесване на данни в Tableau. Те не могат да се използват като вторични източници на данни.

Надявам се, че всички сега имате добра представа за това Смесване на данни в таблицата от този блог. Гладен за повече знания? Не се притеснявайте, това видео ще ви даде по-добро разбиране на концепцията.