Integracja danych z różnych źródeł w Power BI

Istnieje wiele sposobów na przechowywanie danych dotyczących funkcjonowania organizacji. Typowym podejściem do rejestrowania danych transakcyjnych w przedsiębiorstwie jest zaimplementowanie bazy, w której będą przechowywane usystematyzowane dane o określonej strukturze. Przechowując dane w tabelach można zapanować nad sposobem ich przechowywania oraz ustalić relacje między innymi obiektami tak, aby miały odpowiedni kontekst biznesowy. Dobrze zaprojektowana baza danych oferuje spójność i integralność zawartych w niej informacji, ale wymaga od użytkownika, aby wprowadzane dane były zgodne z jej modelem.

Na różnych etapach rozwoju, firmy decydują się na wdrożenie takich narzędzi do przechowywania informacji, na jakie pozwalają dostępne w danym okresie narzędzia. Mając na uwadze kryterium kosztów lub funkcji, można wybrać spośród kilku dostępnych silników baz danych, między innymi:

• Microsoft SQL Server

• Access

• Oracle

• PostgreSQL

Alternatywa dla bazy danych

Nie zawsze jednak wszystkie dane w organizacji są przechowywane w bazie danych. Mimo obecności wielu systemów zarządzania informacją w przedsiębiorstwie, czasem wygodniej i szybciej jest zapisać część danych w postaci pliku arkusza kalkulacyjnego Excel lub pliku PDF. Decydując się na taką formę przechowywania informacji zazwyczaj mamy w zamiarach spełnienie bieżących, krótkoterminowych potrzeb. Na przykład:

• Eksport kontaktów z konta Google lub Microsoft Outlook,

• Pobieranie danych o klientach z naszego sklepu internetowego w postaci pliku CSV,

• Zapis pliku Excel z danymi sprzedażowymi otrzymanymi drogą mailową oraz zapisanie go na dysku sieciowym (np. OneDrive).

Dane zapisane w ten sposób mogą być na tyle duże i istotne, aby stanowić uzupełnienie danych przechowywanych w bazie danych. Chcąc przygotować analizy przechowywanych danych może się okazać, że zawierają podobne informacje, ale struktura oraz specyfika miejsca przechowywania każdego z nich różni się. Każdorazowe przekształcanie danych tak, aby miały wspólny model bywa zbyt pracochłonne i niedostatecznie efektywne, co może utrudnić proces dotarcia do informacji.

Power BI jako narzędzie integracji danych

Silną stroną Power BI jest możliwość integracji danych o z wielu źródeł o różnym typie. To rozbudowane narzędzie do budowy interaktywnych analiz pozwala utworzyć wspólny model danych i zagregować dane wielu źródeł (między innymi):

• BAZY DANYCH

  •  Microsoft SQL Server
  •  Access
  •  Oracle
  •  IBM Db2
  •  MySQL
  •  PostgreSQL
  •  Sybase
  •  SAP HANA

• USŁUGI ONLINE

  •  Strony internetowe z danymi
  •  SharePoint i OneDrive
  •  Active Directory
  •  Exchange Online
  •  Google Analytics
  •  Witryny Facebook
  •  NAV Dynamics

• PLIKI

  •  Arkusze kalkulacyjne Excel
  •  Pliki tekstowe i CSV
  •  Plik XML
  •  Plik JSON
  •  PDF

Power BI pozwala na nawiązanie połączenia z wieloma źródłami danych jednocześnie oraz zaprojektowanie modelu danych dla analiz biznesowych. Przy pomocy edytora Power Query wbudowanego w Power BI można dodawać nowe źródła. Zostaną one przekształcane do postaci zapytań, które stanowią szablon dla tabel, które zostaną wypełnione danymi po załadowaniu z innych źródeł. Podczas nawiązywania połączenia Power BI rozpoznaje obiekty z danymi i umożliwia wybór elementów:

Wybór obiektów z bazy danych

Następnie, zaimportowane obiekty są dostępne na liście zapytań edytora Power Query, które są poddawane transformacjom według ustalonego wzorca postępowania. Na tym etapie Power BI pozwala na utworzenie zestawu czynności przekształcających dane dla wybranego zapytania. Dzięki temu przy każdym pobraniu danych ze źródeł, dane wejściowe zostaną załadowane do modelu i przekształcone krok po kroku według zaprojektowanego schematu.

Kroki obróbki danych

Co istotne, podczas obróbki danych Power BI nie ingeruje w strukturę źródła, z którego korzysta, lecz wykonuje operacje na własnym, lokalnym zestawie danych pobranym w zakresie ustalonym na etapie ekstrakcji, czyli wyodrębniania informacji. Następnie poddaje je transformacjom, takimi jak indeksowanie danych, zmiana typu danych w wybranej kolumnie, scalanie czy kolejność ich wyświetlania. Po ukończeniu projektowania, dane zostają załadowane do modelu w postaci tabel z danymi. Cecha ta czyni Power BI świetnym narzędziem w sytuacjach, kiedy nie chcemy wykonywać zmian na oryginalnym źródle, a załadować do innego miejsca i przekształcić je. Cecha ta jest istotna, zwłaszcza gdy nasze źródła różnią się zarówno technologią, na której są oparte, czy strukturami danych, które prezentują.

Aby ułatwić nawigację po źródłach danych dostępnych w modelu, Power BI umożliwia ustalenie pochodzenia obiektów z danymi. Widok zależności zapytań pozwala zlokalizować, z której z naszych baz danych, pliku lub źródła internetowego zapytanie skorzysta, aby utworzyć tabelę oraz który element w hierarchii ma być ładowany do modelu danych.

Widok zależności zapytań

Dzięki agregacji danych z wielu źródeł, raporty przygotowywane przy użyciu Power BI mogą obejmować zakres szerszy niż tylko pojedyncza baza danych, co pozwala przygotować obszerniejsze analizy biznesowe. Dane autoryzacyjne do źródeł danych są zapisane w modelu danych i automatycznie wykorzystywane do nawiązania połączenia przy wywołaniu jednej procedury ładowania danych. W efekcie dane, które wcześniej były dostępne w wielu źródłach mogą zostać łatwo złączone i pobrane do wspólnego zestawu danych przetwarzanym w chmurze usługi Power BI lub zapisywane lokalnie na urządzeniu przy użyciu aplikacji Power BI Desktop.

Nasi eksperci
/ Dzielą się wiedzą

21.09.2021

PIM vs CMS / Dlaczego warto używać PIMu?

Product Information Management

Dla większości biznesów, typowy system zarządzania treścią (włączając w to zarówno systemy tradycyjne, jak i nowoczesne, na przykład headless CMS) powinien w dość prosty sposób zaspokajać wszelkie potrzeby; strony docelowe, domowe, informacje kontaktowe etc. Gdy chodzi jednak o firmy zajmujące się sprzedażą e-commerce, jest jedna, dość...

14.09.2021

QlikSense vs Power BI / (Niezbyt) obiektywna opinia

Power BI

Business Intelligence to szeroki rynek – istnieje mnóstwo opcji do wyboru i zakłada się, że żadna z nich nie zajmuje powyżej 20% całego rynku. Innymi słowy, nie istnieje żaden oczywisty lider – pytanie jednak, czy można wśród uczestników znaleźć przegranych? Cóż, jak sugeruje tytuł, chcielibyśmy w tym poście porozmawiać o QlikSense...

07.09.2021

Dostępność cyfrowa I użyteczność / Dostosowanie do potrzeb klienta

E-Commerce

W naszym poprzednim artykule omówiliśmy wyzwania związane z ułatwieniem dostępu do stron internetowych osobom z wadami wzroku i (spoiler) sposoby ich rozwiązania. Tym razem chcemy rozszerzyć koncepcję użyteczności jako całości, aby pokazać, w jaki sposób firmy mogą uczynić swoje produkty i usługi dostępne dla wszystkich. Tym razem chcemy...

Ekspercka wiedza
dla Twojego biznesu

Jak widać, przez lata zdobyliśmy ogromną wiedzę - i uwielbiamy się nią dzielić! Porozmawiajmy o tym, jak możemy Ci pomóc.

Napisz do nas

<dialogue.opened>