it-swarm.com.de

Was sind Maße und Abmessungen in Würfeln?

Ich bin sehr neu in Microsoft SQL Server Business Intelligence und Analysis Service (aber ich programmiere seit Jahren mit SQL Server). Kann jemand Maße und Dimensionen in Würfeln in einfache Wörter (wenn es mit Bildern möglich ist) beschreiben?

vielen Dank

21
Arian

Denken Sie an ein Prozessereignis oder Ereignis , das Sie analysieren möchten.

Angenommen, Sie haben Lougle Analytics erstellt und möchten Besuche (im Gegensatz zu einseitigen Anfragen) auf Ihrer Website analysieren. Der Besuch einer Website ist ein Prozess.

Eine Faktentabelle stellt einen Prozess oder ein Ereignis dar, das Sie analysieren möchten. In diesem Fall handelt es sich um eine Liste von Site-Besuchen. Sie können so viele Faktentabellen haben, wie Sie möchten, eine pro Prozess oder Ereignis.

Welche Dinge könnten für Sie bei der Analyse von Ortsbesichtigungen hilfreich sein?

  • Informationen zum Webbrowser (Marke, Bildschirmauflösung, ...)
  • Informationen über den Benutzer (Land, Bundesland, Stadt, ISP, basierend auf seiner IP-Adresse)
  • Informationen zum Beginn des Besuchs (Jahr, Quartal, Monat, Woche, Tag)
  • Die Dauer des Besuchs
  • Die verweisende Seite, die Zielseite und die Beendigungsseite (Titel, URL-Pfad)
  • Die Anzahl der während des Besuchs besuchten Seiten

Technisch gesehen könnten Sie dies alles in einer Tabelle zusammenfassen - wie in Excel, aber das würde sehr schnell sehr groß werden, also werden wir EINE Normalisierungsstufe durchführen. Das dimensionale Design besteht oft nur darin, "alles, was Sie für eine Analyse benötigen, in einer großen Tabelle zusammenzufassen" und dann eine Ebene zu normalisieren.

Ihre Faktentabelle sieht also folgendermaßen aus:

web_browser_key          bigint
ip_address_key           bigint
start_date_key           int
referring_page_key       bigint
landing_page_key         bigint
exit_page_key            bigint
duration_seconds         int
number_of_pages_visited  int

Es enthält eine Reihe von Schlüsselwerten, die sich auf Werte in anderen Tabellen † beziehen, und zwei Nichtschlüssel. Die Nichtschlüssel sind numerische Werte und werden als Measures bezeichnet. Können Sie den Durchschnitt des Markennamens des Webbrowsers ermitteln? Nein, es ist also eine Dimension. Können Sie den Durchschnitt der Besuchsdauer ermitteln? Ja, also ist es eine Maßnahme.

Die anderen Tabellen heißen Dimensionstabellen und die ip_address Dimensionstabelle könnte folgendermaßen aussehen:

ip_address_key  bigserial primary key, /* use meaningless surrogate keys */
ip_address      inet unique,
country         text,
division        text,
locality        text,
latitude        numeric(8,6),
longitude       numeric(9,6)

Beachten Sie, dass es nicht normalisiert ist: Land könnte von Stadt (Ort) abgeleitet werden. In einem Data Warehouse kümmern wir uns jedoch zuerst um Erleichterung der Analyse. Mit der Erleichterung der Analyse meine ich, tiefe Verknüpfungen zu vermeiden.

Beachten Sie, dass einige der Daten in der Dimensionstabelle hierarchisch: Land> Division> Lokalität sind. Ihr OLAP - Server versteht (hoffentlich) Hierarchien, um Drilldown-Vorgänge zu unterstützen.

Ein logischer Würfel ist nur die Sammlung von Dimensionen und Maßen, mit der Sie arbeiten. Im Gegensatz zu einem Zauberwürfel kann er mehr als drei Dimensionen haben. Stellen Sie sich eine Dimension als Spalte in Ihrem Datensatz vor.

[~ # ~] olap [~ # ~] ist eine Reihe von Operationen Sie können gegen einen Datensatz vorgehen , so ein Schwenken, Schneiden, Würfeln, Bohren. Denken Sie an Excel PivotTables. Ein OLAP-Server erleichtert OLAP-Operationen).

† normalerweise ohne Fremdschlüssel

40
Neil McGuigan

In der Abbildung unten sehen Sie ein Beispiel für ein grundlegendes Sternschema. Die Dimensionen sind die Dim_Tables.

Dies sind im Allgemeinen die Werte, nach denen Sie die Daten analysieren möchten. Sie möchten also einen bestimmten Produktverkauf in einem bestimmten Land über einen bestimmten Zeitraum betrachten.

In der Tabelle fact_sales haben Sie nur die Kennzahl Units_Sold.

Kennzahlen (auf der einfachsten Ebene) sind nur Dinge, die Sie bei der Analyse anhand von Kriterien in den Dimensionen aggregieren möchten.

Basic Star Schema

Wenn Sie noch etwas Spezifischeres wissen möchten, lassen Sie es mich bitte wissen.

13
OCDan