Piste, joka erottaa Fact-taulukon ja Dimension-taulukon, on, että dimensiotaulukko sisältää attribuutteja, joita pitkin toimenpiteet toteutetaan. On muitakin tekijöitä, jotka luovat eroja Fact Table- ja Dimension Table -taulukoiden välillä niiden tarkastelemiseksi.
Vertailukaavio
Vertailun perusteet | Taulukko | Mittataulukko |
---|---|---|
perustiedot | Faktitaulukko sisältää mittausmittaustaulukon ominaisuuksia pitkin. | Dimension-taulukko sisältää attribuutit, joiden perusteella taulukko laskee metriikan. |
Attribuutti ja tietueet | Taulukko sisältää vähemmän attribuutteja ja lisää tietueita. | Mittataulukko sisältää enemmän attribuutteja ja vähemmän tietueita. |
Taulukon koko | Taulukko kasvaa pystysuunnassa. | Mittataulukko kasvaa vaakasuunnassa. |
avain | Faktitaulukko sisältää ensisijaisen avaimen, joka on kaikkien ulottuvuustaulukoiden ensisijaisten avainten yhdistäminen. | Jokainen dimensiotaulukko sisältää sen ensisijaisen avaimen. |
luominen | Faktitaulukko voidaan luoda vain, kun ulottuvuustaulukot ovat valmiit. | Mitoitustaulukot on luotava ensin. |
kaavio | Kaavio sisältää vähemmän tosiasiataulukoita. | Kaavio sisältää enemmän ulottuvuustaulukoita. |
määritteet | Faktitaulukossa voi olla sekä numeerisia että tekstimuodossa olevia tietoja. | Mittataulukko sisältää aina attribuutteja tekstimuodossa. |
Faktataulukon määritelmä
Fact-taulukko on taulukko, joka sisältää mittaukset taulukkomittausten attribuutteja pitkin. Se voi sisältää tiedot mahdollisimman alhaisella tasolla. Jotkut tosiasiatiedot sisältävät vain yhteenvetotiedot, joita kutsutaan yhdistetyiksi fakto-taulukkoiksi . Taulukko sisältää lähes päivämäärän leimatut tiedot. Keskustelkaa tosiasiatietojen ominaisuuksista.
Yhdistetty avain
Fact table sisältää Concatenated-avaimen, joka on kaikkien ulottuvuustaulukoiden ensisijaisten avainten yhdistäminen. Yhdistetyssä tosiasiataulukossa on yksilöitävä tosiasiallisen taulukon rivi.
Data Grain
Tiedot vilja osoittaa, kuinka syvälle mittaustulokset on tallennettu. Tietorakeiden on oltava korkeimmalla tasolla.
Lisätoimenpiteet
Tietotaulukon attribuutit voivat olla täysin lisäaineita tai puoliaineita . Täysin lisätoimenpiteet ovat ne, jotka voidaan helposti tiivistää kaikkien tosiasiallisen taulukon mittojen osalta. Esimerkiksi quant_ordered on attribuutti, joka voidaan tiivistää kaikkiin ulottuvuuksiin. Samoin voimme ottaa kokonaismäärän, tietyn asiakkaan, alueen, päivämäärän, tuotemerkin jne. Osalta. Puoli-lisäaineet ovat sellaisia, jotka voidaan tiivistää tiettyjen taulukon mittojen mukaan, mutta eivät kaikkia ulottuvuuksia. Kuten, saldon määrää ei voi tiivistää ajan mittaan, koska se muuttuu ajan mittaan.
Harvat tiedot
Joskus saatamme nähdä tosiasiallisen taulukon tietueet, joilla on määritteitä nolla-mittauksilla . Esimerkiksi loma ei saa olla järjestyksessä. Niinpä tämän päivämäärän määritteillä on nollamittauksia. Meidän ei tarvitse tallentaa mittausta tällaisiin tietueisiin, koska se ei anna mitään tietoja.
Degeneroituneet mitat
Joskus saatat joutua kohtaamaan joitakin ulottuvuuksia, jotka eivät ole lainkaan lisäaineita. Esimerkiksi order_number, customer_id, et voi lisätä tällaisia mittoja. Jos sinulla on kuitenkin tarvetta etsiä tietyn asiakkaan tilausta tässä kuussa; sitten tarvitset asiakkaan_id, jotta voit liittää haun. Nämä tyypit, jos tietotaulukon attribuutteja tai mittoja kutsutaan degeneroiduksi dimensioksi .
Mitatun taulukon määritelmä
Mitoitustaulukko on avainkomponentti Start Schema: lle. Mitatietotaulukossa on mitat, jotka pitävät mittausta itse asiassa taulukossa. Lisäksi keskustelemme eräistä ulottuvuustaulukon ominaisuuksista.
Ominaisuudet ja avaimet
Jokaisessa Dimension-taulukossa on oltava ensisijainen avain, joka yksilöi jokaisen taulukon tietueen. Yleisesti havaitaan, että dimensiotaulukko sisältää monia attribuutteja. Näin ollen se näyttää olevan leveä eli kun luodaan dimensiotaulukko, se on levinnyt vaakasuoraan .
Attribuutin arvot
Mitatustaulukon attribuuttien arvot ovat harvoin numeerisia, useimmat kerrot, jotka löydät attribuuttien arvoista, ovat tekstimuodossa . Esimerkiksi tuotteen nimi, tuotemerkki, luokka, alaluokka jne.
Ominaisuuksien välinen suhde
Usein voit tarkkailla, että ulottuvuustaulukossa esiintyvät attribuutit eivät liity suoraan. Kuten Product_brandilla, sen ei tarvitse tehdä mitään pakettipalvelun kanssa, mutta molemmat voivat olla Tuotemittakaavan taulukon attribuutteja.
normalisointi
Mittataulukon ei pitäisi olla Normalisoitu . Tämä johtuu siitä, että taulukon normalisointi luo monia välitasoja. Kun kysely poimii attribuutin ulottuvuustaulukosta ja palauttaa mittaustulokset tosiasiatietoa varten, kyselyn on läpäistävä ne välitasot, jotka ovat tehottomia. Näin ollen mittataulukot eivät ole Normalisoituja.
Poraus alas, rullaaminen ylös
Mittataulukon attribuutit mahdollistavat yksityiskohtien saamisen joko siirtymällä korkeammasta aggregaattiominaisuudesta alemmalle tasolle. Jos esimerkiksi haluat löytää alueen kokonaismyynnin, voit porata alas, jos haluat löytää myynnin valtion, kaupungin, zipin mukaan. Voit jopa rullata löytää kokonaismyynnin vetoketjun, sitten kaupungin ja sitten valtion mukaan.
Useita hierarkiaa
Usein mitataulukko tarjoaa useita hierarkioita. Meillä on esimerkiksi tuotemittakaava taulukko tavaratalolle. Nyt meillä on kaksi osastoa markkinointi- ja kirjanpito-osastolta.
Markkinointiosasto laskee tietyn hierarkian tuotemittakaavion attribuuttien joukkoon mittaustulosten saamiseksi.
Toisaalta kirjanpito-osasto laskee eri hierarkiassa tuotemittakaavion ominaisuuksien joukosta mittaustulosten hankkimiseksi.
Niinpä ulottuvuustaulukossa on oltava useita hierarkioita tai määritteiden yhdistämistaso, jotta käyttäjä voi porata alas minkä tahansa useista hierarkioista.
asiakirjat
Vaikka ulottuvuustaulukossa on liian monta attribuuttia, sillä on vähemmän tallenteita.
Tärkeä ero Fact Table ja Dimension Table välillä
- Taulukko sisältää mittauksen ulottuvuuden taulukon ulottuvuuden / attribuuttien mukaisesti.
- Faktitaulukko sisältää enemmän tietueita ja vähemmän määritteitä verrattuna taulukkoon, kun taas dimensiotaulukossa on enemmän attribuutteja ja vähemmän tietueita.
- Taulukon taulukon koko kasvaa pystysuunnassa, kun taas taulukkokoko mittataulukossa kasvaa vaakasuunnassa.
- Jokainen dimensiotaulukko sisältää ensisijaisen avaimen kunkin taulukon tietueen tunnistamiseksi, kun taas faktataulukko sisältää yhdistetyn avaimen, joka on kaikkien ulottuvuustaulukon kaikkien ensisijaisten avainten yhdistelmä.
- Mittataulukko on tallennettava ennen tosiasiataulukon luomista.
- Schema sisältää vähemmän tosiasiataulukoita, mutta enemmän ulottuvuustaulukoita.
- Taulukon attribuutit ovat sekä numeerisia että tekstisiä, mutta dimensiotaulukon attribuuteilla on vain tekstimääritteet.
johtopäätös:
Molemmat ovat yhtä tärkeitä kaavion luomisen kannalta, mutta dimensiotaulukko on tallennettava ennen tosiasiatietoa. Koska on mahdotonta luoda tosiseikkoja, joissa on ulottuvuuksia.