Tiedonhallinnan ja tietokantojen kehityksessä on nähtävissä tiettyjä kausia ja kehityskaaria. 70-luvulla tulivat käyttöön tietokantajärjestelmät, jotka olivat tuohon aikaan verkkomallisia (esim. IDMS ja Image) tai hierarkkisia (esim. DL/1). Atk-väki opetteli tietokantatekniikkaa, tapahtumankäsittelyohjelmointia ja teki hyviä operatiivisia järjestelmiä. 80-luvun lopulla alkoi hitaasti mutta rajusti kiihtyen tapahtua siirtymistä SQL-pohjaisiin relaatiokantoihin, joiden varaan nyt lähes kaikki uudet järjestelmät tehdään. Jälleen on opiskeltu uutta: relaatiotekniikkaa, SQL-kieltä ja relaatiokannan virittämistä.
Relaatiokannoilla tehtiinkin hieman yllättäen pääosin operatiivisia järjestelmiä. Aina olemassa ollut tarve yrityksen tietojen analysointiin, yhteenvetoihin ja spontaaneille kyselyille on vasta viime aikoina saanut uutta puhtia, kun rapakon takaa on vyörynyt uusi iskusana Data Warehouse eli tietovarasto.
Tietovarastoajattelun ideana on tallettaa keskitetysti tietoa operatiivisista järjestelmistä infokantaan ja säilöä siellä myös historiaa. Vuosia ovat konsultit (itse mukaan lukien) jankuttaneet, että tiedon toistoa tulisi välttää ja normalisoidaan hyvin. Data Warehouse-ajattelussa tietoja surutta toistetaan, lasketaan valmiiksi summia ja denormalisoidaan. Mutta nyt tämä ei haittaakaan, sillä tiedon toiston ongelmallisuushan liittyy päivitykseen, joka tietovarastoissa hoidetaan hallitusti yhdestä paikasta. Levytilakin on dramaattisesti halventunut.
Tietovarasto-boomi on herättänyt relaatiokantojen toimittajat. Kaikki tarjoavat omia Data Warehouse-tuotteitaan. Lisäksi on joukko muita apuvälinetoimittajia. Relaatiokantojen vaihtoehdoksi on ilmestynyt ns. moniuloitteisia tietokantoja (Multidimensional, MDD). Näitä kutsutaan OLAP-kannoiksi, termi tulee E.F.Coddin lanseeraamasta käsitteestä Online Analytical Processing, ikäänkuin vastakohtana OLTP:lle. Aika näyttää, yleistyykö niiden käyttö relaatiokantojen rinnalla. Oliokannathan eivät ole pärjänneet relaatiokannoille.
Yhä useampi yritys on siirtymässä kahden tietokantaympäristön strategiaan, jossa operatiiviset ja kysely/raportointikannat pidetään erillään. Näin käyttäjät vihdoinkin alkavat saada vastauksia businesstarpeisiinsa. Opetelkaamme siis toistamaan tietoa - oikein!
Ari Hovi, konsultti, Ari Hovi Oy