• 22jún

    Adatbányászati feladatok megoldása során gyakran tranzakciós adatokkal dolgozunk. A tranzakciós adatok a cégek ügyfelei által végzett vásárlás-, hívásadatokat vagy éppen pénzforgalmak főbb adatait jelentik – alkalmazási területtől függően. Ilyen tranzakciós adatbázisokon előzetes adatfeldolgozásra lehet szükség ahhoz, hogy kinyerjük az egyes ügyfelekre/termékekre vonatkozó összesített információkat, mert osztályozás csak úgy valósítható meg, ha minden osztályba sorolandó objektumról (például ügyfél, termék) egyetlen sornyi adattal rendelkezünk.

    Az összesített információk kinyerésének egy lehetséges, és gyakran használt módszere az aggregáló műveletek használata. A lehetséges aggregáló műveletek széles köre és a változók számossága miatt azonban az aggregáló műveletek alkalmazásakor sok új változó születik, ami már átláthatatlan egy adatbányászati elemzés során, így ahhoz, hogy pontos modellt tudjunk építeni, felmerül annak az igénye, hogy a célváltozó szempontjából fontos attribútumokat kiválogassuk. Tovább »