Metoda DAF (Dependency-Aware Feature Selection) určená k výběru nejinformativnějších příznaků v situacích s nevýhodným poměrem dimenzionality vůči počtu vzorků

Byla definována metoda ohodnocování významu příznaků vyznačující se několika unikátními vlastnostmi. Poměrem výpočetní náročnosti a schopnosti vyhodnocovat statistické závislosti mezi příznaky jde o unikátní metodu pokrývající aplikační oblast pro kterou doposud vhodná metoda nebyla k dispozici. Resp. na rozdíl od doposud používaných metod je v tomto případě možné vyhodnocovat statistické závislosti mezi příznaky i při datových souborech vedoucích buď k extrémní výpočetní náročnosti (kvůli velmi vysoké dimenzionalitě), či k značnému nebezpečí přetrénování a tím selhání učícího mechanizmu (v situaci kdy počet vzorků trénovací množiny je relativně malý vzhledem k dimenzionalitě).

Inovační aspekty

Jde o unikátní metodu která překlenuje propast mezi prohibitivně pomalými metodami komplexní analýzy vztahů mezi příznaku a metodami rychlými, ale ignorujícími statistické závislosti mezi příznaky. Jde pravděpodobně o jedinou metodu schopnou ohodnocovat význam příznaků v kontextu i v případě velmi velkého počtu příznaků (tisíce až desetitisíce).

Přínosy

Metoda je výhodná nejen při velmi vysoké dimenzionalitě, ale i v jakékoliv situaci kdy počet trénovacích vzorků je relativně malý vůči dimenzionalitě. Toto je typický případ např. při hledání faktorů úspěšnosti nemocničních zařízení. Při tomto typu analýzy jsou k dispozici velké počty příznaků (diagnostických údajů apod.) při relativně malém počtu vzorků (pacientů v rámci zkoumané jednotky či diagnózy). Uvedená metoda má potenciál poskytovat informaci méně zatíženou zkreslením z přetrénovaní, než jiné metody tohoto typu.

Dokumentace

Design downloaded from Free Templates - your source for free web templates