Algoritmus pro výběr vhodné podmnožiny příznaků pro řešení problému klasifikace.

Smyslem výběru příznaků v úlohách klasifikace je nejen zlepšit výpočetní složitost vyřazením příznaků nepodstatných pro klasifikaci, ale i zlepšení úspěšnosti klasifikace do tříd. Na klasifikátoru nezávislé kriterium vzájemné informaci mezi množinou příznaků a třídou se stalo populární mírou v oblasti výběru příznaků. Vyhledávací metody založené na tomto kriteriu jsou však výpočetně velmi náročné. Byl navržen algoritmus pro výběr příznaků, založený na nové aproximaci kriteria vzájemné informace, který umožňuje snížit výpočetní složitost výběru příznaků a dosáhnout vysoké přesnosti použitých klasifikátorů.

Inovační aspekty

Navržený mMIFS-U algoritmus, jehož verze je opublikována v níže uvedeném článku, používá novou aproximaci kriteria vzájemné informace mezi novým příznakem a třídou, podmíněné danou podmnožinou již vybraných příznaků. Tato aproximace je založena na teoretických výsledcích (viz Tvrzení 1 a 2) v publikaci uvedené níže. Účinnost algoritmu byla porovnána při použití tří klasifikátorů na Reuters-21578 textových souborech. Klasifikační metody při použití příznaků vybraných pomocí mMIFS-U algoritmu vykazují vyšší přesnost klasifikace oproti dříve v literatuře navrženým MIFS a MIFS-U algoritmům.

Přínosy

Algoritmus umožňuje vybrat podmnožinu příznaků, které jsou relevantní ke zkoumanému klasifikačnímu problému a tím snížit časovou náročnost i zlepšit účinnost klasifikátorů, navržených na základě omezeného množství dat.

Dokumentace

  • Novovičová, Jana ; Somol, Petr ; Haindl, Michal ; Pudil, Pavel. Conditional Mutual Information Based Feature Selection for Classification Task. Lecture Notes in Computer Science, 2007, Roč. 45, č. 4756, s. 417-426. ISSN 0302-9743.
Design downloaded from Free Templates - your source for free web templates