Datagruvdrift
Det finns många olika metoder för att hitta mönster i data. De som jag finner mest intressanta är principal component analysis, som när man letar mönster i bilder fångar upp någon typ av idealiserade "proto-bilder", independent component analysis, som hittar de delmönster som fångar upp den mesta statistiska variansen i en bild, och andra matrisfaktoriseringsmetoder. I min datagruvdriftskurs har jag nyligen snubblat över en metod jag tidigare inte hade sett. Den kallas nonnegative matrix factorization och leder, precis som Olshausen och Fields sparseness algoritm, till det datavetare kallar glesa koordinater.
Eftersom jag nu har tillbringat en hel del tid med att läsa om alla dessa faktoriseringar skulle det skulle vara skoj att försöka mig på en jämförelse mellan dem, applicerad på DNA microarrays. Kanske kan jag med lite tur slå tre flugor i en smäll och göra mina projekt i alla kurser till en studie i matrisfaktoriseringar. Det vore intressant.
No comments:
Post a Comment