Kuutio

Tulosten pisteyttäminen

8.4.2008 klo 12:52

Monissa palveluissa, esimerkiksi meidän sarjakuvageneraattorissa, käyttäjät voivat antaa pisteitä kohteille. Sarjakuvageneraattorissa kohteet ovat sarjakuvia, IMDB:ssä elokuvia ja muissa palveluissa esimerkiksi musiikkikappaleita tai kirjoja.

Palveluissa käyttäjälle voidaan näyttää lista kaikkein suosituimmista kohteista. Ongelmana kuitenkin pelkkää pisteiden keskiarvoa käytettäessä on, että tyypillisesti kärjessä on monia kohteita jotka ovat saaneet vain yhden arvostelun, kun taas kohteet joilla on monta arvostelua eivät juuri koskaan saa täyttä pistemäärää (esimerkiksi viittä tähteä).

Tämän pohjalta tulee mieleen, että pisteitä voisi painottaa siten, että kohteet, joilla on vähän arvosteluja, saavat pisteitä jotka ovat lähempänä kaikkien arvostelujen keskiarvoa, kun taas paljon arvostellut kohteet saavat pisteen joka on lähellä kohteelle annettujen pisteiden keskiarvoa. Tämän menettelyn voi perustella tilastomatemaattisesti bayeslaisella mallilla.

Tilastotieteilijä Andrew Gelman on kirjoittanut blogiinsa hyvän, tilastoteknisen intron aiheeseen. Ehkä hieman helpommin lähestyttäviä ovat The Brothin Bayesian Rating – how to implement a weighted rating system ja Life with Alacrityn Collective Choice: Rating Systems -artikkelit.

Menetelmä on sekä elegantti että helposti toteutettavissa, mikäs sen mukavampaa?

No Comments »

No comments yet.

RSS feed for comments on this post. TrackBack URI

Leave a comment

good buys on software pirodr! 666