Řazení hodnocení (Wilson Score Interval apod.)

Jak se pokusit zobrazit/interpretovat hodnocení např. produktů více smysluplně.


V dnešní době, kdy se čím dál více produktů, služeb a jiných věcí hodnotí, se často setkáváme s problémem, jak tyto hodnocení řadit a zobrazovat uživatelům. Klasické řazení podle průměrného hodnocení však může být zavádějící, zejména pokud je malý počet hodnocení. Proto se používají různé statistické metody pro řazení, jako například Wilson Score Interval.

Ukázka srovnávání na hypotetickém e-shopu

Při nákupu na e-shopu jsou hodnocení a recenze produktů často jedním z hlavních faktorů, které pomáhají zákazníkům rozhodovat se mezi různými produkty. E-shopy proto často používají různé metody pro řazení produktů podle jejich hodnocení, aby pomohly zákazníkům najít nejlepší možnosti.

V následující tabulce je ukázka řazení dle:

  • Průměr: Produkty jsou seřazeny podle průměrného hodnocení. Čím vyšší je průměr, tím výše je produkt umístěn. – Metoda průměrování
  • Wilson score: Produkty jsou seřazeny podle Wilson score, což bere v úvahu jak průměr hodnocení, tak i počet hodnocení. Čím vyšší je Wilson score, tím výše je produkt umístěn. – Metoda Wilson score
  • Bayesovský průměr: Produkty jsou seřazeny podle Bayesovského průměru, který kombinuje průměr hodnocení s pravděpodobností správnosti výsledku. – Bayesovské průměrování
  • Skóre: Produkty jsou seřazeny podle skóre, které je spočteno přidělením nejvyššího skóre produktům s nejlepšími hodnoceními. – Metoda maximálního skóre
  • Pořadí: Produkty jsou seřazeny podle pořadí hodnocení, bez ohledu na hodnocení samotné. – Metoda pořadové statistiky
Produkt Hodnocení (počet) Průměr (pořadí) Wilson score (pořadí) Bayesovský průměr (pořadí) Skóre (pořadí) Pořadí
A 5, 4, 5, 3, 4, 4, 4, 4, 5, 4 (10) 4,2 (2) 0,928 (1) 4,27 (2) 40 (2) 2
B 5, 5, 5, 5, 1, 5, 5, 5 (8) 4,57 (1) 0,789 (2) 4,71 (1) 40 (1) 1
C 4, 4, 4, 4, 4, 4, 4, 4, 4 (9) 4,0 (3) 0,793 (3) 4,0 (3) 36 (3) 3
D 5, 3, 2, 4, 1, 3, 5, 2, 5 (9) 3,56 (4) 0,250 (4) 3,67 (4) 28 (4) 4
E 3, 3, 3, 3, 3, 3, 3, 3, 3 (9) 3,0 (5) 0,033 (5) 3,0 (5) 27 (5) 5

Řazení ukázkových produktů dle jednotlivých metod

Implementování Wilson Score

Pro implementaci této metody v různých programovacích jazycích existuje mnoho knihoven a balíčků. Některé z nich jsou:

K dalšímu šťourání

  • Jakub Vrána na Twitteru: “Existuje nějaký standardizovaný způsob, jak porovnat relativní čísla s velkým absolutním rozptylem? Řekněme, že se člověku A něco povedlo 1× z 1 pokusu a člověku B 19/20. Nechci úplně řadit A před B, i když má úspěšnost 100% proti 95%. Jak zkombinovat relativní a absolutní číslo?”
  • Home Page of Evan Miller - osobní stránka Evana Millera, autora článku “How Not To Sort By Average Rating”.
  • sorting - What is a better way to sort by a 5 star rating? - Stack Overflow - tato diskuze na Stack Overflow se věnuje otázce lepších způsobů řazení podle hodnocení. Kromě Wilson Score Interval jsou zde zmíněny i další metody, jako například Bayesovský průměr a Laplaceův průměr.
  • Using the Bayesian Average in Ranking | Tutorials | Algolia Documentation - tento tutoriál od společnosti Algolia se zabývá použitím Bayesova průměru pro řazení položek podle hodnocení. Tento přístup umožňuje zohlednit nejen průměrné hodnocení, ale i spolehlivost dat, což vede k lepším výsledkům při řazení.

Alternativní přístup určením pravděpodobnosti spokojenosti

Na problém se můžeme podívat i z jiného úhlu. Místo „nápravy” průměru, se můžeme zeptat zda bude zákazník*ce (ne)spokojen*na dle předchozích hodnocení.

Ze studia pravděpodobnosti vyplyne, že k „obyčejnému” průměru stačí „přidat” jedno dobré a jedno špatné hodnocení.

Produkt Spokojenost [ano/ne (počet)] Průměr (pořadí) Prav. spokojenost (pořadí)
A 8/2 (10) 0,80 (5) 75% (6)
B 9/1 (10) 0,90 (2) 83% (3)
C 8/1 (9)  0,89 (3) 82% (4)
D 9/0 (9)  1,00 (1) 91% (1)
E 7/1 (8)  0,88 (4) 80% (5)
F 8/0 (8)  1,00 (1) 90% (2)

Bude zákazník*ce spokojen*na?

K dalšímu šťourání