Group Recommendation: Semantics and Efficiency09.pdf · Efficient Recommendation Computation i1,2...

Group Recommendation: Semantics and Efficiency

Sihem Amer-Yahia, Senjuti Basu-Roy, Ashish Chawla, Gautam Das, and Cong Yu.

Individual Recommendation

Che libro dovrei leggere?

Quale amico dovrei aggiungere?

Quale amico non devo aggiungere?

Strategie di due tipi:item-based: item simili già valutati

collaborative filtering: item valutati da utente simile

Molti algoritmi e servizi di I.R. per soddisfare i nostri gusti..

.. e se non siamo soli?

Group RecommendationAiutare un gruppo di conoscenti a trovare risorse che possano soddisfare i gusti generali

... ??? ...

Group RecommendationPochi lavori sui G.R.

Soluzioni esistenti:

Preference Aggregation: Aggrega gli item più votatidai singoli, in un utente virtuale a cui fornireRecommendation.

Group RecommendationPochi lavori sui G.R.

Soluzioni esistenti:Score Aggregation: aggrega I.R. dei singoli, per creareun’unica lista per il gruppo:

Average

Least Misery

Perché non bastano?Obiettivo: consigliare un film a un gruppoG={u1, u2, u3}

relevance (u1, “Amici miei”) = 5

relevance (u3, “Amici miei”) = 1 Stesso score medio

Average NO :(

relevance (u1, “Via col vento”) = 3

Perché non bastano?Obiettivo: consigliare un film a un gruppoG={u1, u2, u3}

Least misery NO :(

Un item può essere valutato diversamente da membri dello stesso gruppo

Group Disagreement“..despite being friends, peoplemay not share the same tastes

for all things..”

sono parametri da considerare in Group Recommendation

Group Disagreement

Obiettivo: calcolare uno score per ogni item che rifletta gli interessi e le preferenze del

gruppo

Average Pair-wise

Disagreement Variance

Ingredienti:

Esprimere il livello di disaccordo tra i vari membri riguardo gli item

Esprimere il gradimento di un singolo itemper il gruppo

Ingredienti:

CONSENSUS FUNCTION

Strutture di supporto:

Relevance List

DisagreementList

IL1 IL2 DL1,2

1 per ognipossibile coppia

Definizione del problemaDato un gruppo G e una Consensus Function F,

si deve ritornare una lista di K elementi, in ordine decrescente secondo i valori di F, tale che ogni

elemento sia nuovo per tutti i membri del gruppo

Top-K Group Recommendation

Threshold Algorithm!I migliori algoritmi per risolvere

problemi di tipo top-K appartengonoalla famiglia dei T.A.

Per garantire efficienza si possono applicare condizioni di STOP basate su score bounds.

monotonicità- Average- Least-misery

- Pair-wise- Variance

DL monotone

Efficient Recommendation Computation

IL1 IL2

- Ordina in maniera decrescente IL- Applica T.A.

Si può migliorare?Pruning grazie alle Disagreement List

4 Sorted Access per top-1: i3

Efficient Recommendation Computation

IL1 IL2

- Ordina in maniera decrescente IL- Applica T.A.

Si può migliorare?Pruning grazie alle Disagreement List

4 Sorted Access per top-1: i3 3 Sorted Access per top-1: i3

- Ordina in maniera crescente pair-wise DL

Group G

IL1 IL2 DL1,2

Group Recommendation Algorithm

Group Recommendation AlgorithmFully Materialized DL (FM):

SA su ogni input list (Round Robin) tramite getNext()

ComputeMaxScore(): produce un nuovo Thresholdad ogni iterazione (usando F) UpperBound

ComputeExactScore(): esegue Random Accesssu IL per definire lo score di ogni elemento(usando F).

Relevance List Only (RO):

Non utilizza le Disagreement List

Relevance List Only (RO):

Non utilizza le Disagreement List

- Migliore efficienza- Numero di DL elevato

- Upper Bound meno efficaci- Minore occupazione di memoria

Esempio - ROObiettivo: Elemento Top-1 su un gruppo di 3 utenti G={u1, u2, u3}

Input: 3 Relevance List (IL1, IL2, IL3) su 4 film

Performance: numero di SA

Top-K Buffer

i1,1.33Th=1,93

Top-K Buffer

i1,1.33

i2,1.33

Th=1,86

Top-K Buffer

i1 1,33

i2,1.33

i3,1.33

Th=1,73

Top-K Buffer

i1 1,33

i2,1.33

i3,1.33

Th=1,73

Top-K Buffer

i4,1.6

i1 1,33

i2,1.33

i3,1.33

Th=1,73

Top-K Buffer

i4,1.6

i1 1,33

i2,1.33

i3,1.33

Th=1,73

Top-K Buffer

i4,1.6

i1 1,33

i2,1.33

i3,1.33

Th=1,73

Top-K Buffer

i4,1.6

i1 1,33

i2,1.33

i3,1.33

Th=1,60

STOP!Top-1 = i4

Esempio - FMInput: 3 Relevance List (IL1, IL2, IL3) e 3 pair-wise Disagreement List (DL12, DL13, DL23)

i1,1.33Top-Kbuffer Th=1,93

i1 1,33

i2,1.33Top-Kbuffer Th=1,86

i1 1,33

i2,1.33

i3,1.33

Top-Kbuffer Th=1,73

I4,1.6

i1 1,33

i2,1.33

i3,1.33

Top-Kbuffer Th=1,73

I4,1.6

i1 1,33

i2,1.33

i3,1.33

Top-Kbuffer Th=1,66

I4,1.6

i1 1,33

i2,1.33

i3,1.33

Top-Kbuffer Th=1,60

STOP!Top-1 = i4

Ottimizzazioni!Dati n utenti il numero di pair-wise Disagreement List è

Partial Materialization: Materializzare solo un

sottoinsieme m di DL inpreprocessing-step.

Quali materializzare?

Partial MaterializationDati 5.000 utenti

Elevata memoria richiesta

Intuizione: materializzare DL se:

#DL = 12.497.500

1) È molto probabile che gli utenti si riuniscano in un gruppo e richiedano Recommendation

2) la loro presenza aumenta l’efficienza delle query Top-K.

Partial MaterializationSoluzione

coppia di utenti #SA senza DL #SA con DL Differenza

{u1,u2} 200 100 100

{u3,u4} 290 195 95

{u10,u9} 170 100 70

{u6,u7} 230 190 40

{u2,u3} 175 145 30

... ... ... ...

1) P(Gruppo)2) Efficienza

rich query log

Sharpening ThresholdPossiamo sfruttare le dipendenze tra relevance e disagreement list per migliorare il Threshold ???

i1,0.5

i3,0.5

i2,0.5

i3,0.4

i3,0.2

i1,0.3

Th = 1.3

i1,0.5

i3,0.5

i2,0.5

i3,0.4

i3,0.2

i1,0.3

Th = 1.3

i1,0.5

i3,0.5

i2,0.5

i3,0.4

i3,0.2

i1,0.3

Th = 1.2

Prove SperimentaliDataSet utilizzato: MovieLens

Individual Recommendation calcolate con “collaborative filtering”

Algoritmi di Group Recommendation testati sul set di utenti di

3 tipi di gruppi (similar, dissimilar e random) per 2 possibili dimensioni (da 3 e 8 utenti)

4 tipi di algoritmi testati: Average Relevance Only (AR), Least Misery Relevance Only (LM), Consensus with Pair-wise Disagreements (RP), Consensus with Disagreement Variance (RV)

#utenti #film #voti

71.567 10.681 10.000.054

Valutata Performance su #SA comparando FM, RO e PM variando la dimensione e il tipo del gruppo e K

Valutata efficacia della Partial Materialization

Valutata efficacia del Threshold Sharpening

Il sito dà la possibilità di coinvolgere direttamente un gruppo di utenti nei test proposti dagli autori che ricevono dei feedback sulla bontà delle raccomandazioni fatte agli utenti.

00,10,20,30,40,50,60,70,80,91,0

Small Group Large Group

Similar User Group

AR MORV80 RP80

00,10,20,30,40,50,60,70,80,91,0

Dissimilar User Group

AR MORV80 RP80

Best: MO Best: RV80 RP80 Best: RV80

nDCG nDCG

DCG = discounted cumulative gain: più algoritmo efficiente, più valore vicino ad 1

00,10,20,30,40,50,60,70,80,91,0

Random User Group

AR MORV80 RP80

Best: MO No Best Best: RV80

00,10,20,30,40,50,60,70,80,91,0

Dissimilar Group with variations

RV20 RP20RV80 RP80nDCG nDCG

0200400600800

1.0001.2001.4001.6001.8002.000

0.3 0.5 0.7 0.9

Varying Similarity

FM RO PM

Similarity

01002003004005006007008009001.000

5 10 30

Varying no of items

FM RO PM

o > similarityo < efficaciao Top item simili

o RO UB efficacio FM scansioni inutili

o > itemo > #SAo Best: PM

Gsize = 5K = 10PM = 3

Gsize = 5Gsim = 0.5

PM = 3

PM = 5

PM = 3

#Liste materializzate

5 10 30

Varying Group Size

FM RO PM

o > #groupsizeo > #SAo RO worst performance

#Groupsize

Gsim = 0.5K = 10PM = 3

IL forniscono buone “stopping condition”

0100200300400500

i=0 i=1 i=2 i=3 i=4 i=5 i=6 i=7 i=8 i=9 i=10

Varying # of materialized lists

5 10 30

Threshold SharpeningFM with optimizationFM without optimization

o FM ottimizzato migliore

#liste materializzate

o i=0 corrisponde a ROo i=3 best performance

Trade-off tra#DL e #SA

Gsize = 5Gsim = 0.5K = 5

Riassumendola presenza di Disagreement List migliora di molto le performance per gruppi di utenti “dissimilar” e di grandi dimensioni

Spesso Partial Materialization (PM) è la soluzione migliore (gruppi “abbastanza” simili)

Per la stessa query, DL diverse contribuiscono diversamente nel calcolo del TOP-K

Solo alcune di esse devono essere considerate

La Sharpening Optimization migliora sempre le performance complessive

Group Recommendation sono sempre più importanti grazie alle continue interazioni tra utenti sul WEB

Disagreement List ha un forte impatto sia sulla qualità che sull’efficienza di Group Recommendation

Threshold algorithm, TA può essere adattato per il calcolo di Group Recommendation. (FM, RO)

Sono state implementate ottimizzazioni che migliorano l’efficienza degli algoritmi (PM, Sharpening Threshold)

Conclusioni

Lavori futuri: ottimizzare le DL affinché occupino meno spazio (contenendo le stesse info) e adattare gli algoritmi di GR

Conclusioni

Vota Gruppo 7

Grazie dell’attenzione

Group Recommendation: Semantics and Efficiency09.pdf · Efficient Recommendation Computation i1,2...

Documents

Ordina Newspaper 2007

Ordina 23 juni agile competence centre

BUZZ Ordina - SAP JOBS - Meet Bart

Ordina Compliance 3.0 Linked In

Filmevent Ordina Mei 2011 Hasselt

Build Stuff 2015 redelivery @ Ordina

Ordina - VisionWorks Seminar: Bi Innovation Radar Part2

Sap innovations @ ordina

Ordina open architectuur

Ordina Planning & Scheduling Day - APS - welcome

Servizio Servizi - Hilti · sensi della sezione3.3. Il Cliente deve garantire (i) ... (valido solo per le Applicazioni Web). Se nell’Ordine di Abbonamento il Cliente ordina il modulo

Ordina Vision Works

ORDINA - Gazzetta Amministrativaww2.gazzettaamministrativa.it/opencms/export/sites/... · 2016. 5. 11. · Visto il Regolamento UE n. 142/2011 ; Visto il Decreto del Ministero della

Sul Sentiero, Il Pensiero Che Ordina

BUZZ Kickstarter Microsoft Ordina - Traineeship Jobs

1350_BartdeJong_Presentatie Bart de Jong Ordina

Il Dipartimento federale dell’interno (DFI), ordina: a...2021-1-1 · del 30 maggio 2011 (Stato 15 dicembre 2020) Il Dipartimento federale dell’interno (DFI), visto l’articolo

20150624 Belgian GraphDB meetup at Ordina

Ordina PMO Kennissessie 180612 Henny Portman

Ordina Annual Report 2009