16
REHIS 基基基基基基基基基基基基基基基 基基基基 基基基 基基基 基基 22/6/8 1

REHIS :基于层次项目相似性的高效推荐算法

  • Upload
    kalil

  • View
    154

  • Download
    0

Embed Size (px)

DESCRIPTION

REHIS :基于层次项目相似性的高效推荐算法. 论文作者:孙远帅 报告人:李培. 1. 2. 3. 主要内容. 推荐系统概念. 一般推荐算法. 本文工作. 推荐系统概念. 1. 一般推荐算法. 2. 基于内容的推荐 协同推荐 混合推荐. 本文工作. 3. 而本文的工作主要集中于 协同过滤 ,协同过滤的主要思想就是 k 近邻,即在用户集合中查找与目标用户最相似的 K 个用户来进行推荐,其过程如下:. 共同评分的 item. 推荐给目标用户. Top K. 最相似用户最喜欢的 item. 本文工作. 3. 1. Cosine 距离. - PowerPoint PPT Presentation

Citation preview

Page 1: REHIS :基于层次项目相似性的高效推荐算法

REHIS :基于层次项目相似性的高效推荐算法

论文作者:孙远帅

报告人:李培

23/4/21 1

Page 2: REHIS :基于层次项目相似性的高效推荐算法

1

2

3

一般推荐算法

推荐系统概念

本文工作

主要内容

23/4/21 2

Page 3: REHIS :基于层次项目相似性的高效推荐算法

1 推荐系统概念

23/4/21 3

Page 4: REHIS :基于层次项目相似性的高效推荐算法

2 一般推荐算法

1. 基于内容的推荐

2. 协同推荐

3. 混合推荐

23/4/21 4

Page 5: REHIS :基于层次项目相似性的高效推荐算法

而本文的工作主要集中于协同过滤,协同过滤的主要思想就是 k 近邻,即在用户集合中查找与目标用户最相似的 K 个用户来进行推荐,其过程如下:

共同评分的 item

Top K

最相似用户最喜欢的 item

推荐给目标用户

3 本文工作

23/4/21 5

Page 6: REHIS :基于层次项目相似性的高效推荐算法

1. Cosine 距离

2. Pearson 相关系数

其中, Sxy 是用户 x 和用户 y 共同评分的项目

, ,

2 2, ,

( )( )

( , )( ) ( )

xy

xy xy

x s x y s ys S

x s x y s ys S s S

r r r r

sim x yr r r r

, ,

2 2, ,2 2

( , ) cos( ) xy

xy xy

x s y ss S

x s y ss S s S

r rx y

sim x y x yx y r r

3 本文工作

23/4/21 6

数据规模较大时,其比较慢!

Page 7: REHIS :基于层次项目相似性的高效推荐算法

为此我们引入倒排索引,构建一个用户项目的倒排索引,来方便查找用户的共现项目。

3 本文工作

23/4/21 7

虽然这样有效的减少了共现项目的查找时间,但其并没有减少计算量,是否能减少计算量呢?

Page 8: REHIS :基于层次项目相似性的高效推荐算法

23/4/21 8

为此我们提出了 TOPKS 算法 ,利用相似度的分子是累加和的形式,算法的主要过程如下:(以 Cosine 距离为例)

3 本文工作

23/4/21 8

计算部分相似度

排序得到 topk 集

……

估算最大值

||10000 2,,,,

1xy

Sssysx

Sssysx Srrrr

xyxy

删除不必要用户

Page 9: REHIS :基于层次项目相似性的高效推荐算法

3 本文工作

Excution Time Contrast Table Based-onDifferent Number of User

0. 000. 501. 001. 502. 002. 503. 003. 504. 004. 50

2. 60 3. 10 3. 60 4. 10the number of participated users(log10)

excu

tion

tim

e(lo

g10) Tradi t i onal

I nverted I ndex

TopKS

不同规模用户数量上的比较实验

23/4/21 9

Page 10: REHIS :基于层次项目相似性的高效推荐算法

3 本文工作

Excution Time Contrast Time Table Based-onDifferent Sparsity of Rating Matrix

0. 50

1. 00

1. 50

2. 00

2. 50

3. 00

3. 50

4. 00

4. 50

5. 00

-0. 50 0. 50 1. 50 2. 50 3. 50the value of sparsity(*20)

excu

tion

time(

log1

0) Tradi t i onal

I nvert I ndex

TopKS

不同稀疏度对近邻计算的影响

23/4/21 10

Page 11: REHIS :基于层次项目相似性的高效推荐算法

23/4/21 11

3 本文工作

23/4/21 11

通过 Topks 算法我们有效地提高了协同过滤算法的效率,但是算法的效果不能令人满意。我们该如何改进呢?

协同过滤算法的效果依赖于一个准确的相似度度量,传统的cosine 距离、 pearson 系数等受限因素太多,难以准确度量相似度。那我们该如何去度量相似度呢?

Page 12: REHIS :基于层次项目相似性的高效推荐算法

3 本文工作

23/4/21 12

为此本文提出利用项目间的层次间关系,构建出一个标签和项目之间的层次结构图,而后引入语义网络中一种基于本体的概念相似度计算方法来计算相似度。

为了提高协同过滤算法的相似度度量的准确度,我们就需要引入更多的信息,而在推荐系统的用户数据上有很多用户自定义的标签,这些标签存在着一定的层次关系,并在一定程度上描述了项目的关键属性。

Page 13: REHIS :基于层次项目相似性的高效推荐算法

),()()())(

1)()(

)()1((),(wt pcTpICcIC

pdpd

pEE

pc

计算父子节点之间距离

通过找到两个节点的最短距离来求相似度

3 本文工作

23/4/21 13

a b c d e f g

h i

j k

l m

Track

Genre

Album

Artist

层次相似度的计算过程:

构建出标签和项目之间的层次结构图

Page 14: REHIS :基于层次项目相似性的高效推荐算法

3 本文工作

Accuracy Contrast Table

1. 18

1. 20

1. 22

1. 24

1. 26

1. 28

1. 30

1. 32

0. 00 0. 50 1. 00 1. 50 2. 00N(the number of nearest user)(log10)

valu

e of

RM

SE(lo

g10)

cosi ne si mi l ari ty

pearson correl ati on

TopKREHI S

算法效果对比图

23/4/21 14

Page 15: REHIS :基于层次项目相似性的高效推荐算法

1. KNN 扩展:引入倒排索引,加入 Topks 算法改进了KNN 算法使得传统协同过滤算法处理数据的能力有所提升,有效的提高了算法的效率。

2. 基于层次项目相似性进行推荐:利用 KNN 算法和关联规则完成标签层次结构,而后提出基于标签层次结构计算项目相似度的方法,提高了推荐的准确度。

3 本文工作

23/4/21 15

Page 16: REHIS :基于层次项目相似性的高效推荐算法

23/4/21 16

欢迎批评指正!

论文作者:孙远帅邮箱: [email protected]电话: 18250878229