思路:假设已有若干用户名字及其喜欢的电影清单,现有某用户,已看过并喜欢一些电影,现在想找个新电影看看,又不知道看什么好。根据已有数据,查找与该用户爱好最相似的用户,也就是看过并喜欢的电影与该用户最接近,然后从那个用户喜欢的电影中选取一个当前用户还没看过的电影,进行推荐。
本文主要演示Python内置函数以及内置字典与集合的用法。
from random import randrange
# 其他用户喜欢看的电影清单
data = {'user'+str(i):\
{'film'+str(randrange(1, 10))\
for j in range(randrange(15))}\
for i in range(10)}
# 待测用户曾经看过并感觉不错的电影
user = {'film1', 'film2', 'film3'}
# 查找与待测用户最相似的用户和Ta喜欢看的电影
similarUser, films = max(data.items(),\
key=lambda item:\
len(item[1]&user))
print('历史数据:')
for u, f in data.items():
print(u, f, sep=':')
print('和您最相似的用户是:', similarUser)
print('Ta最喜欢看的电影是:', films)
print('Ta看过的电影中您还没看过的有:', films-user)
某次运行结果:
历史数据:
user0:{'film9', 'film1'}
user1:{'film4', 'film2', 'film5', 'film9', 'film8', 'film1', 'film6'}
user2:{'film2', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
user3:{'film1', 'film3', 'film6', 'film2'}
user4:{'film4', 'film9', 'film3', 'film8', 'film1', 'film6'}
user5:{'film1', 'film7'}
user6:{'film4', 'film2', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
user7:{'film4', 'film2', 'film5', 'film9', 'film8', 'film1', 'film6'}
user8:{'film5', 'film9', 'film8'}
user9:{'film4', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
和您最相似的用户是: user2
Ta最喜欢看的电影是: {'film2', 'film5', 'film3', 'film7', 'film8', 'film1', 'film6'}
Ta看过的电影中您还没看过的有: {'film5', 'film6', 'film7', 'film8'}