AI大模型：大数据旅游景点推荐系统机器学习算法协同过滤推荐算法数据分析可视化 django框架大数据毕业设计基于用户+基于物品✅

大数据旅游景点推荐系统机器学习算法协同过滤推荐算法数据分析可视化 django框架大数据毕业设计基于用户+基于物品✅

q_3456621138

626人浏览 · 2026-01-05 23:10:38

q_3456621138 · 2026-01-05 23:10:38 发布

博主介绍：✌全网粉丝10W+，前互联网大厂软件研发、集结硕博英豪成立软件开发工作室，专注于计算机相关专业项目实战6年之久，累计开发项目作品上万套。凭借丰富的经验与专业实力，已帮助成千上万的学生顺利毕业，选择我们，就是选择放心、选择安心毕业✌
> 🍅想要获取完整文章或者源码，或者代做，拉到文章底部即可与我联系了。🍅

点击查看作者主页，了解更多项目！

🍅感兴趣的可以先收藏起来，点赞、关注不迷路，大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助同学们顺利毕业。🍅

1、毕业设计：2026年计算机专业毕业设计选题汇总（建议收藏）✅

2、最全计算机专业毕业设计选题大全（建议收藏）✅

1、项目介绍

技术栈：
python 语言、django框架、MySQL数据库、协同过滤推荐算法（基于物品+基于用户）、Echarts可视化、HTML

摘要
随着流媒体时代的到来，旅游推荐系统随之具有重要的地位。时代在进步，科技在进步，互联网改变了世界，在互联网时代，各行各业的人们都在寻求增长点，人们的日常生活越来越离不开互联网。以旅游信息为例，线下大量的各种旅游信息基本只会出现在旅游会上，但是现如今，人们越来越重视时间成本，所以越来越多的年轻人在网上查找自己想要查找的旅游旅游信息。然而，在互联网信息和海量数据源混合的情况下，如何快速精确的找到自己想要的数据是一个值得探讨的问题。
本系统使用Python开发，运用协同过滤推荐算法，完成通过用户的行为向其推荐旅游的目的。后端主要使用Django框架，前端页面的开发选择了Bootstrap框架。利用MySQL数据库存储信息。本系统的前端用户模块主要包括注册、登录、旅游标签分类、旅游推荐、旅游列表、旅游排序等、后台管理模块主要包括用户管理、旅游旅游管理、用户权限管理等。推荐算法方面同时含有基于用户的协同过滤以及基于物品的协同过滤推荐。

关键词旅游推荐；协同过滤； Python；可视化

2、项目界面

（1）首页—旅游景点排序

在这里插入图片描述

（2）旅游景点详情页—点赞、收藏、评分、景点详情信息

在这里插入图片描述

（3）基于用户推荐、基于物品推荐

在这里插入图片描述

（4）景点评分与数量分析

在这里插入图片描述

（5）景点词云图分析

在这里插入图片描述

（6）旅游景点年份分析

在这里插入图片描述

（7）省份占比分析

在这里插入图片描述

（8）旅游景点分类

在这里插入图片描述

（9）个人中心----我的收藏、评论、评分

在这里插入图片描述

（10）后台数据管理

在这里插入图片描述

3、项目说明

随着流媒体时代的到来，旅游推荐系统随之具有重要的地位。时代在进步，科技在进步，互联网改变了世界，在互联网时代，各行各业的人们都在寻求增长点，人们的日常生活越来越离不开互联网。以旅游信息为例，线下大量的各种旅游信息基本只会出现在旅游会上，但是现如今，人们越来越重视时间成本，所以越来越多的年轻人在网上查找自己想要查找的旅游旅游信息。然而，在互联网信息和海量数据源混合的情况下，如何快速精确的找到自己想要的数据是一个值得探讨的问题。
本系统使用Python开发，运用协同过滤推荐算法，完成通过用户的行为向其推荐旅游的目的。后端主要使用Django框架，前端页面的开发选择了Bootstrap框架。利用MySQL数据库存储信息。本系统的前端用户模块主要包括注册、登录、旅游标签分类、旅游推荐、旅游列表、旅游排序等、后台管理模块主要包括用户管理、旅游旅游管理、用户权限管理等。推荐算法方面同时含有基于用户的协同过滤以及基于物品的协同过滤推荐。

关键词旅游推荐；协同过滤； Python；可视化

在这里插入图片描述

5.3基于用户的旅游推荐功能
该算法主要用相似统计的方法得到具有相似爱好或者兴趣的相邻用户。基于用户（User-Based）的协同过滤算法首先要根据用户历史行为信息，寻找与新用户相似的其他用户；同时，根据这些相似用户对其他项的评价信息预测当前新用户可能喜欢的项。给定用户评分数据矩阵 R，基于用户的协同过滤算法需要定义相似度函数 s：U×U→R，以计算用户之间的相似度，然后根据评分数据和相似矩阵计算推荐结果。
具体步骤如下：第一步，收集用户信息。收集可以代表用户兴趣的信息。一般的网站系统使用评分的方式或是给予评价，这种方式被称为“主动评分”。另外一种是“被动评分”，是根据用户的行为模式由系统代替用户完成评价，不需要用户直接打分或输入评价数据。电子商务网站在被动评分的数据获取上有其优势，用户购买的商品记录是相当有用的数据。第二步，最近邻搜索(Nearest neighbor search, NNS)。以用户为基础（User-based）的协同过滤的出发点是与用户兴趣爱好相同的另一组用户，就是计算两个用户的相似度。例如：查找 n 个和 A 有相似兴趣用户，把他们对 M 的评分作为 A 对 M 的评分预测。一般会根据数据的不同选择不同的算法，目前较多使用的相似度算法有 Pearson Correlation Coefficient（皮尔逊相关系数）、Cosine-based Similarity（余弦相似度）、Adjusted Cosine Similarity（调整后的余弦相似度）。

图 5.2-6 基于用户的旅游推荐

5.4基于物品的旅游推荐功能
该以项目为基础的协同过滤方法有一个基本的假设“能够引起用户兴趣的项目，必定与其之前评分高的项目相似”，通过计算项目之间的相似性来代替用户之间的相似性。
具体步骤如下：第一步，收集用户信息。同以用户为基础（User-based）
协同过滤。第二步，针对项目的最近邻搜索。先计算已评价项目和待预测项目的相似度，并以相似度作为权重，加权各已评价项目的分数，得到待预测项目的预测值。例如：要对项目 A 和项目 B 进行相似性计算，要先找出同时对 A 和 B 打过分的组合，对这些组合进行相似度计算。第三步，产生推荐结果。以项目为基础的协同过滤不用考虑用户间的差别，所以精度比较差。但是却不需要用户的历史数据，或是进行用户识别。对于项目来讲，它们之间的相似性要稳定很多，因此可以离线完成工作量最大的相似性计算步骤，从而降低了在线计算量，提高推荐效率，尤其是在用户多于项目的情形下尤为显著。
在协同过滤算法中，相似度的计算至关重要。只有计算了用户或者物品之间的相似度才能得出推荐列表.常用的相似度计算方法有以下几种：
（1）余弦相似度
在 n 维空间中，任意两个向量之间的夹角的余弦值大小即代表这两个向量的相似程度。余弦值的取值范围为[-1,1].假设 n 维空间中存在向量 i 和向量 j，式（2-1）为计算其余弦相似度的公式.

（2）欧式距离
欧式距离也称为欧几里得度量，是指在 n 维向量空间中，任意两个向量之间的自然长度.同样的，假设存在向量 M 和 N，则欧式距离表达公式如式（2-2）所示。

（3）皮尔逊(Pearson)相关系数
如果一个推荐算法使用的是皮尔森相关系数来计算相似度，那么该算法将会比使用余弦相似度公式计算相似度的算法的精确度更高。然而这是要建立在两个用户拥有较多共同评分项目的基础上，如果两个用户之间共同评分项目很少，使用皮尔森相关系数进行计算无法反映出真实的相似度.假设存在两个向量J 与K，这两个向量间的皮尔森相关系数计算公式如式（2-3）所示

4、核心代码


# -*-coding:utf-8-*-
import os

os.environ["DJANGO_SETTINGS_MODULE"] = "recommend.settings"
import django

django.setup()
from item.models import *
from math import sqrt, pow
import operator
from django.db.models import Subquery, Q, Count


# from django.shortcuts import render,render_to_response
class UserCf:

    # 获得初始化数据
    def __init__(self, all_user):
        self.all_user = all_user

    # 通过用户名获得列表，仅调试使用
    def getItems(self, username1, username2):
        return self.all_user[username1], self.all_user[username2]

    # 计算两个用户的皮尔逊相关系数
    def pearson(self, user1, user2):  # 数据格式为：旅游景点id，浏览此
        sum_xy = 0.0  # user1,user2 每项打分的成绩的累加
        n = 0  # 公共浏览次数
        sum_x = 0.0  # user1 的打分总和
        sum_y = 0.0  # user2 的打分总和
        sumX2 = 0.0  # user1每项打分平方的累加
        sumY2 = 0.0  # user2每项打分平方的累加
        for movie1, score1 in user1.items():
            if movie1 in user2.keys():  # 计算公共的浏览次数
                n += 1
                sum_xy += score1 * user2[movie1]
                sum_x += score1
                sum_y += user2[movie1]
                sumX2 += pow(score1, 2)
                sumY2 += pow(user2[movie1], 2)
        if n == 0:
            # print("p氏距离为0")
            return 0
        molecule = sum_xy - (sum_x * sum_y) / n  # 分子
        denominator = sqrt((sumX2 - pow(sum_x, 2) / n) * (sumY2 - pow(sum_y, 2) / n))  # 分母
        if denominator == 0:
            return 0
        r = molecule / denominator
        return r

    # 计算与当前用户的距离，获得最临近的用户
    def nearest_user(self, current_user, n=1):
        distances = {}
        # 用户，相似度
        # 遍历整个数据集
        for user, rate_set in self.all_user.items():
            # 非当前的用户
            if user != current_user:
                distance = self.pearson(self.all_user[current_user], self.all_user[user])
                # 计算两个用户的相似度
                distances[user] = distance
        closest_distance = sorted(
            distances.items(), key=operator.itemgetter(1), reverse=True
        )
        # 最相似的N个用户
        print("closest user:", closest_distance[:n])
        return closest_distance[:n]

    # 给用户推荐旅游景点
    def recommend(self, username, n=3):
        recommend = {}
        nearest_user = self.nearest_user(username, n)
        for user, score in dict(nearest_user).items():  # 最相近的n个用户
            for movies, scores in self.all_user[user].items():  # 推荐的用户的旅游景点列表
                if movies not in self.all_user[username].keys():  # 当前username没有看过
                    if movies not in recommend.keys():  # 添加到推荐列表中
                        recommend[movies] = scores*score
        # 对推荐的结果按照旅游景点
        # 浏览次数排序
        return sorted(recommend.items(), key=operator.itemgetter(1), reverse=True)


# 基于用户的推荐
def recommend_by_user_id(user_id):
    user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
    current_user = User.objects.get(id=user_id)
    # 如果当前用户没有打分 则看是否选择过标签，选过的话，就从标签中找
    # 没有的话，就按照浏览度推荐15个
    if current_user.rate_set.count() == 0:
        if len(user_prefer) != 0:
            movie_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
        else:
            movie_list = xiangmu.objects.order_by("-c9")[:15]
        return movie_list
    # 选取评分最多的10个用户
    users_rate = Rate.objects.values('user').annotate(mark_num=Count('user')).order_by('-mark_num')
    user_ids = [user_rate['user'] for user_rate in users_rate]
    user_ids.append(user_id)
    users = User.objects.filter(id__in=user_ids)#users 为评分最多的10个用户
    all_user = {}
    for user in users:
        rates = user.rate_set.all()#查出10名用户的数据
        rate = {}
        # 用户有给旅游景点打分 在rate和all_user中进行设置
        if rates:
            for i in rates:
                rate.setdefault(str(i.movie.id), i.mark)#填充旅游景点数据
            all_user.setdefault(user.username, rate)
        else:
            # 用户没有为旅游景点打过分，设为0
            all_user.setdefault(user.username, {})

    user_cf = UserCf(all_user=all_user)
    recommend_list = [each[0] for each in user_cf.recommend(current_user.username, 15)]
    movie_list = list(xiangmu.objects.filter(id__in=recommend_list).order_by("-c9")[:15])
    other_length = 15 - len(movie_list)
    if other_length > 0:
        fix_list = xiangmu.objects.filter(~Q(rate__user_id=user_id)).order_by('-collect')
        for fix in fix_list:
            if fix not in movie_list:
                movie_list.append(fix)
            if len(movie_list) >= 15:
                break
    return movie_list


# 计算相似度
def similarity(movie1_id, movie2_id):
    movie1_set = Rate.objects.filter(movie_id=movie1_id)
    # movie1的打分用户数
    movie1_sum = movie1_set.count()
    # movie_2的打分用户数
    movie2_sum = Rate.objects.filter(movie_id=movie2_id).count()
    # 两者的交集
    common = Rate.objects.filter(user_id__in=Subquery(movie1_set.values('user_id')), movie=movie2_id).values('user_id').count()
    # 没有人给当前旅游景点打分
    if movie1_sum == 0 or movie2_sum == 0:
        return 0
    similar_value = common / sqrt(movie1_sum * movie2_sum)#余弦计算相似度
    return similar_value


#基于物品
def recommend_by_item_id(user_id, k=15):
    # 前三的tag，用户评分前三的旅游景点
    user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
    user_prefer = list(user_prefer)[:3]
    print('user_prefer', user_prefer)
    current_user = User.objects.get(id=user_id)
    # 如果当前用户没有打分 则看是否选择过标签，选过的话，就从标签中找
    # 没有的话，就按照浏览度推荐15个
    if current_user.rate_set.count() == 0:
        if len(user_prefer) != 0:
            movie_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
        else:
            movie_list = xiangmu.objects.order_by("-c9")[:15]
        print('from here')
        return movie_list
    # most_tags = Tags.objects.annotate(tags_sum=Count('name')).order_by('-tags_sum').filter(movie__rate__user_id=user_id).order_by('-tags_sum')
    # 选用户最喜欢的标签中的旅游景点，用户没看过的30部，对这30部旅游景点，计算距离最近
    un_watched = xiangmu.objects.filter(~Q(rate__user_id=user_id), tags__in=user_prefer).order_by('?')[:30]  # 看过的旅游景点
    watched = Rate.objects.filter(user_id=user_id).values_list('movie_id', 'mark')
    distances = []
    names = []
    # 在未看过的旅游景点中找到
    for un_watched_movie in un_watched:
        for watched_movie in watched:
            if un_watched_movie not in names:
                names.append(un_watched_movie)
                distances.append((similarity(un_watched_movie.id, watched_movie[0]) * watched_movie[1], un_watched_movie))#加入相似的旅游景点
    distances.sort(key=lambda x: x[0], reverse=True)
    print('this is distances', distances[:15])
    recommend_list = []
    for mark, movie in distances:
        if len(recommend_list) >= k:
            break
        if movie not in recommend_list:
            recommend_list.append(movie)
    # print('this is recommend list', recommend_list)
    # 如果得不到有效数量的推荐 按照未看过的旅游景点中的热度进行填充
    print('recommend list', recommend_list)
    return recommend_list


if __name__ == '__main__':
    # similarity(2003, 2008)
    print(recommend_by_item_id(1799))