Story Universe - 故事宇宙AI创作平台(Claude Code + GLM-4.6无脑入)（附仓库链接）

摘要 "故事宇宙AI创作平台"项目源自作者对创作的热爱，旨在通过AI技术降低小说和漫画创作门槛。项目结合智谱GLM-4.6大模型和Claude Code开发工具，构建了一个全栈创作平台。GLM-4.6提供200K上下文支持、多语言处理和图像理解能力，而Claude Code则负责高效的代码生成。技术架构采用Next.js前端和Python FastAPI后端，集成多种AI模型（

xyx635488811

2209人浏览 · 2025-11-06 17:42:58

xyx635488811 · 2025-11-06 17:42:58 发布

story universe

📖 项目背景

这个项目的开始并没有什么高大上的原因，不是因为什么梦想，也不是因为什么市面上没有这种工具。
开发的源头永远只有一个理由，那就是热爱！！你可以是三分钟的热度，但是这样的三分钟多了，固吾虽愚，卒有所获。
最初有这个念想是因为我曾经也写过一篇小说，并在番茄上面发表了，只有亲自去尝试才会发现，这其实很难，我也试过量子探险这种辅助小说的工具，但是终究吸引我们的永远都是真情实感，小说或者漫画更多的是提供我们一个想象的平台，一个放松的平台。
直到番茄出了一个AI生图的插件，我们可以在阅读的时候，让冰冷无声的话语转成生动可视的画面，我想这种改变是巨大的，他能够贴近我们的想象，让夜晚疲惫的灵魂有个逃离的出口，它编织了一个我们愿意稍微休憩的世界。
在这里插入图片描述
后来，我受到了黄啊码（博主）一个叫做码上漫画的启发，并在了解到智谱GLM-4.6的强大能力后，决定结合Claude Code的开发效率，打造一个故事宇宙AI创作平台。这个平台不仅要解决我自己的执念，更要让每个创作者都能享受AI赋能的创作体验。
或许它并不完美，也并不能让你眼前一亮，但是每一次尝试都是一种体验，那么就跟着我一起体验这场可能有点久的“不完美”吧！

🎓 相关名词

一、什么是GLM-4.6?
GLM-4.6 是智谱最新的旗舰模型，总参数量 355B，激活参数 32B。GLM-4.6 核心能力上均完成了对 GLM-4.5 的超越，它支持200K的上下文，适应更长的代码和智能体任务。有128K的最大输出Tokens，推理能力提升，并支持在推理过程中调用工具。支持多语言的处理任务以及更偏向人类喜好的文风。其中的pro版本支持图像理解和联网搜索的MCP调用，在智能体框架的表现更优。
在这里插入图片描述
这个是可以参考的官方介绍文档：https://docs.bigmodel.cn/cn/guide/models/text/glm-4.6
二、什么是Claude Code?
Claude Code 是由 Anthropic 开发的 AI 编程助手，旨在通过自然语言交互帮助开发者更高效地编写代码。它是一个基于终端的工具，支持文件管理、代码分析和多模型支持等功能。Claude Code 还能够理解项目的整体结构，并与开发工作流程完全集成。
在这里插入图片描述
这个是可以参考的官方介绍文档：https://docs.claude.com/zh-CN/docs/claude-code/overview
本人推荐的学习网址：https://www.yuque.com/xiaoyou-nwu1w/ooi105 ，里面有很详细的实战指导。
当然这些只是可以给大家一个初步的了解和学习建议，这篇文章大家只需要无脑跟进即可。
------------------------------------------------------------>（脑子寄存处）<-----------------------------------------------------------------------------------------

🎯 开始前的提问（Q&A）(心急的朋友可以直接跳到实战部分）

问题1：如何快速搭建全栈项目？

传统开发需要：

手动创建前后端项目结构
配置各种依赖和环境
编写大量重复的CRUD代码
调试API接口和前端交互

这些基础工作往往耗费数天时间。

问题2：如何高效调用多个AI模型？

本项目需要集成：

GLM-4.6（文本大模型）
GLM-4.5V（图片/视频理解）
CogView-4（图像生成）
CogVideoX-3（视频生成）
search-pro（联网搜索）

（感兴趣可以接入Content7、DeepWiki MCP 增强效果）
每个模型的API调用方式、参数配置都不同，容易出错。

问题3：如何设计高质量的Prompt？

AI生成质量高度依赖Prompt设计：

小说大纲需要结构化输出
角色生成需要多维度信息
分镜脚本需要专业术语

缺乏经验的开发者很难写出高质量Prompt。

💡 解决方案：Claude Code + GLM-4.6 双剑合璧

核心思路

我采用了"AI驱动开发"的模式：

Claude Code 负责代码生成和项目搭建
GLM-4.6 负责内容创作和智能分析
两者通过精心设计的Prompt协同工作

技术架构

┌─────────────────────────────────────────┐
│          前端 (Next.js 14)              │
│  小说 | 角色 | 剧本 | 分镜 | 搜索        │
└──────────────┬──────────────────────────┘
               │ HTTP API
┌──────────────┴──────────────────────────┐
│        后端 (Python FastAPI)            │
│  ┌──────────────────────────────────┐   │
│  │   智谱 API 服务层                 │   │
│  │  - GLM-4.6 (文本生成)             │   │
│  │  - GLM-4.5V (视觉理解)            │   │
│  │  - CogView-4 (图像生成)		      │   │
│  │  - CogVideoX-3 (视频生成)	      │   │
│  │  - search-pro (联网搜索)          │   │
│  └──────────────────────────────────┘   │
└─────────────────────────────────────────┘

🚀 实战：0-1保姆级教程（无脑跟进）(核心）

Step 1：环境搭建（参考链接：https://www.yuque.com/xiaoyou-nwu1w/ooi105/ezbqz1el31ekgt3k）

1.1 打开 GLM-4.6 套餐（https://www.bigmodel.cn/glm-coding?ic=BAI3RQOQP7）页面，注册并购买套餐。

在这里插入图片描述
新人注册是会有送的资源包的，点击个人用户，点击财务：

1.2 前往 API Key 管理页面，新建一个 API Key 并保存备用。

在这里插入图片描述
注意复制这里的API key，后面有大用。

1.3 下载 Node.js和 Git

Node.js：https://nodejs.org/en/download
在这里插入图片描述

Git：https://git-scm.com/install/windows
在这里插入图片描述
接下来无脑点击next就可以了。

1.4 安装Claude Code

在终端（windows+r）执行：

npm install -g @anthropic-ai/claude-code

验证安装结果：

# 如果能正常返回版本号，则代表安装无误
claude --version

终端运行（Windows+r），输入CMD,输入claude
在这里插入图片描述
会发现以上错误，我们只需要打开主文件夹，搜索claude.json文件,在最后添加（ “hasCompletedOnboarding”: true），再次运行即可。

{
  "installMethod": "unknown",
  "autoUpdates": true,
  "firstStartTime": "2025-07-14T06:11:03.877Z",
  "userID": "f5afdd05117c901a4a5a0761d08230bfcbb76f9fd380ff7bc144cc12c52e55aa",
  "projects": {
    "/home/nassi": {
      "allowedTools": [],
      "history": [],
      "mcpContextUris": [],
      "mcpServers": {},
      "enabledMcpjsonServers": [],
      "disabledMcpjsonServers": [],
      "hasTrustDialogAccepted": false,
      "projectOnboardingSeenCount": 0,
      "hasClaudeMdExternalIncludesApproved": false,
      "hasClaudeMdExternalIncludesWarningShown": false
    }
  },  //这里要加逗号，注意英文的
  "hasCompletedOnboarding": true,  // 新增字段放在这里，注意位置
}

1.5 配置 Claude Code 使用 GLM-4.6

接下来我们要给Claude Code换一个大脑，点击我的电脑，找到C盘，在用户位置，找到个人用户，找到.claude文件夹，进去找到settings.json文件，填入以下内容。

{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "your Zhipu API key",
    "ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/anthropic",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.6",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.6"
  }
}

注意这里的 "your Zhipu API key"要换成我之间说要复制的那个。
在这里插入图片描述

到这，请你夸一夸你自己，已经完成任务的一大半了。

1.6 配置 MCP（pro用户可看，普通可以直接调用API,有新人注册的额度）

终端运行（Windows+r），输入CMD,分别复制以下几条命令配置MCP，注意替换key。
视频理解：

claude mcp add -s user zai-mcp-server --env Z_AI_API_KEY=your_api_key -- npx -y @z_ai/mcp-server

联网搜索：

claude mcp add -s user -t http web-search-prime https://open.bigmodel.cn/api/mcp/web_search_prime/mcp --header "Authorization: Bearer your_api_key"

在这里插入图片描述
Context7（文本增强，可选，这个KEY需要去 Context7 官网自己申请下，免费）：

claude mcp add -s user --transport http context7 https://mcp.context7.com/mcp --header "CONTEXT7_API_KEY: your_api_key"

DeepWiki：

claude mcp add -s user -t http deepwiki https://mcp.deepwiki.com/mcp

在这里插入图片描述

输入claude,启动claude，输入/mcp,观察下是否连接成功。
在这里插入图片描述
到这环境就配置完成了，可以愉快的开始项目了。

Step 2：开发与效果展示

2.1 项目框架Prompt（需要修改下key）

我要创建"故事宇宙 AI 创作平台"参加智谱 GLM-4.6 编程大赛。

【核心功能】
1. 小说创作助手
   - 大纲生成、章节续写、风格调整
   - 使用 GLM-4.6 

2. 角色生成器
   - 角色信息生成、关系网、角色立绘
   - 使用 GLM-4.6 + CogView-4

3. 剧本转换
   - 小说转影视剧本
   - 使用 GLM-4.6

4. 漫画分镜助手
   - 文字转分镜、参考图分析
   - 使用 GLM-4.6 + GLM-4.5V + CogView-4 + CogVideoX-3

5. 视频分镜学习
   - 视频分析、镜头语言学习
   - 使用 GLM-4.5V（视频理解）

6. 素材搜索库
   - 背景资料、热点追踪
   - 使用后端 search-pro API

【技术栈】
- 前端：Next.js 14 + TypeScript + TailwindCSS + shadcn/ui
- 后端：Python FastAPI + 智谱 Python SDK (zhipuai)
- 数据库：SQLite

【智谱 API 配置】
API Key: your_api_key_here
API Base: https://open.bigmodel.cn/api/paas/v4/


【项目结构】
/story-universe-platform
  /frontend
    /app
      /novel（小说创作）
      /character（角色生成）
      /script（剧本转换）
      /storyboard（分镜助手）
      /search（素材搜索）
    /components
      /ui（shadcn/ui 组件）
    /lib
      /api.ts（API 调用）
  /backend
    /api
      /routes（路由）
    /services
      /zhipu_service.py（智谱 API 封装）
    /models（数据模型）

【请创建】
1. 完整项目结构
2. 依赖配置（package.json、requirements.txt）
3. 智谱 API 调用封装（GLM-4.6、GLM-4.5V、CogView-4、search-pro）
4. 基础 UI 框架（紫色系配色 #6366f1）
5. 环境变量配置（.env.example）
6. README.md

开始创建项目！

在这里插入图片描述
然后不语，只一味地点击yes。a few moments later…

Claude Code会为你生成：

✅ 完整的前后端项目结构
✅ package.json 和 requirements.txt
✅ 智谱API封装服务
✅ 基础UI组件库
✅ 环境变量配置模板

在这里插入图片描述

在这里插入图片描述
然后有什么不懂的直接问claude即可，最主要的就是耐心和检错，我们的身份更像是测试工程师，发现生成的问题。
至于优化，就要结合前端和后端响应，打开浏览器的console来不断解决升级（按F12,选择控制台或者右上角浏览器三个点，点开选择工具里的开发者工具）。

2.2 小说创作助手

2.2.1 设计Prompt模板

这是整个项目的核心。我为GLM-4.6设计了结构化的Prompt：

# 小说大纲生成Prompt
OUTLINE_PROMPT = """你是资深小说策划师。

题材：{genre}
风格：{style}
关键词：{keywords}
目标长度：{target_length}

请生成详细大纲，包含：
1. 故事梗概（200字）
2. 主要人物设定（3-5个角色）
3. 世界观设定（背景、规则）
4. 故事结构（起承转合）
5. 章节大纲（10-15章）
6. 主要冲突和转折点
7. 主题思想和象征元素

要求：
- 逻辑严谨，情节吸引人
- 人物性格鲜明，有成长空间
- 冲突设置合理，高潮迭起
- 以JSON格式输出，便于解析
"""

2.2.2 后端API实现

# backend/api/routes/novel.py
from fastapi import APIRouter
from services.zhipu_service import zhipu_service

router = APIRouter()

@router.post("/outline")
async def generate_outline(request: OutlineRequest):
    """生成小说大纲"""
    prompt = OUTLINE_PROMPT.format(
        genre=request.genre,
        style=request.style,
        keywords=", ".join(request.keywords),
        target_length=request.target_length
    )
    
    # 调用GLM-4.6
    response = await zhipu_service.chat_completion(
        model="glm-4.6",
        messages=[
            {"role": "system", "content": prompt},
            {"role": "user", "content": "请生成大纲"}
        ],
        temperature=0.9,
        max_tokens=4000
    )
    
    return {"success": True, "outline": response}

2.2.3 前端界面实现

使用shadcn/ui组件快速搭建：

// frontend/app/novel/page.tsx
export default function NovelPage() {
  const [outline, setOutline] = useState(null)
  const [loading, setLoading] = useState(false)

  const generateOutline = async (data) => {
    setLoading(true)
    const response = await storyApi.generateOutline(data)
    setOutline(response.outline)
    setLoading(false)
  }

  return (
    <div className="container mx-auto p-6">
      <Tabs defaultValue="outline">
        <TabsList>
          <TabsTrigger value="outline">大纲生成</TabsTrigger>
          <TabsTrigger value="continue">章节续写</TabsTrigger>
          <TabsTrigger value="rewrite">风格调整</TabsTrigger>
        </TabsList>
        
        <TabsContent value="outline">
          <OutlineForm onSubmit={generateOutline} />
          {loading && <LoadingSpinner />}
          {outline && <OutlineDisplay data={outline} />}
        </TabsContent>
      </Tabs>
    </div>
  )
}

效果展示：
可以看到后端的响应正常。

大纲生成：
在这里插入图片描述

在这里插入图片描述

章节续写：
在这里插入图片描述

风格调整：

2.3 角色生成器

2.3.1 角色生成Prompt

CHARACTER_PROMPT = """你是角色设计专家。

角色类型：{character_type}
故事背景：{background}
性格特征：{personality}

生成完整角色设定（JSON格式）：
{{
  "basic_info": {{
    "name": "角色姓名",
    "age": "年龄",
    "gender": "性别",
    "occupation": "职业"
  }},
  "appearance": {{
    "height": "身高",
    "build": "体型",
    "hair": "发型发色",
    "eyes": "眼睛颜色",
    "clothing_style": "服装风格",
    "special_features": "特殊特征"
  }},
  "personality": {{
    "core_traits": ["核心性格1", "核心性格2"],
    "strengths": ["优点1", "优点2"],
    "weaknesses": ["缺点1", "缺点2"]
  }},
  "background": {{
    "childhood": "童年经历",
    "education": "教育背景",
    "key_events": ["重要事件1", "重要事件2"]
  }},
  "relationships": {{
    "family": "家庭关系",
    "friends": "朋友关系",
    "enemies": "敌对关系"
  }},
  "goals": {{
    "short_term": "短期目标",
    "long_term": "长期目标",
    "motivation": "内在动机"
  }}
}}

要求：角色有深度，有成长空间，符合故事背景。
"""

2.3.2 集成CogView-4生成角色立绘

@router.post("/image")
async def generate_character_image(request: CharacterImageRequest):
    """生成角色立绘"""
    # 构建图像生成Prompt
    prompt = f"{request.appearance}, {request.style}风格, 高质量, 细节丰富"
    
    # 调用CogView-4
    image_url = await zhipu_service.generate_image(
        prompt=prompt,
        size="1024x1024"
    )
    
    return {"success": True, "image_url": image_url}

效果展示：
在这里插入图片描述

GLM-4.6生成了包含8个维度的完整角色设定，CogView-4根据外貌描述生成了精美的角色立绘。

2.4 剧本转换

效果展示：
在这里插入图片描述
将文本转换为标准的剧本，方便下一分镜助手功能的实现。

2.5 分镜助手

这是最有挑战的功能，需要集成GLM-4.5V进行图片/视频分析。

2.5.1 图片分析功能

@router.post("/analyze")
async def analyze_reference(request: ReferenceAnalysisRequest):
    """分析参考图片"""
    # 将本地图片转换为base64
    if request.image_url.startswith("http://localhost"):
        file_path = request.image_url.replace("http://localhost:8000/", "")
        with open(file_path, "rb") as f:
            image_data = base64.b64encode(f.read()).decode('utf-8')
            image_url = f"data:image/jpeg;base64,{image_data}"
    else:
        image_url = request.image_url
    
    # 调用GLM-4.5V分析
    analysis = await zhipu_service.analyze_image(
        image_url=image_url,
        prompt=f"请详细分析这张图片的{request.analysis_type}，包括构图、光影、色彩等要素"
    )
    
    return {"success": True, "analysis": {"content": analysis}}

2.5.2 视频分析功能

@router.post("/analyze-video")
async def analyze_video(request: VideoAnalysisRequest):
    """分析视频分镜"""
    # 将本地视频转换为base64
    if request.video_url.startswith("http://localhost"):
        file_path = request.video_url.replace("http://localhost:8000/", "")
        with open(file_path, "rb") as f:
            video_data = base64.b64encode(f.read()).decode('utf-8')
            video_url = f"data:video/mp4;base64,{video_data}"
    else:
        video_url = request.video_url
    
    # 调用GLM-4.5V分析
    analysis = await zhipu_service.analyze_video(
        video_url=video_url,
        prompt=f"请分析这个视频的{request.analysis_focus}，包括镜头运用、剪辑节奏等"
    )
    
    return {"success": True, "analysis": {"content": analysis}}

效果展示：
文字转分镜：
在这里插入图片描述

分镜展示：

后端响应：

参考图分析：

视频分析：
视频分析使用的是智谱AI的GLM-4.5V模型，它会将视频转换为base64后分析，不依赖浏览器播放。如果想看到完整的预览，使用标准H.264编码的MP4文件或使用在线视频转换工具重新编码视频即可。
在这里插入图片描述

可以看它的生图、生视频效果都不错，尤其是识图、识别视频的功能很完整，我上传的是一个学术的图片和一个校园演唱的视频。
分析的视频和图片例子：
title-DRL

校园演唱

2.6 素材搜索器

效果展示：
背景资料搜索：
在这里插入图片描述
热点追踪：

灵感推荐：

2.7 UI优化与体验提升

2.7.1 紫色主题设计

/* globals.css */
:root {
  --primary: #6366f1;
  --primary-foreground: #ffffff;
  --gradient-start: #8b5cf6;
  --gradient-end: #6366f1;
}

.gradient-bg {
  background: linear-gradient(135deg, var(--gradient-start), var(--gradient-end));
}

2.7.2 响应式布局

使用Tailwind CSS的响应式工具类：

<div className="grid grid-cols-1 md:grid-cols-2 lg:grid-cols-3 gap-6">
  {/* 自适应网格布局 */}
</div>

2.7.3 加载动画

export function LoadingSpinner({ size = "md" }) {
  return (
    <div className="flex items-center justify-center">
      <div className="animate-spin rounded-full border-4 border-primary border-t-transparent h-12 w-12" />
      <p className="ml-4 text-gray-600">AI正在创作中...</p>
    </div>
  )
}

🎉 最终效果

功能完成度

模块	功能	使用模型	状态
小说创作	大纲生成、章节续写、风格调整	GLM-4.6	✅ 完成
角色生成	角色设定、立绘生成	GLM-4.6 + CogView-4	✅ 完成
剧本转换	小说转剧本	GLM-4.6	✅ 完成
分镜助手	文字转分镜、图片/视频分析	GLM-4.6 + GLM-4.5V+CogVideoX-3+CogView-4	✅ 完成
素材搜索	背景资料、热点追踪	search-pro	✅ 完成

💎 总结

项目开发方面：我想谈下心得，就是首先需要有个结构化的提示词，需要明确定位、上下文、输出格式和质量要求；其次就是用claude协同开发的时候，你需要一次性说清楚需求，提供技术栈约束，分步骤实现；再就是多模型组合，也可以参考我用的这些。

错误检查和纠错：我反而觉得这块是最主要的，你可以打开浏览器的console观察响应和错误，以及打开后端、前端终端观察回复，将报错信息输给claude。更多遇到的可能有api超时、图片格式问题这些只要耐心观察前后端响应和控制台，我们是有能力也有信心去解决这些问题的，奥利给。

未来的话，打算支持导出多种格式（PDF、EPUB、Word），支持多人协作创作，添加AI配音功能，以及移动端的开发。

最后，感谢能够读到这里的你，作者也想说说自己的心里话，在ai赋能的今天，平时多留意生活中软硬件的技术逻辑，说不定某天就能在某个场景中“复用”；哪怕不是计算机专业，也可以大胆借助 LLM 大模型实现想法 —— 只是遇到 AI 无法感知的 bug 时，要耐心拆解问题、精准反馈，才能实现快速迭代。当然，有些人类经验需要时间积累，但只要享受 AI 创作的过程，总会有收获。也希望这个小项目能够给你带来启发。
GitHub仓库：https://github.com/yixiuxu/Story-Universe-Platform
已上传github，后续会不断更新维护。

#GLM我的编程搭子#GLM-4.6#娱乐#人工智能#Claude#前端框架#后端

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

一步步教会你使用YOLO - 1、安装

2048 AI社区

传统企业怎么在AI时代抢到被选择机会这几步真的能落地！

举个例子，客户问AI“有没有靠谱的国内牛羊肉供应链”，AI检索全网，你的知识库里面有几十篇你做过的餐饮客户案例，有你总结的不同餐饮场景的供应链解决方案，AI一对比，你的内容最匹配，自然就把你推荐给客户了。就拿我自己来说，我不管在哪发内容，都是讲AI对传统企业的影响，都是讲实操方法，从来不会今天讲八卦明天讲鸡汤，时间长了，不管是用户还是AI，都知道找「AI企业被选择」的内容找我就对了。客户常问的问题