今天,基于 AI 进行短视频创作,有望成为 AI 时代新的流量入口平台。

不过,短视频生成由于特殊的模态属性,其 tokens 消耗成本要远远高于常见的文本与图片创作。

比如,以某闭源模型的官方价格为例,生成每百万 tokens 的文本需要 0.8元,而生成一段 5 秒的 1080p 视频需要 3.67 元。视频生成的成本大约是文本的 100~1 000 倍。

因此,精细化的成本控制,将是 AI 短视频创作的头等大事。

在这一背景下,国内知名的短视频制作平台「切片快剪」,基于 PPIO 的 GPU Serverless 弹性算力,将其自研的 AI 多模态引擎实现亿级视频帧毫秒级分割,效能领跑行业。

# 01 

GPU 资源的资源利用挑战

切片快剪是一款短视频制作神器,在业内首创 AI 多模态分割引擎,可一键创作小说推文、漫画推文、短剧解说等多种内容视频。

切片快剪支持Android、iOS、Windows、MacOS等多种平台,生态兼容性强大。

随着用户规模的增加,切片快剪平台面临 GPU 资源管理复杂、成本高、利用率低等痛点。

这一痛点来自于用户的潮汐式流量。白天与夜晚,用户的活跃度大不相同。每天白天是用户的使用高峰期,而一到深夜和凌晨,用户骤降,高峰期的用户并发量可能是低谷时期的几十、上百倍。

为了保证用户体验,团队需要准备足够的算力资源来应对高峰期的需求。但一到低谷期,就会出现大量的算力资源闲置,这带来了巨大的沉没成本。

同时,管理庞大的算力集群需要专业的运维团队,无论是部署还是扩展资源都存在很高的技术要求。这都会导致公司运营成本的上升。

因此,寻找一个高可靠、弹性伸缩的算力服务商,就成为了切片快剪的核心需求。

# 02 

Severless GPU

AI 应用部署从未如此简单

PPIO 提供的 Severless GPU,完美解决了算力的弹性伸缩需求。

Serverless GPU 平台是一种基于无服务器架构(Serverless)的创新解决方案,它通过按需分配 GPU 资源的方式,彻底改变了传统计算资源的使用模式。

传统的 GPU 资源管理方式往往存在明显的弊端:用户需要预先购买或租赁固定的 GPU 设备,但这些设备可能在大部分时间处于闲置状态,导致资源浪费和成本增加。而当真正需要高性能计算时,又可能因为资源不足而影响工作效率。Serverless GPU 平台则通过动态分配机制,让用户只需为实际使用的资源付费,从而大幅降低了成本并提升了资源利用率。

PPIO 的 Serverless GPU 是专为 AI 推理场景设计的 GPU 弹性容器云产品。依托于丰富的分布式计算技术、算力网络调度经验和算法积累,PPIO 提供了弹性伸缩和负载均衡的按需算力,用户仅需指定容器镜像地址并根据业务场景稍作配置,即可快速部署一个 AI 推理服务。

在强大的 Serverless GPU 的弹性算力支持下,切片快剪通过 AI 多模态引擎达到了亿级视频帧毫秒级分割,实现了效能口碑双壁垒。

# 03 

关于PPIO

PPIO 是中国领先的独立分布式云计算服务商,由 PPTV 创始人、前蓝驰创投投资合伙人姚欣和前 PPTV 首席架构师王闻宇于 2018 年联合创立,致力于为人工智能、智能体、实时音视频处理、具身智能等新一代场景,提供极致⾼性价⽐、超弹性、低延迟的⼀站式智算、模型及边缘计算服务。 

根据 CIC (China lnsights Consultancy) 的资料,按2024年收入计,PPIO 是中国最大的独立边缘云公司,运营着中国最大的算力网络。按日均 tokens 消耗量计,在中国独立 AI 云公司中位列前二名。

现在用邀请码【LYYQD1】注册可得15元代金券。扫码加入 PPIO AI 开发者社群,可领取 20+篇精选 Agent 报告。

图片

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐