OpenMMLab AI实战一——概述

枫叶随樱花

377人浏览 · 2025-09-07 14:51:19

枫叶随樱花 · 2025-09-07 14:51:19 发布

课程连接：AI实战营第一课

由于项目需求，主要为目标检测领域的应用，所以接触过几次MMDetection，2023年有机会参加一下实战营活动，可以扩展一下自己的AI经历，例如分割、人体位姿估计等任务。

2025年OpenMMLab算法库更新越来越少了，这一系列的笔记算是过去的记录吧，万一后面又用到了呢。。。

OpenMMLab概述：基于 Pytorch 框架，其低层视觉库是MMCV和MMEngine，适用于学术研究和工业应用，项目开源，使用方便。

部分算法库介绍：
1. MMDetection：支持目标检测、实例分割、全景分割任务，主要为2D目标检测，具有训练、测试、推理等工具。
2. MMYOLO：主要针对YOLO目标检测任务，与MMdetection类似，或者说是detection的一个分支。
3. MMOCR：文本检测（文本区域画出）、文本识别（文字内容识别）、关键信息提取（对证件等结构化信息进行内容提取）
4. MMDetection3D：3D目标检测，主要应用领域：无人驾驶
5. MMRotate：旋转目标检测
6. MMSegmentation：图像分割，特别是语义分割（给每一个像素进行分类）
7. MMPreTrain：前身MMClassification，图像分类、预训练和多模态的算法库
  可完成的任务：图像分类、图像描述（给图片，生成文本信息）、视觉问答（根据图片回答问题（文本），多模态）、视觉定位（指定什么，框出什么）、检索
8. MMPose：姿态估计（关键点检测），应用场景：体感游戏？
9. MMHuman3D：3维人体姿态估计，应用场景：动捕、VR
10. MMAction2：视频动作识别算法库，动作识别、时序检测、时空检测，应用场景：手语翻译
11. MMagic：生成模型
12. MMDeploy：模型部署，主要应对不同环境导致模型无法部署的问题。
13. MMTracking：目标跟踪

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

AI时代是产品经理的黄金时代，0经验怎么转行AI产品经理拿到高薪offer？

AI风口不止在AI，更体现在如何将AI技术应用在产品中，发挥其真正的价值。在这个赛道产品经理具备天然的优势。

cover

Cursor 不香了？替代与组合实践指南（Windsurf、Trae、Copilot、MCP）

cover

【必看】大模型新技能：上下文工程超越提示词，构建更智能AI系统，建议收藏！！

所有评论(0)

查看更多评论

枫叶随樱花

@weixin_46810530

已为社区贡献3条内容