OpenMMLab AI实战一——概述
·
课程连接:AI实战营第一课
由于项目需求,主要为目标检测领域的应用,所以接触过几次MMDetection,2023年有机会参加一下实战营活动,可以扩展一下自己的AI经历,例如分割、人体位姿估计等任务。
2025年OpenMMLab算法库更新越来越少了,这一系列的笔记算是过去的记录吧,万一后面又用到了呢。。。
OpenMMLab概述:基于 Pytorch 框架,其低层视觉库是MMCV和MMEngine,适用于学术研究和工业应用,项目开源,使用方便。
-
部分算法库介绍:
-
MMDetection:支持目标检测、实例分割、全景分割任务,主要为2D目标检测,具有训练、测试、推理等工具。
-
MMYOLO:主要针对YOLO目标检测任务,与MMdetection类似,或者说是detection的一个分支。
-
MMOCR:文本检测(文本区域画出)、文本识别(文字内容识别)、关键信息提取(对证件等结构化信息进行内容提取)
-
MMDetection3D:3D目标检测,主要应用领域:无人驾驶
-
MMRotate:旋转目标检测
-
MMSegmentation:图像分割,特别是语义分割(给每一个像素进行分类)
-
MMPreTrain:前身MMClassification, 图像分类、预训练和多模态的算法库
可完成的任务:图像分类、图像描述(给图片,生成文本信息)、视觉问答(根据图片回答问题(文本),多模态)、视觉定位(指定什么,框出什么)、检索 -
MMPose:姿态估计(关键点检测),应用场景:体感游戏?
-
MMHuman3D:3维人体姿态估计,应用场景:动捕、VR
-
MMAction2:视频动作识别算法库,动作识别、时序检测、时空检测,应用场景:手语翻译
-
MMagic:生成模型
-
MMDeploy:模型部署,主要应对不同环境导致模型无法部署的问题。
-
MMTracking:目标跟踪
-
更多推荐
所有评论(0)