课程连接:AI实战营第一课

       由于项目需求,主要为目标检测领域的应用,所以接触过几次MMDetection,2023年有机会参加一下实战营活动,可以扩展一下自己的AI经历,例如分割、人体位姿估计等任务。

        2025年OpenMMLab算法库更新越来越少了,这一系列的笔记算是过去的记录吧,万一后面又用到了呢。。。

OpenMMLab概述:基于 Pytorch 框架,其低层视觉库是MMCV和MMEngine,适用于学术研究和工业应用,项目开源,使用方便。

  1. 部分算法库介绍:

    1. MMDetection:支持目标检测、实例分割、全景分割任务,主要为2D目标检测,具有训练、测试、推理等工具。

    2. MMYOLO:主要针对YOLO目标检测任务,与MMdetection类似,或者说是detection的一个分支。

    3. MMOCR:文本检测(文本区域画出)、文本识别(文字内容识别)、关键信息提取(对证件等结构化信息进行内容提取)

    4. MMDetection3D:3D目标检测,主要应用领域:无人驾驶

    5. MMRotate:旋转目标检测

    6. MMSegmentation:图像分割,特别是语义分割(给每一个像素进行分类)

    7. MMPreTrain:前身MMClassification, 图像分类、预训练和多模态的算法库

      可完成的任务:图像分类、图像描述(给图片,生成文本信息)、视觉问答(根据图片回答问题(文本),多模态)、视觉定位(指定什么,框出什么)、检索
    8. MMPose:姿态估计(关键点检测),应用场景:体感游戏?

    9. MMHuman3D:3维人体姿态估计,应用场景:动捕、VR

    10. MMAction2:视频动作识别算法库,动作识别、时序检测、时空检测,应用场景:手语翻译

    11. MMagic:生成模型

    12. MMDeploy:模型部署,主要应对不同环境导致模型无法部署的问题。

    13. MMTracking:目标跟踪

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐