• 💂 个人网站: IT知识小屋
  • 🤟 版权: 本文由【IT学习日记】原创、在CSDN首发、需要转载请联系博主
  • 💬 如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦

简介

本项目是一款依托于JAVA实现的通用人工智能解决方案,涵盖了模型训练、推理到Web/桌面应用的一整套AI功能。支持产品级OCR文字识别(可自定义模板)、图像搜索、人脸检索、智能抠图、照片上色、图像增强、机器翻译、RAG搜索以及大模型接入等,可开箱即用。

系统采用主流技术栈:SpringBoot + Vue搭建,后端使用SpringBoot提供API服务,前端基于Vue实现可视化管理,支持模块化部署和二次开发。项目代码完全开源,模块之间高度解耦,用户可按需引入,灵活扩展,特别适合需要快速集成 AI 功能的企业与个人开发者。


开发环境

CPU

Windows x64, Linux x64, macOS x64

GPU (CUDA)

Windows x64, Linux x64

模型下载:https://pan.baidu.com/s/16933J3dX16xnjbYaay-4og?pwd=cwxk


功能模块

1、AI训练平台【模型定制】

  • 项目位置:/2_training_platform

  • 使用人群:面向java程序员,满足图像识别分类定制化需求

  • 功能清单:支持图像分类模型训练、支持图像1:1

数据上传:

超参数配置:

训练可视化:

2、AI Web应用

 - 项目位置:/4_web_app

 - 技术栈:前端VUE,后端Springboot

 - 使用方式:可直接部署使用,使用UI或者调用API集成到现有的系统中

 - 功能清单:图像生成、人脸搜索、以图搜图、以文搜图、一键抠图、文本搜索、图像生成

OCR:自定义模版识别(项目位置:/4_web_app/iocr)

  • 参照锚点设置

  • 内容识别区设置

以图搜图

 - 项目位置:/4_web_app/image_search,一共提供了三个不同的版本
 
 - 无向量引擎的版本,适合100万图片以下:mini_image_search

 - 向量引擎的版本,无管理系统的精简版:simple_image_search

 - 向量引擎的版本,完整的产品级应用:image_search
  • 图片上传:支持服务器端文件夹上传(大量图片使用,如千万张图片入库)、提取人脸特征方式、支持客户端文件夹上传

  • 图像搜索

跨模态:以文搜图,以图搜图


 - 项目位置:/4_web_app/image_text_search,提供了2个不同的版本

 - 无向量引擎的版本,适合100万图片以下:mini_image_text_search

 - 向量引擎的版本,适合100万图片以上:image_text_search
  • 图片上传:提取特征

  • 以文搜图:输入文本如:雪地上两只狗

  • 以图搜图

人脸搜索

 - 项目位置:/4_web_app/face_search
  • 上传图片:点击提取人脸特征按钮

  • 人脸搜索

一键抠图

 - 项目位置:/4_web_app/image_seg,提供了2个不同的版本
 
 - 一键抠图完整版,包含:框选一键抠图,通用一键抠图,人体一键抠图,动漫一键抠图:image_seg

 - 框选一键抠图:image_seg_sam2
  • 框选一键抠图

  • 框选一键抠图

文本搜索

 - 项目位置:/4_web_app/text_search,提供了2个不同的版本
 
 - 随时对数据进行插入、删除、搜索、更新等操作,结合大模型实现RAG功能,根据需要替换其它的特征提取模型:1_sdks\2_nlp_sdks\embedding

 - 无向量引擎的版本,适合100万条数据以下:simple_text_search

 - 向量引擎的版本,适合100万条数据以上:text_search
  • 上传数据:点击提取特征按钮

  • 文本搜索

图像生成

 - 项目位置:/4_web_app/aigc_image_gen 

 - 图像生成模型链接: https://pan.baidu.com/s/1znJi092mth3z68Oq_j2lsA?pwd=dmra 
 
 - 预处理模型链接: https://pan.baidu.com/s/1h75UaEqg_paias8Z1pEjOQ?pwd=yqek

Canny 辅助生成:Canny边缘检测预处理器,可很好识别出图像内各对象的边缘轮廓,常用于生成线稿

线稿提取辅助生成:Lineart边缘检测预处理器,可很好识别出图像内各对象的边缘轮廓,用于生成线稿

3、AI能力平台【开箱即用】

 - 项目位置:/3_api_platform

 - 技术栈:前端VUE,后端Springboot

 - 应用:可以直接部署使用,使用UI或者调用API集成到现有的系统中

 - 支持的能力清单:OCR文字识别、机器翻译、语音识别、一键高清、 一键抠图、黑白照片上色、图像生成
 
 - 模型下载:https://pan.baidu.com/s/1RIKaZJXMPbGXnB2sKtWsgQ?pwd=1uuf
  • OCR文字识别:自由文本识别,支持旋转、倾斜的图片

  • 语音识别:英文语音识别、文语音识别

  • 机器翻译:支持202种语言互相翻译

  • 图像增强:图片一键高清,提升图片4倍分辨率

  • 人体一键抠图


开源地址&使用手册

点击下方的【IT学习日记】回复【资源】领取!

如果这篇文章对您有帮助,请一定帮我点个 “关注”“点赞”,这对我非常重要。我将会继续推荐更多优质项目和新闻。

写在最后

1000+优质开源项目更新进度:286/1000。如需更多类型优质项目推荐,请在文章后留言。

在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐