别在自己造轮子了!推荐一款功能炸裂的开源人工智能解决方案,内置产品级IOC、以图搜图,人像搜索
本项目是一款依托于JAVA实现的通用人工智能解决方案,涵盖了模型训练、推理到Web/桌面应用的一整套AI功能。支持产品级OCR文字识别(可自定义模板)、图像搜索、人脸检索、智能抠图、照片上色、图像增强、机器翻译、RAG搜索以及大模型接入等,可开箱即用。系统采用主流技术栈:SpringBoot + Vue搭建,后端使用SpringBoot提供API服务,前端基于Vue实现可视化管理,支持模块化部署和
- 💂 个人网站: IT知识小屋
- 🤟 版权: 本文由【IT学习日记】原创、在CSDN首发、需要转载请联系博主
- 💬 如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦
简介
本项目是一款依托于JAVA实现的通用人工智能解决方案,涵盖了模型训练、推理到Web/桌面应用的一整套AI功能。支持产品级OCR文字识别(可自定义模板)、图像搜索、人脸检索、智能抠图、照片上色、图像增强、机器翻译、RAG搜索以及大模型接入等,可开箱即用。
系统采用主流技术栈:SpringBoot + Vue搭建,后端使用SpringBoot提供API服务,前端基于Vue实现可视化管理,支持模块化部署和二次开发。项目代码完全开源,模块之间高度解耦,用户可按需引入,灵活扩展,特别适合需要快速集成 AI 功能的企业与个人开发者。

开发环境
CPU
Windows x64, Linux x64, macOS x64
GPU (CUDA)
Windows x64, Linux x64
模型下载:https://pan.baidu.com/s/16933J3dX16xnjbYaay-4og?pwd=cwxk
功能模块
1、AI训练平台【模型定制】
-
项目位置:/2_training_platform
-
使用人群:面向java程序员,满足图像识别分类定制化需求
-
功能清单:支持图像分类模型训练、支持图像1:1
数据上传:

超参数配置:

训练可视化:

2、AI Web应用
- 项目位置:/4_web_app
- 技术栈:前端VUE,后端Springboot
- 使用方式:可直接部署使用,使用UI或者调用API集成到现有的系统中
- 功能清单:图像生成、人脸搜索、以图搜图、以文搜图、一键抠图、文本搜索、图像生成
OCR:自定义模版识别(项目位置:/4_web_app/iocr)
- 参照锚点设置

- 内容识别区设置

以图搜图
- 项目位置:/4_web_app/image_search,一共提供了三个不同的版本
- 无向量引擎的版本,适合100万图片以下:mini_image_search
- 向量引擎的版本,无管理系统的精简版:simple_image_search
- 向量引擎的版本,完整的产品级应用:image_search
- 图片上传:支持服务器端文件夹上传(大量图片使用,如千万张图片入库)、提取人脸特征方式、支持客户端文件夹上传

- 图像搜索

跨模态:以文搜图,以图搜图
- 项目位置:/4_web_app/image_text_search,提供了2个不同的版本
- 无向量引擎的版本,适合100万图片以下:mini_image_text_search
- 向量引擎的版本,适合100万图片以上:image_text_search
- 图片上传:提取特征

-
以文搜图:输入文本如:雪地上两只狗
-
以图搜图

人脸搜索
- 项目位置:/4_web_app/face_search
- 上传图片:点击提取人脸特征按钮

- 人脸搜索

一键抠图
- 项目位置:/4_web_app/image_seg,提供了2个不同的版本
- 一键抠图完整版,包含:框选一键抠图,通用一键抠图,人体一键抠图,动漫一键抠图:image_seg
- 框选一键抠图:image_seg_sam2
- 框选一键抠图

- 框选一键抠图

文本搜索
- 项目位置:/4_web_app/text_search,提供了2个不同的版本
- 随时对数据进行插入、删除、搜索、更新等操作,结合大模型实现RAG功能,根据需要替换其它的特征提取模型:1_sdks\2_nlp_sdks\embedding
- 无向量引擎的版本,适合100万条数据以下:simple_text_search
- 向量引擎的版本,适合100万条数据以上:text_search
- 上传数据:点击提取特征按钮

- 文本搜索

图像生成
- 项目位置:/4_web_app/aigc_image_gen
- 图像生成模型链接: https://pan.baidu.com/s/1znJi092mth3z68Oq_j2lsA?pwd=dmra
- 预处理模型链接: https://pan.baidu.com/s/1h75UaEqg_paias8Z1pEjOQ?pwd=yqek
Canny 辅助生成:Canny边缘检测预处理器,可很好识别出图像内各对象的边缘轮廓,常用于生成线稿

线稿提取辅助生成:Lineart边缘检测预处理器,可很好识别出图像内各对象的边缘轮廓,用于生成线稿

3、AI能力平台【开箱即用】
- 项目位置:/3_api_platform
- 技术栈:前端VUE,后端Springboot
- 应用:可以直接部署使用,使用UI或者调用API集成到现有的系统中
- 支持的能力清单:OCR文字识别、机器翻译、语音识别、一键高清、 一键抠图、黑白照片上色、图像生成
- 模型下载:https://pan.baidu.com/s/1RIKaZJXMPbGXnB2sKtWsgQ?pwd=1uuf
- OCR文字识别:自由文本识别,支持旋转、倾斜的图片

- 语音识别:英文语音识别、文语音识别

- 机器翻译:支持202种语言互相翻译

- 图像增强:图片一键高清,提升图片4倍分辨率

- 人体一键抠图

开源地址&使用手册
点击下方的【IT学习日记】回复【资源】领取!
如果这篇文章对您有帮助,请一定帮我点个 “关注” 和 “点赞”,这对我非常重要。我将会继续推荐更多优质项目和新闻。

写在最后
1000+优质开源项目更新进度:286/1000。如需更多类型优质项目推荐,请在文章后留言。

更多推荐



所有评论(0)