在当今数字化时代,企业对于数据的管理和利用需求日益增长,尤其是在AI应用开发领域,如何高效地整合、处理和分析数据成为关键。JBoltAI智能数据中心凭借其全面且强大的功能,为Java企业级AI应用开发提供了坚实有力的支持,成为开发过程中不可或缺的一部分。

智能知识库管理,开启数据高效利用之门

JBoltAI智能数据中心自带的知识库管理功能,为数据存储和处理带来了极大便利。它能够将文档、表格等各类文件进行拆分向量化存储,这种处理方式使得数据能够以更科学、更易于检索和分析的形式存在。

在创建AI知识库时,用户可以根据自身需求自定义名称、选择VDB数据库和Embedding资源,还能灵活设置分段方式。通用分段按照设定的分块大小进行分块,简单直接;父子分段则更为复杂且智能,它将设置好的分块大小作为父段,再将父段按照程序设定好的分块大小分成多个子段。这种分段方式在检索时具有独特优势,检索所有子段,检索数量为父段与分块数的乘积,而回复显示的是父段,既保证了检索的全面性,又使回复内容更具连贯性和完整性。

文件训练功能进一步丰富了知识库的应用场景。通过点击【文件训练】按钮,用户可以轻松管理当前知识库文件,支持直接抓取网页内容,以及将文档文件和excel文件进行向量化处理。在URL抓取方面,用户只需填写网页地址,系统就能抓取网页中的文字、图片、网页地址等信息,并存储为markdown文档后进行向量化拆分。同时,用户还可以通过CSS选择器精确提取网页中的内容和标题,设置分块大小和重叠大小,以满足不同的检索和分析需求。此外,系统还提供是否开启OCR和是否提取资源的选项,开启OCR可以对文档中的图片内容进行识别,提取文字内容;提取资源则能将文件内的图片、视频、音频、附件等非文字类型资源提取并存入服务器,在AI智能问答时显示原素材,为用户提供更丰富的信息。

普通文档上传和QA文档上传功能同样实用。用户可以上传pdf、word、excel、txt、markdown等类型的文档,进行文件向量化并拆分为片段或QA问答对。对于excel文件,使用系统内置excel模板即可轻松实现QA问答对的拆分。批量生成问题功能则利用大模型为当前文件的所有片段生成3 - 5个关联问题,在进行问答时,通过这些关联问题可以快速定位到片段,大大提高了信息检索的效率。

数据库数据连接,打破数据壁垒

在Java企业级AI应用开发中,数据库是数据存储和管理的重要部分。JBoltAI智能数据中心支持连接多种类型的数据库,包括MySQL、PostgreSQL、Oracle、SQL Server等,能够轻松将数据库的表结构同步过来,获取表里的信息。

新增数据源功能操作简单,用户只需填写数据源类型、名称、服务器地址、端口、数据库名称、用户名和密码等信息,然后点击测试按钮即可检测数据库连接是否正确。如果连接失败,系统会给出提示;连接成功后,中间区域会显示数据库的表,方便用户进行后续操作。

数据源表结构功能提供了同步表结构、刷新当前表、AI检测字段、清空全部、AI描述以及修改表描述和字段描述等功能。同步表结构功能可以将连接的数据库表结构同步过来,并且在修改字段描述后点击同步,会同步除了描述之外的其他值,避免覆盖在此系统中手动修改的描述。AI检测字段功能由AI检测当前表描述以及字段描述解释是否完备可被理解,检测完成后,鼠标悬浮在检测结果上可查看检测结果分析,帮助用户更好地理解和优化表结构。AI描述功能则根据表描述和字段描述由AI生成对当前单表的描述,问答时会根据单表描述判断是否使用这个表,用户还可以手动编辑保存描述,每次编辑保存会覆盖之前的描述。

Excel表格数据处理,实现结构化存储

Excel表格在企业数据管理中广泛应用,JBoltAI智能数据中心提供了完善的Excel表格数据处理功能。用户可以通过上传表格功能选择要上传的表格文件,设置表格标题行数、表格名称、选择分类和表格描述等信息。表格名称、描述与表头信息用于AI生成单个表格的总体描述,问答时AI根据单个表格描述判断是否使用此表格进行作答,因此用户需要尽量描述清楚完备表格的名称、用途、信息等。

上传表格后,用户可以在表格数据功能中查看表格详情,系统会将上传的表格同步过来,获取到表格数据,并可放大查看。AI描述功能同样适用于表格数据,用户可以根据实际情况手动编辑保存描述。覆盖导入功能则允许用户上传一个新的表格覆盖当前表格数据,方便数据的更新和管理。

知识图谱构建,挖掘数据深层关系

知识图谱是一种强大的数据表示和分析工具,JBoltAI智能数据中心支持通过AI分析文件构建知识图谱,也可以直接上传.ttl和.rdf等格式的文件导入知识图谱。

知识图谱AI智能助手功能为用户提供了便捷的操作方式。用户可以上传文档类文件,根据文件和输入的提示词生成知识图谱;也可以输入提示词,创建实体与关系;还可以搜索已经存在的实体与关系。知识图谱展示功能则提供了关键词搜索、语句执行和AI助手等多种查询方式。用户可以输入实体的名称进行搜索,也可以输入Cypher语句进行查询实体或者关系,还可以通过AI助手输入自然语言转换为Cypher语句再进行查询,大大降低了知识图谱的使用门槛。

添加实体和图谱编辑功能使得知识图谱的构建和维护更加灵活。在添加实体时,用户可以选择AI生图谱自动创建的标签分类,自定义节点名称和添加属性。图谱编辑功能则支持添加实体、编辑节点、删除节点、锁定和解锁等操作,方便用户对知识图谱进行动态调整。分类标签功能可以点击分类标签,只展示此分类下的实体,使知识图谱的展示更加清晰有序。导出图谱功能则允许用户将图谱导出为TTL格式,方便数据的共享和进一步处理。

JBoltAI智能数据中心凭借其全面的知识库管理、数据库数据连接、Excel表格数据处理和知识图谱构建等功能,为Java企业级AI应用开发提供了全方位的支持。它帮助企业高效地整合和管理数据,挖掘数据深层价值,为企业的数字化转型和智能化发展提供了有力保障。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐