在日常工作中,我们经常面临这样的困境:手上有几个Excel表格,一个存着订单信息,一个存着用户资料,还有一个是商品明细。想把它们按ID关联起来,却不知道从何下手。更头疼的是,当数据量达到百万级时,Excel直接卡死,VLOOKUP公式跑不动,整个人都崩溃了。

今天,我们就来聊聊跨表格ID关联合并这件事,以及如何用AI聊天的方式,轻松搞定百万级数据的合并。

一、需求引入

有三个excel表格,且数据量都是百万级别:

  • 表格A(订单信息):订单ID、用户ID、商品ID、金额

  • 表格B(用户信息):用户ID、用户姓名、联系方式

  • 表格C(商品信息):商品ID、商品名称、单价

如下图:

image

 我们想得到一张包含“订单ID、用户姓名、商品名称、金额”的完整表格,就需要通过用户ID和商品ID进行关联匹配

image

熟悉Excel的同学可能知道下面两个方案:

1. VLOOKUP函数法

这是最常用的方法,在单元格中输入公式:=VLOOKUP(A2, Sheet2!$A$1:$B$1000, 2, FALSE)

痛点:当数据量超过几万行时,Excel运算会变得极慢;如果有多列需要匹配,还要写多层嵌套;而且一旦数据更新,公式可能出错。

2. Power Query合并查询

Excel自带的Power Query支持“左合并”“右合并”“内连接”等多种合并方式,比VLOOKUP更适合批量处理。

痛点:操作步骤较多,需要熟悉Power Query界面,对小白不够友好;处理百万级数据时,内存消耗大,容易崩溃。

现在,有了AI技术的加持,跨表格ID关联合并变得前所未有的简单。快点跟着小编往下看吧!

二、解决方案详解

这是一个专业AI批处理的解决方案, 数据安全。 首先在主界面上找到 Excel AI批处理:

image

打开后, 我们找到 “Power Query AI” 这个智能体:

image

这个智能体是我们参考Excel的Power Query 功能研发的一款AI智能体,即使用户不会任何Exel技术,也能够快速的处理百万级数据量的表格,

可以对表格进行“条件过滤,数据清洗,条件查询,分组汇总,计算”等数据统计功能,内核引擎是mysql,也就是说,mysql表能做的事,它都能做。后面我会讲解下原理,先来看看用法。

首先我们需要设置一个AI模型,点击右上角可以设置对应的模型,这里推荐DeepSeek :

image

设置好模型之后,我们点击文件,将“订单信息”表设置到文件里面,当成主表。当“用户信息”,“商品信息”2个表放到附件里面,当成关联表。

image

 然后选中提示词,输入下面提示词:

image

执行类型是一个下拉,有“SQL和提示词”两个功能,SQL是可以直接执行原生的sql语句,提示词就是输入提示词进行操作。我们看下下面的提示词:

从“订单信息”,“商品信息”,“用户信息” 表单中查询“订单ID,用户ID,商品ID,数量,金额,商品名称,品类,单价,用户名,会员等级,城市”

这里我们没有显示的指定关联字段,是因为,在三个表格里面,id的标题名称都是一致的,程序会智能识别。

然后我们点击发送,将内容发送给智能体。一会儿就会出结果了。

三、工作原理

程序首先会把你输入的文件(但是每一个文件之间是隔离的)和附件都当成数据仓库,然后解析出所有表格的表单,成为一张张独立的表,表单的标题抽象成字段,如下:

image

对提示词里面描述时,需要明确指明到哪个表单名称和字段名称,这样AI智能体才会知道对哪个表单和哪个字段操作。并且最好用引号引起来,如:

从“表A”中查询“交易流水号”,且“表A”的“交易流水号”需要在“表B”的“交易流水号”里面。

提示词其实是由2部分组成:

  • 查询的字段 : 这个最终就是操作结果Excel的标题。
  • 条件部分: 条件可以由多个组成,也可以是分组求和等,就看你怎么描述了。

为什么能够支持百万级数据量?

由于数据的操作是放到本地的,如果是放到服务器那肯定会内存崩溃,而且并不是放到本地的内存的,而是借助了临时文件缓存,所以能够支持百万级操作。

四、数据安全

有人说这里用到了deepseek等大模型,那肯定会数据泄露啊! 大可不必担心数据泄露,我们泄露的只是提示词而已,excel表数据是在本地操作的,不可能泄露。

你想一下,如果将百万数据量给AI,他不会炸掉吗!!!

五、结语

感谢大家,我们正处在AI高速发展的时代,AI不仅仅可以用来娱乐,也能催生很多软件,帮我们大大提高生产力, “鲸闲办公”就是借助AI专门来解决批量办公问题的。希望大家多提意见,让我们做得更好,祝您生活愉快。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐