AI+数据分析【TASK2】
【要求】现在需要统计1群和2群所有兴趣点的统计结果,加上统计百分比的数据,并对统计百分比列按照倒序进行排列。【指标】这里统计的是大学生对感兴趣活动主题的调查结果,其中:number.sheet是活动主题编号和主题详情, 编号对应的1.sheet和2.sheet的数字列, 1.sheet是1班的数据,2.sheet是2班的数据。修改为表格格式:请先统计出1群的结果,再统计出2群的结果,加上统计百分比
-
基础:分析活动主题调研数据
-
数据分析入门:信息统计
-
下载数据
-
准备提示词
-
指标(讲清楚表格构成和一些重要指标的含义)
-
要求(做什么样的分析、画什么样的图)
-
-
打开小浣熊,上传数据并分析
-
示例:【指标】表格中有3张表格sheet,1.sheet是1群的统计数据,2.sheet是2群的统计数据,number.sheet是1.sheet和2.sheet数字列对应的兴趣点,其中兴趣点对应兴趣数字列。【要求】现在需要统计1群和2群所有兴趣点的统计结果,加上统计百分比的数据,并对统计百分比列按照倒序进行排列。
-
-
使用提示词调优结果【注】是否需要优化提示词?需要优化几次提示词?这一程序和使用者本人“喂指令”的能力有关。在拟定提示词时,我们要尽量把自己的要求说得简洁、清晰、全面,减少后续优化工作。
-
修改为表格格式:请先统计出1群的结果,再统计出2群的结果,加上统计百分比的数据,并对统计百分比列按照倒序进行排列,行末尾加上总计,返回表格格式,注意两个表格不要放在同一个表格中
-
将编号修改为整数:百分比数值请以整数的形式输出
-
-
导出结果为表格:请帮我把这两个统计结果表格导出来,谢谢
-
-
了解数据概况——描述性分析
-
定义:用简单的数字和图表展示数据的集中信息,有助于快速了解数据基本情况。
-
内容:【注】对语言材料进行类型学分析处理时,这些数据同样重要,不过还未试过用AI工具帮忙处理,下次可以动手实践一下~
-
集中趋势度量 :
- 平均数(Mean):所有数据值的总和除以数据的数量。
- 中位数(Median):将数据从小到大排列后位于中间位置的值。
- 众数(Mode):数据中出现次数最多的值。
-
离散程度度量 :
- 极差(Range):数据中最大值和最小值的差。
- 方差(Variance):衡量数据值与平均数之间差异的平方的平均值。
- 标准差(Standard Deviation):方差的平方根,也是衡量数据分散程度的指标。
-
分布形状 :
- 偏度(Skewness):衡量数据分布的不对称性,正偏度表示数据右尾长,负偏度表示数据左尾长。
- 峰度(Kurtosis):衡量数据分布的尖峭程度,高峰度表示数据分布比正态分布更尖锐。
-
频率分布 :
- 统计数据中各个不同值出现的次数或频率。
-
- 案例
-
【指标】这里统计的是大学生对感兴趣活动主题的调查结果,其中:number.sheet是活动主题编号和主题详情, 编号对应的1.sheet和2.sheet的数字列, 1.sheet是1班的数据,2.sheet是2班的数据。【要求】请根据这份表格,完成描述性分析
-
【自主练习】
-
我有一份关于惯常义心理动词方言分布情况的论文,其中有诸多语料调查数据,我将论文中的表格简化修改为AI更容易识别的版本,如:
-
-
-
2.提示词如下:
3.分析结果如下:
- 【注】:我一直觉得对AI工具的使用要有使用者的“个人底线”。AI工具于我而言,只是日常工作生活中的一个降本增效的小助手,我喜欢用它做一些我不想不去做又不得不去做的事务,但在学术产出方面,坚守个人的思考性和创新性是第一位。这次用AI帮我分析自己的调查数据,结果确实让我眼前一亮,目前看来,AI除了可以帮我们去做“不想做又不得不去做的事务”外,还可以帮我们在一些原创性工作中梳理思路,为后续研究提供一个数据趋势上的建议。
- 内容来源依据:Datawhale-学用 AI,从此开始
- 数据分析工具:小浣熊家族 Raccoon - AI 智能助手 - 商汤科技
- 数据分析来源:个人学术论文
更多推荐
所有评论(0)