• 基础:分析活动主题调研数据

  1. 数据分析入门:信息统计

    1. 下载数据

    2. 准备提示词

      1. 指标(讲清楚表格构成和一些重要指标的含义)

      2. 要求(做什么样的分析、画什么样的图)

    3. 打开小浣熊,上传数据并分析

      1. 示例:【指标】表格中有3张表格sheet,1.sheet是1群的统计数据,2.sheet是2群的统计数据,number.sheet是1.sheet和2.sheet数字列对应的兴趣点,其中兴趣点对应兴趣数字列。【要求】现在需要统计1群和2群所有兴趣点的统计结果,加上统计百分比的数据,并对统计百分比列按照倒序进行排列。

    4. 使用提示词调优结果【注】是否需要优化提示词?需要优化几次提示词?这一程序和使用者本人“喂指令”的能力有关。在拟定提示词时,我们要尽量把自己的要求说得简洁、清晰、全面,减少后续优化工作。    

      1. 修改为表格格式:请先统计出1群的结果,再统计出2群的结果,加上统计百分比的数据,并对统计百分比列按照倒序进行排列,行末尾加上总计,返回表格格式,注意两个表格不要放在同一个表格中

      2. 将编号修改为整数:百分比数值请以整数的形式输出

    5. 导出结果为表格:请帮我把这两个统计结果表格导出来,谢谢

  2. 了解数据概况——描述性分析

    1. 定义:用简单的数字和图表展示数据的集中信息,有助于快速了解数据基本情况。

    2. 内容:【注】对语言材料进行类型学分析处理时,这些数据同样重要,不过还未试过用AI工具帮忙处理,下次可以动手实践一下~

      1. 集中趋势度量 :

        • 平均数(Mean):所有数据值的总和除以数据的数量。
        • 中位数(Median):将数据从小到大排列后位于中间位置的值。
        • 众数(Mode):数据中出现次数最多的值。
      2. 离散程度度量 :

        • 极差(Range):数据中最大值和最小值的差。
        • 方差(Variance):衡量数据值与平均数之间差异的平方的平均值。
        • 标准差(Standard Deviation):方差的平方根,也是衡量数据分散程度的指标。
      3. 分布形状 :

        • 偏度(Skewness):衡量数据分布的不对称性,正偏度表示数据右尾长,负偏度表示数据左尾长。
        • 峰度(Kurtosis):衡量数据分布的尖峭程度,高峰度表示数据分布比正态分布更尖锐。
      4. 频率分布 :

        • 统计数据中各个不同值出现的次数或频率。
    3. 案例
      1. 【指标】这里统计的是大学生对感兴趣活动主题的调查结果,其中:number.sheet是活动主题编号和主题详情, 编号对应的1.sheet和2.sheet的数字列, 1.sheet是1班的数据,2.sheet是2班的数据。【要求】请根据这份表格,完成描述性分析

      2. 【自主练习】

        1. 我有一份关于惯常义心理动词方言分布情况的论文,其中有诸多语料调查数据,我将论文中的表格简化修改为AI更容易识别的版本,如:

                                  2.提示词如下:

                                     3.分析结果如下:

  • 【注】:我一直觉得对AI工具的使用要有使用者的“个人底线”。AI工具于我而言,只是日常工作生活中的一个降本增效的小助手,我喜欢用它做一些我不想不去做又不得不去做的事务,但在学术产出方面,坚守个人的思考性和创新性是第一位。这次用AI帮我分析自己的调查数据,结果确实让我眼前一亮,目前看来,AI除了可以帮我们去做“不想做又不得不去做的事务”外,还可以帮我们在一些原创性工作中梳理思路,为后续研究提供一个数据趋势上的建议。

    Logo

    有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

    更多推荐