课程代码:50002680054 | 满分:100分 | 开卷机考
使用 Sheet「学生数据」
| 行数 | 列数 | 含缺失值的单元格数 | 缺失值占比(%) |
|---|---|---|---|
| 均值 | 标准差 | 中位数 |
|---|---|---|
计算"日均屏幕时间_小时"与GPA之间的Pearson相关系数,并判断相关方向。
| Pearson相关系数 r | 相关方向(正/负) |
|---|---|
按"专业大类"分组,计算各专业平均GPA。
| 平均GPA最高的专业 | 平均GPA最低的专业 |
|---|---|
计算所有数值列之间的Pearson相关系数,找出|r| > 0.7的特征对。
共发现 对,请在表中列出:
| 特征对 | 相关系数 r |
|---|---|
对18个数值特征标准化后,做PCA和K-means
累计方差解释率达80%至少需要保留 个主成分。
PC1方差解释率 = %
PC1载荷绝对值最大的三个特征依次是:、、
根据PC1的载荷分布,为PC1命名一个学术性标签:
K值取2~8,根据轮廓系数,最佳K = ,轮廓系数 =
| 日均屏幕 时间 | 学习APP 使用数 | 数字化工具 掌握度 | 日均自习 时长 | 月均阅 读量 | MOOC学 习频率 | 数字焦虑 指数 | 在线学习 满意度 | GPA | 挂科数 | 在线讨论 参与度 | 协作完成 率(%) | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 聚类0 | ||||||||||||
| 聚类1 | ||||||||||||
| 聚类2 | ||||||||||||
| 聚类命名 | ||||||||||||
| 人文社科 | 医学 | 理工 | 经管 | 艺术体育 | |
|---|---|---|---|---|---|
| 聚类0 | |||||
| 聚类1 | |||||
| 聚类2 |
最需要学校学习支持中心重点关注的群体是:
简要说明理由(20字以内):
使用 Sheet「文本评论」
使用jieba分词并去除停用词后:
| 分词总数 | 平均每条评论词数 |
|---|---|
词频最高的5个词依次为:
| 1st | 2nd | 3rd | 4th | 5th |
|---|---|---|---|---|
使用SnowNLP打分:<0.4负面,>0.6正面,其余中性。
| 正面评论数 | 负面评论数 | 中性评论数 | 情感得分均值 |
|---|---|---|---|
最佳K = ,各聚类TOP3关键词及命名:
| 聚类 | TOP3关键词 | 聚类命名 |
|---|---|---|
| 0 | 学校、建议、课程 | |
| 1 | 不会、太高、人类 | |
| 2 | 参差不齐、mooc、数据库 | |
| 3 | 学习、数字化、身体 | |
| 4 | 效率、很多、提升 | |
| 5 | 方便、推荐、翻倍 |
LDA提取4个主题,为各主题命名学术性标签:
| 主题 | Top5关键词 | 主题命名 |
|---|---|---|
| 0 | 学习、身体、越来越、干涩、头痛 | |
| 1 | 效率、需要、chatgpt、方便、mooc | |
| 2 | 内容、参差不齐、不行、筛选、太多 | |
| 3 | 不会、太高、数字化、真的、人类 |
概述当前大学生对数字化学习的核心态度(80字以内):