进一步统计特征,学业和出勤特征没有进一步统计进去

main
wangchunlin 3 years ago
parent 4dc4d1d311
commit fe6574943e

@ -0,0 +1,31 @@
import pandas as pd
# 读取新表
df_feature = pd.read_excel("feature.xlsx")
# 父亲教养方式数字化
df_feature['父亲教养方式数字化'] = df_feature['父亲教养方式'].apply(lambda x: 0.59 if x == '温暖与理解' else 0.46)
# 母亲教养方式数字化
df_feature['母亲教养方式数字化'] = df_feature['母亲教养方式'].apply(lambda x: 0.69 if x == '温暖与理解' else 0.56)
# 自评家庭经济条件数字化
df_feature['自评家庭经济条件数字化'] = df_feature['自评家庭经济条件'].apply(lambda x: 0.54 if x in ['贫困', '较差'] else 0.47)
# 有无心理治疗(咨询)史数字化
df_feature['有无心理治疗(咨询)史数字化'] = df_feature['心理治疗(咨询)史'].apply(lambda x: 0.09 if x in ['', '没有'] else 0.21)
# 强迫症状数字化
df_feature['强迫症状数字化'] = df_feature['强迫症状'] / 4
# 人际关系敏感数字化
df_feature['人际关系敏感数字化'] = df_feature['人际关系敏感'] / 4
# 抑郁症状数字化
df_feature['抑郁症状数字化'] = df_feature['抑郁'] / 4
# 计算多因子症状
df_feature['多因子症状'] = df_feature[['躯体化', '强迫症状', '人际关系敏感', '抑郁', '焦虑', '敌对', '恐怖', '偏执', '精神病性', '其他']].apply(lambda x: sum(x > 3.0) / 10, axis=1)
# 保存处理后的表
df_feature.to_excel("feature_processed.xlsx", index=False)

@ -20,7 +20,7 @@
姓名重合:莫琰,莫䶮
2023年7月3日
完成学业预警统计统计,去除错误数据
完成学业预警统计统计,去除错误数据,一个错误
姓名重合:扎西尼玛, 扎西尼马
2023年7月8日
@ -29,3 +29,8 @@
2023年7月12日
最后筛选出需要的特征
2023年7月13日
按照特征数字量化表的要求完成了除学业和考勤外所有特征的量化在Feature_Processed_2.py这个文件中处理进一步统计特征学业和出勤特征没有进一步统计进去

Loading…
Cancel
Save