diff --git a/Feature_Process_2.py b/Feature_Process_2.py new file mode 100644 index 0000000..105bb92 --- /dev/null +++ b/Feature_Process_2.py @@ -0,0 +1,31 @@ +import pandas as pd + +# 读取新表 +df_feature = pd.read_excel("feature.xlsx") + +# 父亲教养方式数字化 +df_feature['父亲教养方式数字化'] = df_feature['父亲教养方式'].apply(lambda x: 0.59 if x == '温暖与理解' else 0.46) + +# 母亲教养方式数字化 +df_feature['母亲教养方式数字化'] = df_feature['母亲教养方式'].apply(lambda x: 0.69 if x == '温暖与理解' else 0.56) + +# 自评家庭经济条件数字化 +df_feature['自评家庭经济条件数字化'] = df_feature['自评家庭经济条件'].apply(lambda x: 0.54 if x in ['贫困', '较差'] else 0.47) + +# 有无心理治疗(咨询)史数字化 +df_feature['有无心理治疗(咨询)史数字化'] = df_feature['心理治疗(咨询)史'].apply(lambda x: 0.09 if x in ['无', '没有'] else 0.21) + +# 强迫症状数字化 +df_feature['强迫症状数字化'] = df_feature['强迫症状'] / 4 + +# 人际关系敏感数字化 +df_feature['人际关系敏感数字化'] = df_feature['人际关系敏感'] / 4 + +# 抑郁症状数字化 +df_feature['抑郁症状数字化'] = df_feature['抑郁'] / 4 + +# 计算多因子症状 +df_feature['多因子症状'] = df_feature[['躯体化', '强迫症状', '人际关系敏感', '抑郁', '焦虑', '敌对', '恐怖', '偏执', '精神病性', '其他']].apply(lambda x: sum(x > 3.0) / 10, axis=1) + +# 保存处理后的表 +df_feature.to_excel("feature_processed.xlsx", index=False) diff --git a/record.txt b/record.txt index 65db656..28e7b7f 100644 --- a/record.txt +++ b/record.txt @@ -20,7 +20,7 @@ 姓名重合:莫琰,莫䶮 2023年7月3日 -完成学业预警统计统计,去除错误数据 +完成学业预警统计统计,去除错误数据,一个错误 姓名重合:扎西尼玛, 扎西尼马 2023年7月8日 @@ -29,3 +29,8 @@ 2023年7月12日 最后筛选出需要的特征 +2023年7月13日 +按照特征数字量化表的要求,完成了除学业和考勤外所有特征的量化,在Feature_Processed_2.py这个文件中处理,进一步统计特征,学业和出勤特征没有进一步统计进去 + + +