From fe6574943e6ddeeef22999fdf4e93e5066678ac1 Mon Sep 17 00:00:00 2001 From: wangchunlin Date: Thu, 13 Jul 2023 23:08:19 +0800 Subject: [PATCH] =?UTF-8?q?=E8=BF=9B=E4=B8=80=E6=AD=A5=E7=BB=9F=E8=AE=A1?= =?UTF-8?q?=E7=89=B9=E5=BE=81=EF=BC=8C=E5=AD=A6=E4=B8=9A=E5=92=8C=E5=87=BA?= =?UTF-8?q?=E5=8B=A4=E7=89=B9=E5=BE=81=E6=B2=A1=E6=9C=89=E8=BF=9B=E4=B8=80?= =?UTF-8?q?=E6=AD=A5=E7=BB=9F=E8=AE=A1=E8=BF=9B=E5=8E=BB?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- Feature_Process_2.py | 31 +++++++++++++++++++++++++++++++ record.txt | 7 ++++++- 2 files changed, 37 insertions(+), 1 deletion(-) create mode 100644 Feature_Process_2.py diff --git a/Feature_Process_2.py b/Feature_Process_2.py new file mode 100644 index 0000000..105bb92 --- /dev/null +++ b/Feature_Process_2.py @@ -0,0 +1,31 @@ +import pandas as pd + +# 读取新表 +df_feature = pd.read_excel("feature.xlsx") + +# 父亲教养方式数字化 +df_feature['父亲教养方式数字化'] = df_feature['父亲教养方式'].apply(lambda x: 0.59 if x == '温暖与理解' else 0.46) + +# 母亲教养方式数字化 +df_feature['母亲教养方式数字化'] = df_feature['母亲教养方式'].apply(lambda x: 0.69 if x == '温暖与理解' else 0.56) + +# 自评家庭经济条件数字化 +df_feature['自评家庭经济条件数字化'] = df_feature['自评家庭经济条件'].apply(lambda x: 0.54 if x in ['贫困', '较差'] else 0.47) + +# 有无心理治疗(咨询)史数字化 +df_feature['有无心理治疗(咨询)史数字化'] = df_feature['心理治疗(咨询)史'].apply(lambda x: 0.09 if x in ['无', '没有'] else 0.21) + +# 强迫症状数字化 +df_feature['强迫症状数字化'] = df_feature['强迫症状'] / 4 + +# 人际关系敏感数字化 +df_feature['人际关系敏感数字化'] = df_feature['人际关系敏感'] / 4 + +# 抑郁症状数字化 +df_feature['抑郁症状数字化'] = df_feature['抑郁'] / 4 + +# 计算多因子症状 +df_feature['多因子症状'] = df_feature[['躯体化', '强迫症状', '人际关系敏感', '抑郁', '焦虑', '敌对', '恐怖', '偏执', '精神病性', '其他']].apply(lambda x: sum(x > 3.0) / 10, axis=1) + +# 保存处理后的表 +df_feature.to_excel("feature_processed.xlsx", index=False) diff --git a/record.txt b/record.txt index 65db656..28e7b7f 100644 --- a/record.txt +++ b/record.txt @@ -20,7 +20,7 @@ 姓名重合:莫琰,莫䶮 2023年7月3日 -完成学业预警统计统计,去除错误数据 +完成学业预警统计统计,去除错误数据,一个错误 姓名重合:扎西尼玛, 扎西尼马 2023年7月8日 @@ -29,3 +29,8 @@ 2023年7月12日 最后筛选出需要的特征 +2023年7月13日 +按照特征数字量化表的要求,完成了除学业和考勤外所有特征的量化,在Feature_Processed_2.py这个文件中处理,进一步统计特征,学业和出勤特征没有进一步统计进去 + + +