pandas 对列进行替换值和删除列 设置Series的dtype 统计Series 里面数值类型和个数
博客专区 > marjey 的博客 > 博客详情
pandas 对列进行替换值和删除列 设置Series的dtype 统计Series 里面数值类型和个数
marjey 发表于3个月前
pandas 对列进行替换值和删除列 设置Series的dtype 统计Series 里面数值类型和个数
  • 发表于 3个月前
  • 阅读 49
  • 收藏 0
  • 点赞 0
  • 评论 0
def preprocess2():
    """
    数据预处理
    :return:
    """

    data = pd.read_csv('./dataset/preprocess_1',
                       delimiter=',', header=None
                       , names=['licheng', 'youxi', 'bingbang', 'xihuang'])

    print(data.describe())
    tmpa = data['xihuang']
    # 统计种类
    a = tmpa.value_counts(dropna=False)
    xihuangmaping = {"didntLike": 1, "smallDoses ": 2, "largeDoses": 3, 'smallDoses': 0}

    data['xihuang'] = data['xihuang'].map(xihuangmaping)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data.to_csv('./dataset/preprocess_2', index=None)
共有 人打赏支持
粉丝 3
博文 139
码字总数 130230
×
marjey
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: