文档章节

pandas 对列进行替换值和删除列 设置Series的dtype 统计Series 里面数值类型和个数

marjey
 marjey
发布于 2017/08/18 14:43
字数 96
阅读 3.4K
收藏 0

#程序员薪资揭榜#你做程序员几年了?月薪多少?发量还在么?>>>

def preprocess2():
    """
    数据预处理
    :return:
    """

    data = pd.read_csv('./dataset/preprocess_1',
                       delimiter=',', header=None
                       , names=['licheng', 'youxi', 'bingbang', 'xihuang'])

    print(data.describe())
    tmpa = data['xihuang']
    # 统计种类
    a = tmpa.value_counts(dropna=False)
    xihuangmaping = {"didntLike": 1, "smallDoses ": 2, "largeDoses": 3, 'smallDoses': 0}

    data['xihuang'] = data['xihuang'].map(xihuangmaping)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data.to_csv('./dataset/preprocess_2', index=None)

© 著作权归作者所有

marjey
粉丝 3
博文 173
码字总数 139219
作品 0
昆明
私信 提问
加载中

评论(0)

Python pandas学习总结

Python pandas学习总结   pandas是做数据分析非常重要的一个模块,它使得数据分析的工作变得更快更简单。由于现实世界中数据源的格式非常多,但是pandas也支持了不同数据格式的导入方法,所...

Alden_Wei
04/02
0
0
python数据分析与算法 之 六 数据分析

数据分析:是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 数据分析三剑客:Numpy,Pandas,Matplotlib 6.1Numpy NumPy(Numerical Python) 是 Python 语言的...

osc_qzrqhs9y
2019/09/10
2
0
numpy和pandas 各种比较常见的用法总结

一、numpy 1、numpy中reshape的用法 经常会遇到np.reshape(a,-1) 或者np.reshape(-1,a) 这样的情况(a=1,2,3,4,5),-1是一个比较神奇的功能,意思是我只要确定需要分成a行后者a列,剩下的数...

osc_ofejccgq
2019/06/28
2
0
python库--pandas--DataFrame

转换 索引,迭代 运算符 功能应用,分组及窗口 计算/描述统计 重新索引/选择/标签操作 缺失数据处理 形状变换/排序/转置 组合/加入/合并 时间序列相关 绘图 序列化/IO/转换 稀疏 点击打开API: ...

osc_bswpz1oi
2018/01/14
3
0
05-pandas索引切片读取数据缺失数据处理

引入   numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? numpy能够帮我们处理处理数值型数据,但是这还不够 很多时候,我...

osc_0vxxme2b
04/16
2
0

没有更多内容

加载失败,请刷新页面

加载更多

PDF如何添加下划线?迅捷PDF编辑器一键添加

“在PDF文件中如何添加下划线?”最近,很多办公室小伙伴都向小编咨询这样一个问题。我们常常需要接触、使用到PDF文件,通过查看、阅读、编辑PDF文件以处理各种各样的学习、工作任务。当我们...

dawda
25分钟前
20
0
go中gin框架+realize实现边写代码边编译,热更新

最近看到了热加载,相关的,就搜索了goland实现热加载 发现了一个插件realize https://github.com/oxequa/realize 然后,为了自己撸代码更方便,配合gin写个教程 1.准备 go get github.com/...

osc_ho8dcqsx
25分钟前
17
0
CAP理论的理解

转自:https://www.cnblogs.com/mingorun/p/11025538.html CAP理论的理解 CAP理论作为分布式系统的基础理论,它描述的是一个分布式系统在以下三个特性中: 一致性(Consistency) 可用性(Ava...

osc_5rgbamh9
26分钟前
24
0
求所有科目都大于80分的学生姓名

   蠢蠢的我=》 select t1.name from ( select name,count(*) as num from table t where fenshu>80 group by name) t1join( select name,count(kecheng) as num from table group ......

osc_gk4myeyk
27分钟前
15
0
Memcache(1.1)Memcache 基本概述与架构概述

【1】基本概念介绍 官网:https://memcached.org/ 【1.1】memcache与memcached memcache:是早期使用的,与php结合的,是Php中常用的一个原生插件,完全在php框架内开发的 memcached:是建立...

osc_7ie26pzn
29分钟前
15
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部