文档章节

pandas 对列进行替换值和删除列 设置Series的dtype 统计Series 里面数值类型和个数

marjey
 marjey
发布于 2017/08/18 14:43
字数 96
阅读 79
收藏 0
def preprocess2():
    """
    数据预处理
    :return:
    """

    data = pd.read_csv('./dataset/preprocess_1',
                       delimiter=',', header=None
                       , names=['licheng', 'youxi', 'bingbang', 'xihuang'])

    print(data.describe())
    tmpa = data['xihuang']
    # 统计种类
    a = tmpa.value_counts(dropna=False)
    xihuangmaping = {"didntLike": 1, "smallDoses ": 2, "largeDoses": 3, 'smallDoses': 0}

    data['xihuang'] = data['xihuang'].map(xihuangmaping)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data.to_csv('./dataset/preprocess_2', index=None)

© 著作权归作者所有

共有 人打赏支持
marjey
粉丝 2
博文 173
码字总数 139219
作品 0
昆明
Python 数据分析包:pandas 基础

pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包 类似于 Numpy 的核心是 ndarray,pandas 也是围绕着 Series 和 DataFrame 两个核心数据结构展开的 。Series 和 DataFrame ...

lionets
2014/06/10
0
5
[python skill]Python 中 NaN 和 None 的详细比较

原文出自:http://junjiecai.github.io/posts/2016/Oct/20/nullvaluecomparison/ 感谢~ python原生的None和pandas, numpy中的numpy.NaN尽管在功能上都是用来标示空缺数据。但它们的行为在很多...

陈楚桐
08/06
0
0
数据聚合与分组运算——GroupBy

pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。 根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。 计算分组摘...

Betty__
2016/10/03
92
0
pandas库简介(1)--pandas的三种数据结构

/持续更新中**/ pandas有三种数据结构形式,分别是Series,DataFrame和索引对象。 1.Series Series和一维数组很像,只是它的每一个值都有一个索引,输出显示时索引在左,值在右。 如果语言无法...

zby1001
2017/01/08
0
0
十分钟搞定pandas

原文地址:http://www.cnblogs.com/chaosimple/p/4153083.html 本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细...

halcyonbaby
2017/04/09
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

vue+element-ui操作删除(单行和批量删除)

页面展示: <template><!-- 表格内容 --><el-table :data="packData" border style="width: 100%" ref="multipleTable" @selection-change="handleSelectionChange"><el-tab......

琴妹
10分钟前
0
0
基于vue(element ui) + ssm + shiro 的权限框架

zhcc 基于vue(element ui) + ssm + shiro 的权限框架 引言 心声 现在的Java世界,各种资源很丰富,不得不说,从分布式,服务化,orm,再到前端控制,权限等等玲琅满目,网上有句话说,语言框架...

DarrenHu_吴邪
17分钟前
1
1
数据库水平切分(MyCat分片)

范围分片 io.mycat.route.function.AutoPartitionByLong 自动范围分片 Function名称:rang-long(配置文件默认) 枚举分片 io.mycat.route.function.PartitionByFileMap 枚举分片 Funtion名称...

这很耳东先生
18分钟前
0
0
读《HeadFirst设计模式》笔记之外观模式

外观模式:提供了一个统一的接口,用来访问子系统中的一群接口。外观定义了一个高层接口,让子系统更容易使用。 举个栗子: 建了一个家庭影院,但是每次享受家庭影院时,你发现需要执行 将灯...

suyain
19分钟前
0
0
MongoDB分片配置

简单注解: mongos 路由进程, 应用程序接入mongos再查询到具体分片,监听端口默认27017 config server 路由表服务, 每一台都具有全部chunk的路由信息 shard为数据存储分片, 每一片都可以是...

LUIS1983
27分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部