文档章节

pandas操作

Scofieldxs
 Scofieldxs
发布于 2017/07/21 11:03
字数 149
阅读 4
收藏 0
  1. 排序: sort_values df.sort_values(['query_count'],ascending=False)[:20] # 根据query_count列排序,降序

  2. 删除一行,一列:drop df.drop([1504369],inplace=True) # 删除第1504369行元素,inplace=True:不生成新的dataframe

     df.drop(df.columns[-1],axis=1,inplace=True)
     # 删除最后一列
    
  3. 定位到具体行列: loc df.loc[:20,df.columns[2:20]] # 前20行,2-20列

  4. 查看两列关系 train[['Title', 'Survived']].groupby(['Title'], as_index=False).mean()

  5. 离散值一一对应做转换:map dataset['Sex'] = dataset['Sex'].map( {'female': 0, 'male': 1} ).astype(int)

  6. 连续之离散化 dataset.loc[(dataset['Fare'] > 7.91) & (dataset['Fare'] <= 14.454), 'Fare'] = 1

  7. 连续值离散化: cut ser = Series(np.random.randint(1,10,6)) bins = [0,3,6,9] cats = pd.cut(ser,bins,labels=['small','middle','large'])

© 著作权归作者所有

共有 人打赏支持
上一篇: hadoop 知识
下一篇: 分布式--rpc
Scofieldxs
粉丝 4
博文 24
码字总数 26524
作品 0
海淀
私信 提问
Pandas初学者代码优化指南

原文:A Beginner’s Guide to Optimizing Pandas Code for Speed 作者:Sofia Heisler 翻译:无阻我飞扬 摘要:Pandas 是Python Data Analysis Library的简写,它是为了解决数据分析任务而创...

dev_csdn
2017/11/21
0
0
机器学习基础 --- pandas的基本使用

一、pandas的简介   Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操...

码农47
2018/04/22
0
0
Python利用pandas处理Excel数据的应用

Python利用pandas处理Excel数据的应用 最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做自动化...

上官夏洛特
2018/11/20
0
0
Pandas系列6-DataFrame的分组与聚合

在对数据进行处理的时候,分组与聚合是非常常用的操作。在Pandas中此类操作主要是通过groupby函数来完成的。 先看一个实际的例子: 通过groupby函数生成一个groupby对象,如下: 整个分组统计...

geekpy
2018/07/23
0
0
Python数据分析(一) 关于pandas和numpy

自己在使用pandas和numpy处理数据的时候,遇到了很多坑,运用不熟练,在探索的过程中找到以下文章,本来自己想整理这些知识点,但是返现,可能自己写出来的效果差不多,并且以下文章整理很全...

致Great
2018/04/14
0
0

没有更多内容

加载失败,请刷新页面

加载更多

centos7重置密码、单用户模式、救援模式、ls命令、chmod命令

在工作当中如果我们错误的配置了文件使服务器不能正常启动或者忘记密码不能登录系统,如何解决这些问题呢?重装系统是可以实现的,但是往往不能轻易重装系统的,下面用忘记密码作为例子讲解如...

李超小牛子
今天
3
0
Python如何开发桌面应用程序?Python基础教程,第十三讲,图形界面

当使用桌面应用程序的时候,有没有那么一瞬间,想学习一下桌面应用程序开发?行业内专业的桌面应用程序开发一般是C++,C#来做,Java开发的也有,但是比较少。本节课会介绍Python的GUI(图形用...

程序员补给栈
今天
5
0
kafka在的使用

一、基本概念 介绍 Kafka是一个分布式的、可分区的、可复制的消息系统。它提供了普通消息系统的功能,但具有自己独特的设计。 这个独特的设计是什么样的呢? 首先让我们看几个基本的消息系统...

狼王黄师傅
今天
3
0
Android JNI总结

0x01 JNI介绍 JNI是Java Native Interface的缩写,JNI不是Android专有的东西,它是从Java继承而来,但是在Android中,JNI的作用和重要性大大增强。 JNI在Android中起着连接Java和C/C++层的作...

天王盖地虎626
昨天
3
0
大数据教程(11.8)Hive1.2.2简介&初体验

上一篇文章分析了Hive1.2.2的安装,本节博主将分享Hive的体验&Hive服务端和客户端的使用方法。 一、Hive与hadoop直接的关系 Hive利用HDFS存储数据,利用MapReduce查询数据。 二、Hive与传统数...

em_aaron
昨天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部