文档章节

pandas操作

Scofieldxs
 Scofieldxs
发布于 2017/07/21 11:03
字数 149
阅读 3
收藏 0
  1. 排序: sort_values df.sort_values(['query_count'],ascending=False)[:20] # 根据query_count列排序,降序

  2. 删除一行,一列:drop df.drop([1504369],inplace=True) # 删除第1504369行元素,inplace=True:不生成新的dataframe

     df.drop(df.columns[-1],axis=1,inplace=True)
     # 删除最后一列
    
  3. 定位到具体行列: loc df.loc[:20,df.columns[2:20]] # 前20行,2-20列

  4. 查看两列关系 train[['Title', 'Survived']].groupby(['Title'], as_index=False).mean()

  5. 离散值一一对应做转换:map dataset['Sex'] = dataset['Sex'].map( {'female': 0, 'male': 1} ).astype(int)

  6. 连续之离散化 dataset.loc[(dataset['Fare'] > 7.91) & (dataset['Fare'] <= 14.454), 'Fare'] = 1

  7. 连续值离散化: cut ser = Series(np.random.randint(1,10,6)) bins = [0,3,6,9] cats = pd.cut(ser,bins,labels=['small','middle','large'])

© 著作权归作者所有

共有 人打赏支持
Scofieldxs
粉丝 3
博文 24
码字总数 26524
作品 0
海淀
Pandas初学者代码优化指南

原文:A Beginner’s Guide to Optimizing Pandas Code for Speed 作者:Sofia Heisler 翻译:无阻我飞扬 摘要:Pandas 是Python Data Analysis Library的简写,它是为了解决数据分析任务而创...

dev_csdn
2017/11/21
0
0
机器学习基础 --- pandas的基本使用

一、pandas的简介   Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操...

码农47
04/22
0
0
Pandas系列6-DataFrame的分组与聚合

在对数据进行处理的时候,分组与聚合是非常常用的操作。在Pandas中此类操作主要是通过groupby函数来完成的。 先看一个实际的例子: 通过groupby函数生成一个groupby对象,如下: 整个分组统计...

geekpy
07/23
0
0
Python数据分析(一) 关于pandas和numpy

自己在使用pandas和numpy处理数据的时候,遇到了很多坑,运用不熟练,在探索的过程中找到以下文章,本来自己想整理这些知识点,但是返现,可能自己写出来的效果差不多,并且以下文章整理很全...

致Great
04/14
0
0
Pandas数据结构详解 | 轻松玩转Pandas(1)

教你学会 Pandas 不是我的目的,教你轻松玩转 Pandas 才是我的目的。我会通过一系列实例来带入 Pandas 的知识点,让你在学习 Pandas 的路上不再枯燥。 声明:我所写的轻松玩转 Pandas 教程都...

王伟_同学
06/28
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

(一)软件测试专题——之Linux常用命令篇01

本文永久更新地址:https://my.oschina.net/bysu/blog/1931063 【若要到岸,请摇船:开源中国 不最醉不龟归】 Linux的历史之类的很多书籍都习惯把它的今生来世,祖宗十八代都扒出来,美其名曰...

不最醉不龟归
22分钟前
6
0
蚂蚁金服Java开发三面

8月20号晚上8点进行了蚂蚁金服Java开发岗的第三面,下面开始: 自我介绍(要求从实践过程以及技术背景角度着重介绍) 实习经历,说说你在公司实习所做的事情,学到了什么 关于你们的交易平台...

edwardGe
28分钟前
7
0
TypeScript基础入门 - 函数 - this(三)

转载 TypeScript基础入门 - 函数 - this(三) 项目实践仓库 https://github.com/durban89/typescript_demo.gittag: 1.2.4 为了保证后面的学习演示需要安装下ts-node,这样后面的每个操作都能...

durban
38分钟前
0
0
Spark core基础

Spark RDD的五大特性 RDD是由一系列的Partition组成的,如果Spark计算的数据是在HDFS上那么partition个数是与block数一致(大多数情况) RDD是有一系列的依赖关系,有利于Spark计算的容错 RDD中每...

张泽立
46分钟前
0
0
如何搭建Keepalived+Nginx+Tomcat高可用负载均衡架构

一.概述 初期的互联网企业由于业务量较小,所以一般单机部署,实现单点访问即可满足业务的需求,这也是最简单的部署方式,但是随着业务的不断扩大,系统的访问量逐渐的上升,单机部署的模式已...

Java大蜗牛
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部