连击 天
fork: star:
自从学会了Python、R语言、SQL语言、TableauBI工具、Excel等一众数据与数据科学密切相关的工具之后,我在朋友圈里面也算是小有名气了。这不,前些天,一位好友就委托我用自身所学知识简要地帮...
温馨提示: 1. 与数据分析相关的书可以了解一下"电子工业出版社"; 2. 京东或当当有"每满100减50"活动的时候买书比较划算。 01. 构造数据集 02. 单层索引组内排序 # 根据某个字段对聚合出来的...
本文简要展示一下,怎么在pandas中用rank()函数进行数据排名。原理不作赘述,具体用法请看示例: 01. 构造数据集 import pandas as pd df = pd.DataFrame({ "序号":range(1,11), "商品":["苹...
以下是在pandas中实现数据切片的常用脚本。原理不赘述,具体示例如下: 01.构造数据集 # 构造数据源 import pandas as pd df = pd.DataFrame({ "序号":range(1,11), "品类":["水果","水果","...
以下是在MySQL中通过SQL语句实现Excel中数据透视表/交叉表/二维表的功能。原理不作赘述,具体示例与代码如下: 01. 数据源预览 SELECT * FROM pivot_table; 02. 数据透视表 SELECT year AS "...
示例一: import pandas as pd x = pd.DataFrame({"序号":range(1,6), "水果":["A产品", "苹果", "B产品", "西瓜", "香蕉"], "蔬菜":["白菜", "C产品", "土豆", "D产品......
问题: 大家下午好,请教大家一个问题,如何按照某个匹配split字符串之后,得到,每个匹配的信息,比如,第一个匹配是2个N,第二个是3个N,第三个是1个N,这些信息如何获得呢 思路:用分组捕...
# 构造数据源 # 构造数据源 import pandas as pd df = pd.DataFrame({"goods":["苹果","西瓜","香蕉","苹果"], "sale":[100,100,200,100], "amount":[50,100,150,......
在平时做数据处理的时候,如果数据量大,光用Excel打开都困难,更被说合并多个工作簿或多张工作表了。而pandas就能很好地为我们这决这一问题。具体代码如下: # 从Excel加载第一个DataFrame...
构造数据源: # 导入库 import pandas as pd import numpy as np import random # 构造数据集 df = pd.DataFrame({ "A" : ["苹果", "西瓜", "苹果", "雪梨", "荔枝", "菠萝"], "B" : range(1...
箱形图,主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱...
在平时办公中,有时候我们需要把多个数据结构相同的表格,按字段信息批量合并在一起,或做合并计算。如果不想手工一张一张地处理,我们既可以用VBA,又可以用Power Query,还可以用Python。下...
类似SQL中的group by 方法,pandas中的df.groupby() 方法可以按指定字段对 DataFrame 进行分组,生成一个分组器对象,然后再把这个对象的各个字段按一定的聚合方法输出。 1 语法结构 df.gro...
相信很多做数据分析的朋友都发现,在平时做业务分析中,Excel表格是我们使用最频繁的工具。我们还发现,Excel虽然好用,但一旦数据量大了起来,比如处理二三十万条或以上数据量的时候,就会出...
没有更多内容
加载失败,请刷新页面
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复