一文看懂透视表pivot_table

2024-05-16 03:07

1. 一文看懂透视表pivot_table

 透视表是一种可以对数据 动态排布 并且 分类汇总 的表格格式。或许大多数人都在Excel使用过数据透视表（如下图），也体会到它的强大功能，而在pandas中它被称作pivot_table。
                                           Excel中的数据透视表
   首先读取数据，作为一个老火密，本文将火箭队当家吉祥物James_Harden本赛季比赛数据作为数据集进行讲解，就是下面这个大胡子。
                                                                                   最后5场比赛数据
   pivot_table有四个最重要的参数  index、values、columns、aggfunc  ，本文以这四个参数为中心讲解pivot操作是如何进行。
   每个pivot_table必须拥有一个  index ， 如果想查看哈登对阵每个队伍的得分，首先我们将 对手 设置为  index ： 
                                            对手 成为了第一层索引，还想看看对阵 同一对手在不同主客场下的数据 ，试着将 对手 与 胜负 与 主客场 都设置为 index 
                                           试着交换下它们的顺序，数据结果一样：
                                           看完上面几个操作， Index就是层次字段，要通过透视表获取什么信息就按照相应的顺序设置字段 ，所以在进行pivot之前你也需要足够了解你的数据。
   通过上面的操作，我们获取了james harden在对阵对手时的 所有数据 ，而Values可以对需要的计算数据进行筛选，如果我们只需要james harden在主客场和不同胜负情况下的得分、篮板与助攻三项数据：
                                           aggfunc参数可以设置我们对数据聚合时进行的函数操作。
   当我们未设置aggfunc时，它默认  aggfunc='mean'  计算均值。我们还想要获得james harden在主客场和不同胜负情况下的 总 得分、 总 篮板、 总 助攻时：
                                           Columns类似Index可以设置 列层次字段 ，它不是一个必要参数，作为一种分割数据的可选方式。
                                                                                   我是上表
   你应该理解了pivot_table的用法？是不是在哪见过？
   对，Groupby！
   上面两个函数完全等价，pivot_table仿佛是加入了columns与margin功能的groupby函数，比groupby更加灵活。
   当表格生成后如何查询某一项数据呢？
   ex.根据 上表 查询哈登对阵灰熊时的数据
                                                                                   统计哈登不同主客场与胜负下的场数以及投篮命中率（哈登在主场且胜利的场数以及在这种情况下的投篮命中率）

一文看懂透视表pivot_table

2. excel怎么用数据透视表统计

1.操作步骤
　1.1　选择报表类型“数据透视表”点“下一步”；
　1.2　在“选定区域”输入需处理的单元格点“下一步”；
　1.3　点选“布局”选择条件字段放在“行”或“列”，将需进行统计的字段放在“数据”；
　1.4　双击“数据”上的字段选择“汇总方式”后点“确定”；
　1.5　点“确定”后再点“完成”。
2.其他操作
　2.1　将字段汇总“隐藏”，点右键选择“字段设置”在对话框中选择“分类汇总”为“无”，如需显示则选“自动”。　　　　　　　　　　　　　　　　　　　　
　2.2　如需新增条件字段，点右键“显示字段列表”，将相应的字段拉到现有的透视表行当中，不需该字段则直接拉回。
　2.3　如条件字段中的某项不需显示，点击该字段的下拉按钮将该项前的“勾”去除。如需再次显示只则将又“勾”起。

3. 统计透视表怎么做

以2013版的Excel为例
选中所要分析的的数据，点击左上角【插入】——【数据透视】

2。在弹出的对话中选择放置数据透视表的位置，以放在本页面中为例，点击确定

3.然后拖动字段，选择行，列 以及值，值可以选择计数，求和、均值之类的

4，结果就出现在左侧了，点击标签可以排序的

统计透视表怎么做

4. excel怎么用数据透视表统计

方法/步骤


 打开你需要汇总的EXCEL表格，点击插入里面的数据透视表


 出现数据透视表的数据源选择项，选择你所需要的数据确定，就会出现数据透视表的报表选项


 将你所需要的报表字段，用鼠标左键点住不放，拖入右边的行坐标和数值区域

 一般我们做数据汇总时都是将数据求和，或者求平均数等等，所以这时就要对数值区域的字段进行修改。
选择字段后边的小三角行，点击“值字段设置”，将计算类型修改成你所需要的“求和”或者其它。


 确定后关闭报表，汇总结果就出来了。

 如果说还想要每个业务的每个产品的销售汇总，还可以增加一个行标签。
鼠标放在行列标处，点击右键，显示字段列表，将客户名称拉到行标签处即可



 这样的表格看起来还不是很习惯，可以将鼠标放在“客户名称”处，单击右健，更改“字段设置”，在布局和打印处，选择“以表格形式显示项目标签”即可



8
 如果数据有更改的，更改后，在数据透视表上点击鼠标右健，点击刷新即可

5. 数据分析—一文看懂数据透视表(Excel&Pandas-pivot_table实现）

【导语】也许大多数人都知道Excel中的数据透视表，也体会到了它的强大功能，那么Pandas也提供了一个类似的功能，也就是 pivot_table 。因为考虑到直接学pivot_table会有点难度，所以本篇文章将由浅入深的先通过excel实现透视表，慢慢地过渡到利用pandas来实现。
  
 透视表是一种可以对数据动态排布并且分类汇总的表格格式。利用透视表可以快速地进行分类汇总，自由组合字段聚合计算。
  
 使用数据透视表的一个挑战是，你需要确保你理解你的数据，并清楚地知道你想通过透视表解决什么问题。其实，虽然pivot_table看起来只是一个简单的函数，但是它能够快速地对数据进行强大的分析。
  
 其实非常的简单，只需要选定我们想要进行透视的表，然后点击菜单栏中的插入透视表。
  
 在本文中，将会跟踪一个销售渠道（也称为漏斗）。基本的问题是，一些销售周期很长（可以想一下“企业软件”、“资本设备”等），而管理者想更详细地了解它一整年的情况。
                                          
 其实我们只需要将不同的字段拖入到不同的区域中即可，为了方便展示数据，我们可以右键关键字段，然后将其选择上移，这样我们可以实现数据的多级展示。
                                          
 这里我们注意一个左下角的功能，叫做延迟布局更新，这个当我们的数据量比较大的时候，比如说十万个数据，我们就可以选定这个延迟更新，其实就是设置当我们的字段设置完成之后才进行数据更新，可以最大程度保证我们操作的流畅性。
  
 如果我们对数据透视表的顺序有些不满意，那我们就要按照我们自己的意愿进行顺序的修改，比如说我们选择升序和降序。
                                          
 当然了，我们也可以直接在选定区域的时候直接选择插入一个透视图，一般默认是柱状图。
                                          
 这就是数据透视表与数据透视图的基本操作，这是比较简单的基础内容。
  
 数据透视表可以随时随地进行数据源的更改，数据源变更后进行简单的更新就可反映到数据报表中，有两种方式，第一种是数据透视表刷新：如果数据源中的数值进行了更新，刷新即可。如果是数据源的结构或布局变更了，这时就采用更改数据源的方式。
                                          
 计算字段极大扩展了数据透视表的计算功能，比如原始数据表中有一列数据为销售单价，有一列数据为数量。那么在数据透视表中可以通过计算字段输入公式”=单价*数量“，来求出销售额。
   
                                                                                  
 
  
 pandas中的函数pivot_table可以实现数据透视表，它的参数如下，下面我们来一个个的学习。我们的数据源和上面excel的一样。
                                                                                                                          
 我们将上表中“Status”列定义为category，并按我们想要的查看方式设置顺序（可选）
                                                                                  
 此外，可以有多个索引。实际上，大多数的pivot_table参数可以通过列表获取多个值。
                                          
 我们上面将“Name”，“Rep”列和“Manager”列进行对应分组，那么现在来实现数据聚合。
                                          
 “Price”列会自动计算数据的平均值，但是我们也可以对该列元素进行计数或求和。要添加这些功能，使用aggfunc和np.sum就很容易实现。
                                          
 aggfunc可以包含很多函数，下面就让我们尝试一种方法，即使用numpy中的函数mean和len来进行计算。
                                          
 如果我们想通过不同产品来分析销售情况，那么变量“columns”将允许我们定义一个或多个列。
   pivot_table中一个令人困惑的地方是“columns（列）”和“values（值）”的使用。我们只要记住，变量“columns（列）”是可选的，它提供一种额外的方法来分割你所关心的实际值。然而，聚合函数aggfunc最后是被应用到了变量“values”中你所指定的字段上。
                                          
 结果里有很多NaN，如果想移除它们，我们可以使用“fill_value”将其设置为0。
  
 如何查看一些总和数据呢？相当于excel中的总计，通过“margins=True”就可以为我们实现这种功能。
                                          
 下面，让我们以更高的管理者角度来分析此渠道。根据我们前面对category的定义，注意现在“Status”是如何排序的。
                                          
 为了对你选择的不同值执行不同的函数，你可以向aggfunc传递一个字典。
                                          
 如果只想查看一个管理者（例如Debra Henley）的数据，可以这样过滤：
                                          
 查看所有的暂停（pending）和成功（won）的交易，如下：
                                          
 实现同时过滤多个条件：
                                          
 希望本文的内容对大家的学习或者工作能带来一定的帮助，每天进步一点点，加油❤。

数据分析—一文看懂数据透视表(Excel&Pandas-pivot_table实现）