从数据到Excel自动化报表:Power Query和Power Pivot实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 分组依据:“分类汇总”的利器

小勤:Power Query里怎么做“分类汇总”?

大海:分类汇总?你说的是像 Excel里的分类汇总功能?

小勤:对的。如对数据先进行排序,然后再做分类汇总。

大海:从数据分析的角度来看,分类汇总后,汇总数据和明细数据是混合在一起的,有点儿“拖泥带水”的感觉,会在一定程度上破坏数据源表的结构,给后续数据分析造成一定的障碍。所以,其实我并不建议使用这个功能。在Power Query里有个类似的功能——“分组依据”,其在数据处理过程中非常有用。下面通过一个简单的例子来学习这个功能,以后还要用更多案例来加以巩固。案例的数据源如图3-8所示。

先来看看汇总到“品类”的情况。

Step 01 以“从表格”的方式获取数据到Power Query中,切换到“转换”选项卡,单击“分组依据”按钮,如图3-9所示。

图3-8 待分组数据

图3-9 分组操作

Step 02 在弹出的对话框中选择分组依据为“品类”,“新列名”和“操作”直接采用默认值,单击“确定”按钮,如图3-10所示。

分组后的结果如图3-11所示。

图3-10 设置分组依据

图3-11 分组结果

仅对一个列进行分组的操作很简单,但在实际工作中通常需要对数据按多列进行分组,因此,我们可以对前面生成的简单分组进行修改。

Step 03 在Power Query窗口右侧“查询设置”的“应用的步骤”中单击“分组的行”后的设置按钮,如图3-12所示。

Step 04 在弹出的对话框中选择“高级”单选框,如图3-13所示。

图3-12 修改分组步骤

图3-13 切换分组依据的“高级”选项

此时,该对话框中增加了“添加分组”和“添加聚合”按钮,如图3-14所示。

图3-14 分组依据“高级”选项对话框

Step 05 在“分组依据”中勾选“高级”单选框,然后单击“添加分组”按钮,在增加的“分组依据”下拉列表中选择“细类”,如图3-15所示。

图3-15 在“分组依据”对话框中添加分组

Step 06 在“分组依据”对话框的“高级”选项中单击“添加聚合”按钮,并将对话框中的“新列名”分别设置为“销售量”和“金额”,“操作”均选择为“求和”,“列”分别选择“销售量”和“金额”,单击“确定”按钮,如图3-16所示。

将对“品类”和“细类”的“销售量”和“金额”进行求和汇总,结果如图3-17所示。

图3-16 在“分组依据”对话框的“设置”选项中添加聚合方法

图3-17 高级分组结果

小勤:Power Query里的分组依据跟Excel里的分类汇总好像有点儿像,但不需要先进行排序操作,得到的结果是分类汇总后的结果数,不再包括明细项目。

大海:对。另外,这与Excel中只有“行”项目的数据透视功能也十分类似,你可以对比以加深理解。

知识点延伸:关于“聚合”

小勤:大海,在“分组依据”对话框里有一个“添加聚合”的按钮,“聚合”是什么意思啊?

大海:所谓“聚合”是对数据的常见统计方式的一个统称,比如求和、最大值、最小值、计数……类似于数据透视表里的“值汇总方式”,如图3-18所示。

图3-18 数据透视的值汇总方式

小勤:原来是这样,为什么不都用“值汇总方式”的叫法呢?突然搞个专业名词让人容易懵。

大海:“聚合”其实是大部分专业软件里的统一叫法,以后你在深入接触Power Query、Power Pivot、Power BI,以及其他专业的数据库、数据分析软件时,可能都会用到“聚合”的概念。比如,你会看到“聚合函数”,其实指的就是求和、最大值、最小值等一系列函数的统称……所以,知道这个概念其实是很有用的。

小勤:好的,记住了。