本文概述
在大数据世界中, 有许多工具可供选择。但是, 数据透视表是组织和分析数据的最简单有效的方法之一, 可让你从数据中获得有价值的见解。
在最基本的级别上, 可以为任何类型的行和列格式的数据创建数据透视表。数据透视表将读取此数据, 然后使你可以过滤, 排序, 小计, 分析源数据以及可以从数据中提取的各种其他功能。
根据Wikipedia的说法, “数据透视表是一种统计信息表, 它汇总了更广泛的表的数据(例如来自数据库, 电子表格或商业智能程序的数据)。此摘要可能包括总和, 平均值或其他统计信息, 其中数据透视表以有意义的方式组合在一起。数据透视表是数据处理中的一种技术。它们使人能够安排和重新排列(或”透视”)统计信息, 以引起对有用信息的关注。”
创建数据透视表非常容易, 因为它只需单击几下鼠标, 然后再单击几下即可开始组织数据。
数据透视表包含四个类别, 你可以将其拖到字段中以创建数据汇总并获得更多见解。
- 行数
- 列
- 价值观
- 筛选器
下图非常直观地介绍了数据透视表中的每个属性, 以及它们如何帮助你有效地分析和总结数据。
(资源)
关于数据!
你将从一个很好的组织成行和列格式的数据集开始。该特定数据集基于最高总收入列显示了2017年《财富》全球500强中排名前10位的公司。
你将根据此数据集创建数据透视表, 这将使你能够分析其中包含的数据。
注意:请确保你具有有效的Gmail帐户, 一旦你拥有一个帐户, 只需单击此链接并创建一个新的空白电子表格即可。
数据在这里可用。
创建数据透视表!
你可以通过两种方式为此数据集创建数据透视表。
让我们快速了解创建数据透视表的第一种方法。
- 单击数据集中的任何单元格。
- 然后单击数据选项卡, 然后选择数据透视表按钮。这将使数据透视表选择它认为你打算使用的数据集。
- 然后, 这将带你到新的工作表选项卡, 其中将自动为你添加数据透视表的外壳。在屏幕的左侧, 你将看到一个轮廓, 该轮廓显示数据透视表在构建后的显示位置。数据透视表编辑器窗口将出现在右侧, 在数据透视表编辑器窗口的顶部, 你将看到所引用的数据。
现在是验证数据透视表已包含所有预期数据的正确时间。在许多情况下, 数据透视表将代表你自动选择整个数据集, 而你无需做其他任何事情。
让我们快速看一下创建数据透视表的第二种方法:
- 在这里, 你将通过手动选择包括标题的整个数据集范围来选择整个数据集, 然后选择”数据”按钮, 然后选择”数据透视表”。通过手动选择数据集, 你将绕过数据透视表的”自动选择”功能。但是, 它将像以前的方法一样将你带到新的工作表选项卡。
如果数据中完全没有一行怎么办?
如果数据中完全缺少一行, 那么你将不得不使用第二种创建数据透视表的方法, 即手动选择完整的数据集。如果你在数据集中选择一个缺少行的单元格, 则将仅在该行之前创建数据透视表, 并且该数据透视表将无法考虑数据集的其余行。
注意:如果没有完全丢失一行, 并且数据集中有多个空单元格随机散布, 你仍然可以通过单击数据集中的任意位置来创建数据透视表。即使缺少数据, 也不会有任何空行或空列。因此, 数据透视表将能够自动选择整个范围。
整理数据透视表的行和列!
到目前为止, 你已经学习了如何创建数据透视表的外壳, 现在你将学习如何用数据填充数据透视表。尽管有许多选项可用于构建数据透视表, 但第一个选择通常是选择行和列。
你将从在此处创建的工作表选项卡开始, 该选项卡在右侧显示”数据透视表”编辑器, 并在工作表中显示”数据透视表”的空白外壳。
- 首先, 你将选择要在行字段中使用的类别。在数据透视表编辑器中单击行部分旁边的”添加”时, 你将看到一个下拉列表, 其中将包含源数据中的列标题。现在, 当你选择这些类别中的任何一个时, 数据透视表将列出在源数据的该列中找到的所有唯一值。让我们选择行业, 数据透视表将显示原始数据集中包含的所有行业。
现在, 你可以获得全球十大公司的行业列表。
- 接下来, 你将以同样的方式为列字段选择类别。你将在数据透视表编辑器中单击列部分旁边的添加, 然后在下拉菜单中找到相同的列标题列表。让我们选择Year, 然后数据透视表将显示原始数据集中包含的所有年份。
- 你也可以选择多个行或列, 方法是再次单击”添加”并选择另一个类别。在行部分, 我们添加类别名称, 以便将每个公司的名称列在每个行业的下方。同样, 通过将”名称”类别拖到”行业”类别上方, 确保在数据透视表编辑器中重新排列类别的顺序。
好吧, 你可以看到, 与前十名中的四家公司相比, 石油精炼行业的表现非常好!
注意:你可以通过单击并拖动彼此之间的字段名称来重新排列行的顺序。你也可以单击并将它们从行拖到列, 或从列拖到行。你也可以通过单击字段名称右上角的X(叉号)来删除字段!
将值添加到数据透视表!
既然你知道如何添加行和列, 下一步就是将值添加到数据透视表中。你选择的值将构成数据透视表的主体。
例如:如果你的数据透视表显示了前十家公司的行业, 则你可能希望查看每家公司的收入。
然后, 数据透视表将对你选择的值执行计算(例如SUM或COUNT), 并使用该计算结果填充数据透视表。
让我们看看如何通过几个简单的步骤即可实现!
- 你将在”值”部分中单击”添加”, 然后选择”收入”。你会注意到, 当选择”收入”时, 它会在数据透视表中显示为”收入总和”, 这意味着数据透视表将为每个行业下的每个条目添加收入。让我们看一下等于495的汽车行业, 你可以将其视为数据透视表, 将该行业的所有收入相加。如果你回到原始来源, 并将汽车行业的所有收入加起来, 则等于495的总和。
让我们找出每个行业的利润!
- 要找到每个行业的利润, 你要做的就是再次单击添加, 然后选择利润, 这将使你一次看到多个价值。这将使你获得更多的见解, 因为收入最高的行业可能不一定具有最高的利润。
尽管通常要首先选择行和列, 但”值”字段通常是数据透视表的主要考虑因素, 因为它包含可帮助你分析数据的数学计算!
在数据透视表中进行过滤
就像将行, 列和值添加到数据透视表一样, 你还可以根据条件过滤数据, 以专注于数据的子集并获得一些有关数据的深入见解。数据透视表中的筛选类似于在SQL中应用选择查询, 在SQL中, 你基于应用于列的条件从表中选择数据的某些部分。
-
在数据透视表中, 你将名称和行业属性添加为行, 并将收入添加为值。
现在是中心部分, 在过滤器中, 选择”收入”列, 然后单击显示所有项目, 然后按条件选择过滤器。在按条件过滤时, 你将选择大于或等于。
- 你将输入240作为值, 这意味着将仅显示属于特定行业的公司, 这些公司的收入总和大于或等于$ 240B。数据透视表编辑器应如下图所示:
- 最后, 让我们找出所有公司的收入均大于或等于$ 240B。
从上图可以看到, 当你过滤掉我的收入少于$ 240B的公司时, 只选择了一部分数据。
走得更远!
如果你能够轻松, 轻松地完成本教程, 那么本教程是对使用电子表格进行数据透视表的很好的介绍!
尝试使用更复杂的数据集进行一些实验, 应用不同的属性, 看看是否可以从数据中获得启发。
还有很多要讲的内容, 所以为什么不参加srcmini的”带有电子表格的数据透视表”课程呢?