本文目录一览:

Excel数据分析第五讲(MATCH函数)

在本课程中,我们来学习和掌握 MATCH 函数。

首先说说 MATCH 的语法规则。该函数的语法规则如下:

MATCH (lookup_value, lookup_array,[match_type])

参数

lookup_value 必填参数,需要在 lookup_array 中查找的值。例如,如果要在电话簿中查找某人的电话号码,则应该将姓名作为查找值,但实际上需要的是电话号码。

lookup_value 参数可以为值(数字、文本或逻辑值)或对数字、文本或逻辑值的单元格引用。

lookup_array 必填参数,要搜索的单元格区域。

match_type 可选参数,数字 -1、0 或 1。match_type 参数指定 Excel 如何在  lookup_array 中查找 lookup_value 的值。此参数的默认值为 1。

下表介绍该函数如何根据  match_type 参数的设置查找值:

Match_type :1 或省略,表示MATCH 函数会查找小于或等于  lookup_value 的最大值。lookup_array 参数中的值必须按升序排列,例如:...-2, -1, 0, 1,2, ..., A-Z, FALSE, TRUE。

Match_type :0,表示MATCH 函数会查找等于  lookup_value 的第一个值。 lookup_array 参数中的值可以按任何顺序排列。

Match_type :-1,表示MATCH 函数会查找大于或等于  lookup_value  的最小值。 lookup_array  参数中的值必须按降序排列,例如:TRUE,FALSE, Z-A, ...2, 1, 0, -1, -2, ... 等等。

功能

MATCH  函数可在单元格区域中搜索指定项,然后返回该项在单元格区域中的相对位置。

接下来我们用两个实例来学习如何使用 MATCH 函数。

第一个例子用的示例表格如下。表格列举了从一月到六月份,4个NBA大头公仔的销售情况。

接下来的问题是如何用 MATCH 函数写一个公式计算某个指定公仔产品在某个月份的销售额。首先把B4:G7这个区域命名为 Sales 。然后在C10单元格输入公式 =MATCH(A10,A4:A7,0) ,D10单元格输入公式 =MATCH(B10,B3:G3,0) ,E10单元格输入公式 =INDEX(Sales,C10,D10), 详见下图

使用公式 =MATCH(A10,A4:A7,0) 得到 Kobe 这个产品在被查找区域对应第2行,使用公式 =MATCH(A10,A4:A7,0) 得到 June 这个月在被查找区域对应第6列,最后再使用INDEX函数,使用公式 =INDEX(Sales,C10,D10), 就得到 Kobe 这个公仔产品在 June 这个月的销售数字。

下面再举一个例子说明如何使用 MATCH 函数。下图列出了401个俱乐部球员在2001赛季的薪资。这里的薪资没有被排序。我们的问题是如何使用公式找到薪资最高球员,和薪资排名第5的球员。

解决这个问题的思路如下:

1.    首先使用 MAX 函数找到最高的薪资,使用 LARGE 函数找到第5高的薪资

2.    然后用上面找到的两笔薪资作为被查找的值,使用 MATCH 函数找到这两笔薪资的相对位置

3.    最后使用 VLOOKUP 函数和上一步获得的两笔薪资的相对位置得到这两笔薪资对应的球员名字。

下图是最后得到的结果。从下图中可见,我们在C9单元格输入公式 =MAX(salaries) 得到最高薪资,在D9单元格输入公式 =LARGE(salaries,5) 得到第5高的薪资。然后用获得的这两笔薪资作为 MATCH 函数的输入,使用公式 =MATCH(C9,salaries,0) 和公式 =MATCH(D9,salaries,0) 得到这两笔薪资在薪资范区域的相对位置。最后,我们把获得的两个相对位置作为 VLOOKUP 的输入,使用公式 =VLOOKUP(C8,lookup,2) 和公式 =VLOOKUP(D8,lookup,2) 就得到了最高薪资的球员姓名和薪资排名第5高的球员的姓名。

以上就是今天的课程,大家有什么问题可以给我留言

Excel数据分析常用工具(上)——vlookup函数

Excel表作为日常工作中经常使用的工具之一,可以用来统计数据、数据分析和可视化数据。Excel有很多强大的功能和函数,但日常数据分析用的最多的函数和功能就是:vlookup、sum、if、sumif和数据透视表。基本可以说,如果掌握了这“4+1”的用法,你的Excel熟练程度已经超过80%的办公室白领。

为了让自己更熟练的掌握着“4+1”的用法,所以我就打算分三篇文章对它们的常用方法和场景进行描述,希望对你有些帮助。 :p)

第一篇是vlookup函数的介绍和常用方法,第二篇是对常用函数sum、if、sumif介绍和应用场景,第三篇则是介绍数据透视表的使用方法。

OK,正文开始。

先看看vlookup函数长啥样

VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)

在这一最简单的形式中,VLOOKUP 函数表示:

= VLOOKUP (你想要查找的内容, 要查找的位置, 包含要返回的值的区域中的列号, 返回近似或精确匹配-表示为 1/TRUE 或 0/FALSE)。

是不是觉得好难理解,换成人话是这样子的:

=VLOOKUP(你愁啥,向哪儿瞅,瞅着了是卸胳膊还是卸腿,来真格的还是扯犊子)

由此可见,你需要四条信息才能构建VLOOKUP语法:

1.Lookup_value:要查找的值,也被称为查阅值。

2.table_array:查阅值所在的区域,记住, 查阅值应该始终位于所在区域的第一列 ,这样VLOOKUP才能正常工作,例如,如果查阅值位于单元格 C2 内,那么您的区域应该以 C2 开头。

3.col_index_num:区域中包含返回值的列号,例如, 如果指定 B2: D11 作为区域, 则应将 B 作为第一列, 将 C 作为第二列进行计数, 依此类推。

4.range_lookup:(可选)如果需要返回值的近似匹配,可以指定 1或TRUE;如果需要返回值的精确匹配,则指定 0或FALSE。 如果没有指定任何内容,默认值将始终为 TRUE 或近似匹配。 一般情况下,都会指定为0(FALSE)。如果 range_lookup 为 TRUE 或被省略,则必须按升序排列 table_array 第一列中的值;否则,VLOOKUP可能无法返回正确的值。

CASE1:基础单条件查找

基础单条件查找是vlookup函数最简单的应用,只有单个查阅值,直接使用普通公式就可以解决。如下图:

CASE2:反向查找

但是,如果当待查找列在原检索区域中不是第1列怎么办?这时就需要重新构造一个序列,使得待查找序列在检索区域中的第1列。如下图所示:

总结一下,反向查找的固定用法:

=VLOOKUP(检索关键字, IF({1,0},检索关键字所在列,查找值所在列),2,0)

有关If函数和{1,0}常数序列可参考这里: 我是链接 。

CASE3:多条件查询

另外,在使用VLOOKUP匹配数据的时候,查阅值是复合的(多个组装在一起)该怎么办?那么也可以用“”符号将字段拼接起来,同时利用IF序列公式构建出一个虚拟检索区域。如下图:

总结一下,反向查找的固定用法:

=VLOOKUP(关键字1关键词2,IF({1,0},关键词1所在列关键词2所在列,查找值所在列),2,0)

以上就是VLOOKUP函数常见的几个用法,擅用VLOOKUP能让你处理数据事半功倍!

对于本文有什么问题,欢迎留言~

如何利用Excel做数据分析

Excel是日常工作中最常用的工具,如果不考虑性能和数据量的话,可以应付绝大部分的分析工作。数据分析的最终目的是解决我们生活和工作中遇到的问题,明确的问题为数据分析提供了目标和方向。

Excel数据分析步骤分为:明确问题-理解数据-清洗数据-数据分析或构建模型-数据可视化。

一、明确问题

以上篇文章中提到的淘宝和天猫婴儿用品数据为数据集来进行数据分析。

1、在一级分类商品中,哪个商品销量最好,在此分类下,哪个子分类最受欢迎?

2、不同季度对用户购买行为有什么影响?

2、不同年龄对用户购买行为有什么影响?

3、不同性别对用户购买行为有什么影响?

二、理解数据

参考 沐沐:描述统计分析 理解数据集部分

三、数据清洗

数据清洗步骤为:选择子集-列名重命名-删除重复值-缺失值处理-一致化处理-数据排序-异常值处理。

1、选择子集

有时候原始数据量过大,有时候并不需要全部字段,我们可以将不需要用到的字段进行隐藏,为了保证数据的完整性,尽量不要删除数据。从问题中我们可以发现购买商品表中的商品属性对于我们分析数据没什么帮助,可以将其隐藏(选中商品属性列-右击-选择隐藏)。

2、列名重命名

我们可以将原始数据集的英文字段改成中文字段,方便阅读和理解,双击列名直接修改即可。

3、删除重复值

从购买商品表和婴儿信息表示中可知,如果全部字段重复,我们才认为数据是有重复的,从操作来看,是没有重复值的。

4、缺失值处理

可以看总共有多少行数据,然后鼠标选中列来看缺少多少数值。如果有缺失值,我们可以用定位找到缺失值(选中列-F5-定位条件-空值)。未找到缺失值。

5、一致化处理

对数据列的数据格式进行统一处理。数据中的购买时间列和出生日期列为常规格式,我们需要转换为日期类型(选中列-右击-设置单元格格式-日期),然后再选中列-分列-下一步-下一步-列数据格式:日期:YMD-完成。

6、数据排序

我们通过对购买次数列进行降序排序,发现用户‘2288344467’在2014年11月13日购买了10000份的‘50018831’二级分类、‘50014815’一级分类商品。

7、异常值处理

通过数据透视表没有每列数据中的异常值。

至此,我们已经得到分析问题的数据了,下一步,利用Excel中的数据透视、函数和分析工具来进行数据分析来解决我们的业务问题了。

1、在一级分类商品中,哪个商品销量最好,在此分类下,哪个子分类最受欢迎?

将商品一级分类放在行标签,值为购买数量的求和项,得出最受欢迎的一级商品为28,购买数量为28545。

在此分类下,即在一级分类28商品下,最受欢迎的是哪类二级商品?

2、季度对用户购买行为有什么影响?即看每个季度销量怎么样?

从数据透视结果来看,我们发现,12-14年的第四季度在该年的销售量都是最高的。

3、不同年龄对用户购买行为有什么影响?

在分析这个问题之前,我们需要将一级分类商品和二级分类商品用Vlookup函数V到婴儿信息表中,然后计算出婴儿的年龄。

根据计算出的数据透视出来各年龄段的购买量为:从透视表中我们可以看出4岁以前的婴儿为主要用户群体。

从婴儿不同年龄段购买二级商品数量来看,各年龄段最受用户欢迎的二级商品如下图所示:

4、不同性别对用户购买行为有什么影响?

我们可以看出男婴儿和女婴儿的人数相差小,但是女婴儿的购买数量将近是男婴儿的两倍。

最受男女婴儿欢迎的二级分类商品的TOP5

此外,我们还可以看出最受男女婴儿欢迎的二级分类商品TOP5。