本文目录一览:

怎样用Excel做数据分析

前言

最近松懈了,花了很多时间在玩游戏看视频上,把学习计划耽搁了,总说要自律,但光说不做是没用的,最主要是自控能力太差了,得承认自己和大多数人一样,爱玩、不愿意迈出舒适区,“知行合一”,只四个字,大道至简,却超过99%的人都做不到。在前进的路上,希望自己能克服惰性,提升自控力,按计划耐心学习并践行。

1、数据分析步骤:

提出问题→理解数据→数据清洗→构建模型→数据可视化

2、实践案例:

利用一份招聘网站的数据作为实战案例。

第一步提出问题:

1)在哪些城市找到数据分师工作的机会比较大?

2)数据分师的薪水如何?

3)根据工作经验的不同,薪酬是怎样变化的?

第二步理解数据:

初始数据有6875条,14项内容。

设置表格列宽(步骤如下图),显示全部内容,方便后续操作,最后保存。

第三步清洗数据:

这一步需要花费的时间占大部分,把数据处理成自己想要的样子。

1、选择子集:选择公司全名和公司ID两列并隐藏(取消隐藏方法:全选表格→开始→格式→隐藏和取消隐藏→取消隐藏列)

2、列名重命名:双击列名可以修改成自己想要的列名。

3、删除重复值:选择职位ID将其重复值删除(步骤如下图)

4、缺失值处理:选择职位ID列计数5032,选择城市列计数5030,城市列缺失两个数据。

查找并定位城市列的缺失值(步骤如下图),缺失值填上海。

缺失值处理的4种方法,根据情况灵活使用:

1)通过人工手动补全;

2)删除缺失的数据;

3)用平均值代替缺失值;

4)用统计模型计算出的值去代替缺失值。

5、一致化处理:对“公司所属领域”进行一致化处理(步骤如下图)

将原来的“公司所属领域”列隐藏,并将复制的列进行分列:

6、数据排序:

7、异常值处理:

第四步构建模型

第五步数据可视化

通过上面的分析,我们可以得到的以下分析结论有:

1)数据分析这一岗位,有大量的工作机会集中在北上广深以及新一线城市,如果你将来去这些城市找工作,可以提高你成功的条件概率。

2)从待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。

3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年。

对于数据分析师来说,5年似乎是个瓶颈期,如果在5年之内没有提升自己的能力,大概以后的竞争压力会比较大。

4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。

3、划重点:

1)分列功能会覆盖掉右列单元格,所以我们记得先要复制这一列到最后一个空白列的地方,再进行分列操作。

2)上面图片中的函数:IF(COUNT(FIND({"数据运营","数据分析","分析师"},L2)),"是","否")。

3)Ctrl+Eneter快捷键,在不连续的单元格中同时输入同一个数据或公式时很好用。

4)精确查找和近似查找(模糊查找)的区别

(1)精确查找是指从第一行开始往最后一行逐个查找。一找到匹配项就停止查询,所以返回找到的第一个值。

(2)当你要近似查找的时候,它就会苦逼地查遍所有的数据,返回的是最后一个匹配到的值。

5)在使用vlookup函数时,在很多情况下使用的是精确匹配,而在进行分组时需要用模糊匹配,所以这里要输入“1”来进行模糊匹配。

6)Excel设置了快捷键F4帮助用户迅速切换相对引用、绝对引用和混合引用,步骤如下:

(1)选定包含该公式的单元格;

(2)在编辑栏中选择要更改的公式内容,并按 F4 键;

(3)以引用单元格A1为例,每次按 F4 键时,Excel会依次在以下组合间切换:

按一次F4是绝对引用

按两次、三次F4是混合引用

按四次F4是相对引用

7)使用这个函数过程中,如果出现错误标识“#N/A”,一般是3个原因导致:

(1)第2个参数:查找范围里第一列的值必须是要查找的值。

比如这个案例里第2个参数选定的的范围里第一列是姓名,是要查找值的列。

(2)数据存在空格,此时可以嵌套使用TRIM函数将空格批量删除。

(3)数据类型或格式不一致,此时将数据类型或格式转为一致即可。

excel数据模拟分析在哪里

excel模拟分析是在数据一栏,但是你如果没有找到的话,那么说明没有加载这个加载项,所以你应该点击文件,再点击加载项,点击模拟分析,点击转到。

【玩转 Excel】模拟运算表

Excel 有着强大的内置公式。但有时在做数据分析的时候,我们想看到在输入值不同的时候,公式的结果又会发生什么改变;有时我们想重复进行某个运算,最后看到运算的结果。

虽然通过“$”号固定公式再拖动,也可以达到类似的效果,但过于麻烦。如果定位错了公式,就会导致整个数据表计算结果错误。那么怎样才能快速、准确的方法进行模拟运算呢?

模拟运算表就是Excel里面操作这类模拟运算的捷径。模拟运算表功能可以在 数据预测分析模拟运算表 中找到。

模拟运算表的操作非常简单,只需要两个参数:引用行的单元格和引用列的单元格。这两个参数的含义和用法将在之后的实例中讲解。

模拟运算表的基本原理是在表格左上角写上公式,然后行的改变对应“引用行的单元格”,列的改变对应“引用列的单元格”,最后将计算结果输出到表格矩阵当中。

如果模拟运算中只希望一个变量发生改变,那么就适合单一变量的模拟运算表。

以贷款计算为例。假设想要计算一笔20,000美元的贷款,3年按月等额还款。现在想知道,在不同利率下,每月还款额会发生什么变化。

利用Excel的PMT公式,可以很快得出一个情况下的结果:

那么,我们想改变利率的值,看不同利率下的还款额的多少。利用模拟运算表,可以如下建立一个利率变化表。注意第一行留出一行,以便引用公式。

在模拟运算表的第一行,引用刚才的公式。

在“还款额”列中第一行用“=”引用刚刚的PMT公式:

或者直接输入公式

总之,在模拟运算表的第一行,一定要有一个引用了其他单元格的公式,否则Excel就不知道你要变化什么参数了哦。

(1)选中表格。这一步非常容易出错,总的方针就是, 注意不要选中标题行,注意不要选中标题行,注意不要选中标题行!! 因为标题行是我们用来可视化的,Excel在计算时并不能把文字纳入计算范围,所以千万不要选中文字哦;

(2)数据预测分析模拟运算表;

(3)因为我们把利率变化放在了列上,因此在“引用列的单元格”中选择PMT公式里的利率;

(4)点确定,生成模拟运算表。

完成!

如果是转置的表格,那么在参数里应该填引用行的单元格。

还是贷款的例子,这时候引入一个新的变量。我们想知道,如果还款期限和利率同时变化,那么每期的还款额会怎么变化呢?

双变量的情况时,操作与单变量的时候相同。那么这次我们稍微简化下步骤,更快得到结果。

如图。我们将矩阵的行作为还款期限的变化参数,将列作为利率的变化参数。

在表格的 左上角 输入我们要计算的PMT公式:

注意,这个“左上角”非常重要,公式必须写在行和列的交汇处。

双因子运算跟单因子运算的步骤相同。

(1)选中表格。注意框选的范围

(2)数据预测分析模拟运算表

(3)因为行代表还款期限的变化,列代表利率的变化。因此在“引用行”中填写还款期限的引用,在“引用列”中填写利率的变动

(4)点确定,生成模拟运算表

完成!

由于电脑性能不同,在计算双变量模拟的时候可能有些电脑的时间比较久。 此时注意不要点鼠标左键或者按Esc键打断计算 ,等Excel计算完成时,会自动将计算结果呈现在表格中。

如果计算结果中出现了很多“0”值,特别是前面的数据都正常,后面的数据出现了大量“0”,那可能是由于误操作打断了Excel的计算。此时请删掉表格数据,重新计算。

除了改变公式变量的模拟运算,模拟运算表还能帮我们做什么呢?其实模拟运算表还存在一种“隐藏功能”,那就是重复模拟运算。

假设我们举办一个掷骰子比赛,两个人比赛谁的点数大。点数较大的人可以赢得一定的金钱奖励。这个掷骰子的过程重复100次,我们想用Excel模拟生成每次比赛的结果,最后算出A赢了多少钱。

我们可以选择拖动公式来重复100次模拟,但如果1000次,10000次呢?在较大数据量下的模拟用手动操作比较辛苦。这种重复模拟过程也可以用模拟运算表来实现。

首先,我们假设有两个骰子。用RANDBETWEEN()函数就可以每一次刷新(Excel的刷新键是F9)就得到一个新的随机数。

之后,我们生成一个1-100的序列。一个生成序列的简单方式,就是先输入序列的首位值,并保持选中状态:

开始填充序列

在序列中选择按列产生,等差类型,步长和终止值。

确认,就可以直接得到1-100的序列。

在完成序列之后,我们在第一行输入判断语句。

注意输入时,一定要在1前面空一行,因为模拟运算表不能把“序列”文字计算在内。

之后,按照单变量模拟的步骤,选中运算表后,选择模拟运算表。在输入参数时,随便找一个空白的单元格,填入“引用列的单元格”(因为我们的次数序列填在了列上)

确认,即可完成!之后就可以利用模拟结果进行统计分析。

EXCEL怎样进行数据模拟分析

这个太广泛了。例如使用图表进行分析;数据分析工具进行分析等等。添加分析工具的步骤(以excel2007为例):1、点击左上角office按钮,选择excel选项;2、在对话框左侧选择“加载项”,在右侧列表中选择“分析工具库”,点击“转到…”按钮;3、勾寻分...

怎么用excel的模拟分析

推荐一下Excel常用电子表格公式大全

1、 查找重复内容公式:=IF(COUNTIF(A:A,A2)1,"重复","")。

2、 用出生年月来计算年龄公式:=TRUNC((DAYS360(H6,"2009/8/30",FALSE))/360,0)。

3、 从输入的18位身份证号的出生年月计算公式:=CONCATENATE(MID(E2,7,4),"/",MID(E2,11,2),"/",MID(E2,13,2))。

4、 从输入的身份证号码内让系统自动提取性别,可以输入以下公式:

=IF(LEN(C2)=15,IF(MOD(MID(C2,15,1),2)=1,"男","女"),IF(MOD(MID(C2,17,1),2)=1,"男","女"))公式内的“C2”代表的是输入身份证号码的单元格。

1、求和: =SUM(K2:K56) ——对K2到K56这一区域进行求和;

2、平均数: =AVERAGE(K2:K56) ——对K2 K56这一区域求平均数;

3、排名: =RANK(K2,K$2:K$56) ——对55名学生的成绩进行排名;

4、等级: =IF(K2=85,"优",IF(K2=74,"良",IF(K2=60,"及格","不及格")))

5、学期总评: =K2*0.3+M2*0.3+N2*0.4 ——假设K列、M列和N列分别存放着学生的“平时总评”、“期中”、“期末”三项成绩;

6、最高分: =MAX(K2:K56) ——求K2到K56区域(55名学生)的最高分;

7、最低分: =MIN(K2:K56) ——求K2到K56区域(55名学生)的最低分;

8、分数段人数统计:

(1) =COUNTIF(K2:K56,"100") ——求K2到K56区域100分的人数;假设把结果存放于K57单元格;

(2) =COUNTIF(K2:K56,"=95")-K57 ——求K2到K56区域95~99.5分的人数;假设把结果存放于K58单元格;

(3)=COUNTIF(K2:K56,"=90")-SUM(K57:K58) ——求K2到K56区域90~94.5分的人数;假设把结果存放于K59单元格;

(4)=COUNTIF(K2:K56,"=85")-SUM(K57:K59) ——求K2到K56区域85~89.5分的人数;假设把结果存放于K60单元格;

(5)=COUNTIF(K2:K56,"=70")-SUM(K57:K60) ——求K2到K56区域70~84.5分的人数;假设把结果存放于K61单元格;

(6)=COUNTIF(K2:K56,"=60")-SUM(K57:K61) ——求K2到K56区域60~69.5分的人数;假设把结果存放于K62单元格;

(7) =COUNTIF(K2:K56,"60") ——求K2到K56区域60分以下的人数;假设把结果存放于K63单元格;

说明:COUNTIF函数也可计算某一区域男、女生人数。

如:=COUNTIF(C2:C351,"男") ——求C2到C351区域(共350人)男性人数;

9、优秀率: =SUM(K57:K60)/55*100

10、及格率: =SUM(K57:K62)/55*100

11、标准差: =STDEV(K2:K56) ——求K2到K56区域(55人)的成绩波动情况(数值越小,说明该班学生间的成绩差异较小,反之,说明该班存在两极分化);

12、条件求和: =SUMIF(B2:B56,"男",K2:K56) ——假设B列存放学生的性别,K列存放学生的分数,则此函数返回的结果表示求该班男生的成绩之和;

13、多条件求和: {=SUM(IF(C3:C322="男",IF(G3:G322=1,1,0)))} ——假设C列(C3:C322区域)存放学生的性别,G列(G3:G322区域)存放学生所在班级代码(1、2、3、4、5),则此函数返回的结果表示求一班的男生人数;这是一个数组函数,输完后要按Ctrl+Shift+Enter组合键(产生“{……}”)。“{}”不能手工输入,只能用组合键产生。

14、根据出生日期自动计算周岁:=TRUNC((DAYS360(D3,NOW( )))/360,0)

———假设D列存放学生的出生日期,E列输入该函数后则产生该生的周岁。

15、在Word中三个小窍门:

①连续输入三个“~”可得一条波浪线。

②连续输入三个“-”可得一条直线。

连续输入三个“=”可得一条双直线。

一、excel中当某一单元格符合特定条件,如何在另一单元格显示特定的颜色比如:

A1〉1时,C1显示红色

0A11时,C1显示绿色

A10时,C1显示黄色

方法如下:

1、单元击C1单元格,点“格式”“条件格式”,条件1设为:

公式 =A1=1

2、点“格式”-“字体”-“颜色”,点击红色后点“确定”。

条件2设为:

公式 =AND(A10,A11)

3、点“格式”-“字体”-“颜色”,点击绿色后点“确定”。

条件3设为:

公式 =A10

点“格式”-“字体”-“颜色”,点击黄色后点“确定”。

4、三个条件设定好后,点“确定”即出。

二、EXCEL中如何控制每列数据的长度并避免重复录入

1、用数据有效性定义数据长度。

用鼠标选定你要输入的数据范围,点"数据"-"有效性"-"设置","有效性条件"设成"允许""文本长度""等于""5"(具体条件可根据你的需要改变)。

还可以定义一些提示信息、出错警告信息和是否打开中文输入法等,定义好后点"确定"。

2、用条件格式避免重复。

选定A列,点"格式"-"条件格式",将条件设成“公式=COUNTIF($A:$A,$A1)1”,点"格式"-"字体"-"颜色",选定红色后点两次"确定"。

这样设定好后你输入数据如果长度不对会有提示,如果数据重复字体将会变成红色。

三、在EXCEL中如何把B列与A列不同之处标识出来?

(一)、如果是要求A、B两列的同一行数据相比较:

假定第一行为表头,单击A2单元格,点“格式”-“条件格式”,将条件设为:

“单元格数值” “不等于”=B2

点“格式”-“字体”-“颜色”,选中红色,点两次“确定”。

用格式刷将A2单元格的条件格式向下复制。

B列可参照此方法设置。

(二)、如果是A列与B列整体比较(即相同数据不在同一行):

假定第一行为表头,单击A2单元格,点“格式”-“条件格式”,将条件设为:

“公式”=COUNTIF($B:$B,$A2)=0

点“格式”-“字体”-“颜色”,选中红色,点两次“确定”。

用格式刷将A2单元格的条件格式向下复制。

B列可参照此方法设置。

按以上方法设置后,AB列均有的数据不着色,A列有B列无或者B列有A列无的数据标记为红色字体。

四、EXCEL中怎样批量地处理按行排序

假定有大量的数据(数值),需要将每一行按从大到小排序,如何操作?

由于按行排序与按列排序都是只能有一个主关键字,主关键字相同时才能按次关键字排序。所以,这一问题不能用排序来解决。解决方法如下:

1、假定你的数据在A至E列,请在F1单元格输入公式:

=LARGE($A1:$E1,COLUMN(A1))

用填充柄将公式向右向下复制到相应范围。

你原有数据将按行从大到小排序出现在F至J列。如有需要可用“选择性粘贴/数值”复制到其他地方。

注:第1步的公式可根据你的实际情况(数据范围)作相应的修改。如果要从小到大排序,公式改为:=SMALL($A1:$E1,COLUMN(A1))

五、巧用函数组合进行多条件的计数统计

例:第一行为表头,A列是“姓名”,B列是“班级”,C列是“语文成绩”,D列是“录取结果”,现在要统计“班级”为“二”,“语文成绩”大于等于104,“录取结果”为“重本”的人数。统计结果存放在本工作表的其他列。

公式如下:

=SUM(IF((B2:B9999="二")*(C2:C9999=104)*(D2:D9999="重本"),1,0))

输入完公式后按Ctrl+Shift+Enter键,让它自动加上数组公式符号"{}"。

六、如何判断单元格里是否包含指定文本?

假定对A1单元格进行判断有无"指定文本",以下任一公式均可:

=IF(COUNTIF(A1,"*""指定文本""*")=1,"有","无")

=IF(ISERROR(FIND("指定文本",A1,1)),"无","有")

求某一区域内不重复的数据个数

例如求A1:A100范围内不重复数据的个数,某个数重复多次出现只算一个。有两种计算方法:

一是利用数组公式:

=SUM(1/COUNTIF(A1:A100,A1:A100))

输入完公式后按Ctrl+Shift+Enter键,让它自动加上数组公式符号"{}"。

二是利用乘积求和函数:

=SUMPRODUCT(1/COUNTIF(A1:A100,A1:A100))

七、一个工作薄中有许多工作表如何快速整理出一个目录工作表

1、用宏3.0取出各工作表的名称,方法:

Ctrl+F3出现自定义名称对话框,取名为X,在“引用位置”框中输入:

=MID(GET.WORKBOOK(1),FIND("]",GET.WORKBOOK(1))+1,100)

确定

2、用HYPERLINK函数批量插入连接,方法:

在目录工作表(一般为第一个sheet)的A2单元格输入公式:

=HYPERLINK("#'"INDEX(X,ROW())"'!A1",INDEX(X,ROW()))

将公式向下填充,直到出错为止,目录就生成了。

excel中的数据分析功能在哪

1、点左上角的“文件”,在“excel选项”的“加载项”中,将“非活动应用程序加载项”下的“分析工具库”选中,通过下面的“转到”excel加载项,确定;

2、在“数据”选项下的“分析”中,找到新添加的“数据分析”,点击后,会出现“分析工具”,根据需要选择相应的分析工具,即可;

3、“数据”选项下的“模拟分析”中,存在着“方案管理器”“单变量求解”和“模拟运算表”,请根据需要调用“分析工具”或“模拟分析”