本文目录一览:
- 1、如何使用EXCEL 进行数据处理
- 2、excel数据分析?
- 3、excel数据处理与分析课程目的
- 4、一般用excel怎么做数据分析
- 5、【数据分析】Excel数据分析全流程
- 6、怎样用Excel做数据分析
如何使用EXCEL 进行数据处理
链接:
提取码:raig
秋叶Excel数据处理学习班。不熬夜不加班的Excel数据管理术,在想要提升处理数据表格能力的学习期80%的人都会被以下问题困扰,很多效果明明就能用软件功能快速实现,比如一键求和、数据分列合并,但是因为不知道,总觉得很困难?本套课程可以帮助你深入了解Excel数据处理方法更全面系统理解快速解决思路。通过学习本套课程让你告别Excel小白,秒变Excel数据分析大牛。
课程目录:
SUM函数基本用法
COUNTIF函数
Match函数的基本用法
INDEX函数的基本用法
VLOOKUP函数的基本用法
用图标集表示数据升降
.....
excel数据分析?
昨天,有个搞电商的朋友向我抱怨,说用Excel处理数据实在太难了,不仅加载慢容易崩,而且改一下字段就要重新传输,麻烦的要命!
天天用Excel做表的朋友们应该深有体会。就拿电商来说,每天都要产生巨量的销售数据,像下单数量、下单金额、支付金额、交易失败金额等等,随随便便就是上万条。
运气好的情况下,能够安全导出为Excel,传输给业务部门。
运气不好的时候,导出卡顿、数据缺失,再遇到业务部门想要新增或修改字段,那就要重新导出,重新传Excel,来来回回,半天过去了,才把数据传输好。
Excel作为办公软件是当之无愧的第一,但在数据量暴增的情况下,大家对于实时性和协同性的要求越来越高,Excel的不足也逐渐暴露出来。而微软官方也早就给大家想好了办法,他们推出了BI工具——比 Excel 更加简单的小白工具。可见,学着用BI工具是必然的。
这边以国内市场占有率第一的Fine BI(文末可领取激活码)为例,对比Excel,看一下BI软件的优势之处。
1、数据处理能力
Excel的数据处理能力一直被人诟病。即使很多人辩解:是你不会用,才觉得Excel处理不了几万条数据。但事实证明对于大多数用户来说,确实无法用Excel处理海量数据。并且,Excel文件在传递的过程中,免不了误改数字、格式等情况,对于最后统计的人来说是一件头疼的事。
BI软件则可以直接从数据库取数,支持的数据库类型丰富。并且,对于Fine BI来说,处理上万条数据是非常容易的事情,如果你每天都要处理上万条数据,还是用Fine BI吧,个人版是免费的。
2、数据协同能力
Excel作为一种基于文件的数据处理工具,在数据共享、协同办公方面存在着天生的缺陷,大家在使用Excel时通常只能通过U盘、邮件,或者通过QQ、微信之类的IM工具,将文档传来传去。如果每天要传几十个文件,那真是谁用谁头疼。
BI软件更多考虑到了办公协同问题,Fine BI通过权限控制,让每一个需要协同办公的用户都可以在充分授权的情况下很方便地操作同一份数据,大量减少IT取数工作。操作的结果也可以通过浏览器实时直观呈现。如果想将数据分享给别人,也能通过链接的形式直接分享,对方打开链接就能查看。
3、数据安全性能
Excel对于数据安全保护很不健全,只能通过设置密码控制,没办法对用户进行角色的管理,也不能对数据进行层级的访问限制。
BI工具通过管理控制台,对不同用户、不同数据、不同报表都进行了权限管理,确保让每一层级的用户都能看到匹配自己的信息,通过管理权限对数据进行了很好地安全保护。
门店业务人员
电商销售管理人员
4、数据分析便利性
Excel经常会被拿来做报表,但是这种表格报表只是简单的罗列数字,图表美观度也不够。如果想要做多表分析或者做动态图表,则需要学习vlookup、VBA等,对普通业务人员来说,是难上加难。
Fine BI适合小白这句话就是体现在数据分析上的,仅需要拖、拽就可以把想要分析的字段拖到对应维度里面,图表的类型、配色、大小都只需要鼠标单击选择,图表之间天然存在联动功能,能够动态展示数据。此外,Fine BI帮助文档中,有多种常用的数据分析模型,如RFM、ABC、漏斗模型等,能够直接套用。
excel数据处理与分析课程目的
第一讲 数据输入与编辑
1、数据输入
输入前的准备:
1) 调整输入数据后的单元格指针移动方向;
2) 在指定的单元格区域中快速移动:选择一个区域,按【Enter】键后可以按一定的方向移动,如果想反向移动则按【shift + Enter】键。如果希望从左向右横向移动,可以按【Tab】键,同样按【shift + Tab】组合键也可以反方向移动;
3) 自动填充的威力,等差数字填充,日期的自动填充,文字自动填充,特定内容的填充,巧用右键和双击填充。正确输入分数的方法(顺充是:整数?空格?分子?斜杠(/)?分母);
4) 神奇的选择性粘贴:粘贴,粘贴并运算;
5) 灵活制作斜线表头:单线表头,多斜线表头;
6) 在多单元格中输入相同数据。
2、使用数据有效性规范录入
1)知晓有效性各选项卡的默认设置和作用;
2)了解有效性允许的条件;
3)使用有效性保护公式单元格不被修改;
4)限制单元格只能输入当年日期;
5)限制单元格只能输入占比;
6)限制单元格只能输入固定电话号码和Email地址;
7)单元格中切换中英文输入法。
3、数据查找和替换
1)查找指定的数据;
2)按照特定的条件查找指定数据;
3)替换指定的数据;
4)按照特定的条件替换指定的数据。
第二讲 数据管理与分析
1、合并计算
1)使用“合并计算”功能来统计产品上半年总销售量;
2)使用“合并计算”功能计算上半年各地区产品的平均销售量。
2、 数据的排序
1)单条件排序的使用;
2)多条件排序的使用。
3、 数据的筛选
1)自动筛选的使用;
2)高级筛选的使用。
4、 数据的分类汇总
1)创建分类汇总;
2)隐藏与显示分类汇总信息。
5、数据条件格式设置
1)设置员工出生日期为年前的显示为红色;
2)设置员工年龄大于岁为蓝色;
3)设置年龄大于平均年龄为黄色;
4)将员工年龄以“数据条”格式直观显示;
5)将员工年龄以“色标”格式分层次显示;
6)将员工年龄以“图标集”格式分层次显示;
7)新建格式条件规则来反映员工年龄分布情况;
8)管理新建的条件规则。
第三讲 Excel函数应用基础
1、了解函数的组成
什么是函数
函数的构成
函数类型
2、公式的输入与编辑
1)使用“插入函数”向导输入公式;
2)手动输入公式;
3)公式编辑。
3、通过“函数帮助”来学习函数
4、引用数据源
1)引用相对数据源
2)引用绝对数据源
3)引用混合数据源
4)在公式中引用三维数据源来进行计算
5)在公式中引用多张工作表中特定数据源来进行计算
6)在公式中引用多个工作簿数据源来进行计算
5、名称的定义与使用
6、公式审核工具的应用
追踪引用单元格
追踪从属单元格
错误检查
显示计算步骤
移去显示箭头
7、公式错误值与解决方法
1)“#####”错误值的处理方法
2)“#DIV/0!”错误值的处理方法
3)“#N/A”错误值的处理方法
4)“#NAME?”错误值的处理方法
5)“#NUM!错误值的处理方法
6)“#VALUE!”错误值的处理方法
7)“#REF!”错误值的处理方法
8)“#NULL!”错误值的处理方法
第四讲 Excel函数应用
1、逻辑函数的应用解析
逻辑函数常用实例解析
逻辑函数综合实例解析
2、文本函数的应用解析
文本函数常用实例解析
文本函数综合实例解析
3、日期函数的应用解析
日期函数综合实例解析
1) 设计2008年北京奥运会倒计时天数显示牌
2) 在销售报表中让Excel自动填写当前月份
4、时间函数的应用解析
时间函数综合实例解析
1) 自动计算员工迟到的罚款金额
2) 计算员工上班外出使用了多长时间
5、常用统计和排位统计函数应用解析
常用统计函数实例解析
排位统计函数实例解析
6、数据库和查找函数的典型应用
1)数据库函数应用解析
2)查找函数应用解析
第五讲 数据分析中的常用图表
1、图表基础操作
1)创建图表
? 选择连续的数据源新建图表
? 选择不连续的数据源新建图表
2)编辑图表标题
3)了解图表各个组成部分的名称
? 利用鼠标选择图表各个对象
? 利用工具栏选择图表各对象
2、各种图表类型及应用范围解析
1)柱形图应用
2)条形图应用
3)折线图应用
4)饼图应用
5)圆环图应用
6)XY散点图应用
7)面积图应用
8)雷达图应用
9)股价图应用
3、图表的高级应用
1)2Y轴图表的综合应用实例
2)动态图表典型范例
第六讲 数据分析中的数据透视表/图
1、创建数据透视表
创建数据透视表雏形
设置数据透视表数据
2、编辑数据透视表
3、创建数据透视图
第七讲 高级分析
1、模拟运算分析? 使用公式进行预测分析
2、方案及方案管理器? 通过方案进行多变量模拟运算
3、单变量求解? 根据目标倒推条件指标
4、规划求解? 在Excel中安装规划求解工具
5、数据分析和统计检验? 安装分析工具库
6、预测分析? 移动平均预测
7、使用图表进行预测分析? 使用公式进行线性预测
一般用excel怎么做数据分析
一般来说,需要学习一些Excel相关基本知识,运用Excel进行数据分析,就需要六个步骤,这六个步骤分别是明确分析的目的和思路、做好数据收集工作、数据处理、数据分析、数据展现、数据分析报告。
在数据分析工作之前的要有明确的分析目的,这是因为只有明确数据局分析的目的,才不会偏离数据分析的方向,在确定数据分析的目的以后,还要梳理好数据分析的框架,在确定好分析框架的体系以后,还需要结合实际情况去进行搭建分析框架。这样才能够保证数据的完整性。
而数据收集工作就需要明确数据了来源,一般来说,数据收集的途径有三种,第一种就是传统的手工录入数据,比如设置问卷调查表。第二种就是自动导入网上的数据,第三种就是导入文本数据。大家在进行数据收集工作的时候根据实际情况去进行数据收集方式的选择。
我们再来说说数据处理工作,数据处理工作有三个阶段,分别是数据清洗、数据加工、数据抽样。数据清洗工作就是用函数法和筛选法或者条件格式发去处理重复数据。使用定位输入或查找替换找到空白或以错误标识符显示的单元格,最常用的是以样本平均值代替缺失值,也可以用统计模型计算出来的值进行替换,或根据实际情况保留或删除缺失数据。利用IF函数检查错误或利用条件格式标记错误。而数据加工就有很多种方法,分别是数据抽取、数据计算、数据分组、数据转换。而数据抽样就是利用函数进行随机抽样。
接着我们说说数据分析,数据分析方法有很多,比如包括对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法、综合评价分析法、杜邦分析法、漏斗图分析法等。而数据分析工具就是用Excel自带的分析工具就可以了,而这个自带的工具的功能是很强大的。
然后说说数据展现。一般情况下,能用图说明问题的就不用表格,能用表格说明问题的就不用文字。所以,数据展现使用图表是现在的主流方式,那么图表的作用是什么呢?图表的作用就是表达形象化、突出重点、体现专业化。经常用的图表的类型有表格、饼图、条形图、柱形图、折线图、散点图等。
最后就是数据分析的报告了,数据分析报告的要求就是需要有明确的结论,没有明确结论的分析称不上分析,同时也失去了报告的意义。
【数据分析】Excel数据分析全流程
作为数据分析师, 清晰了解数据分析的步骤是非常重要的,有助于清楚把控整个数据分析的流程。
作为想要学习数据分析的人员,了解整个数据分析的流程, 这样在面对一个数据分析问题的时候,知道如何去开展。
那么数据分析流程包含哪些环节呢?
我将一次完整的数据分析流程主要分为六个环节,包括明确 分析目的、数据获取、数据处理、数据分析、数据可视化、总结与建议 。
做任何事情都有其对应的目的,数据分析也是如此。每一次分析前,都必须要先明确做这次分析的目的是什么,只有先明确了目的,后面的分析才能围绕其展开, 常见的数据分析目标包括以下三种类型:
指标波动型 : 主要是针对某个指标下降了,上涨或者异常所做的分析, 比如DAU(日活跃用户数)降低了, 留存率降低了, 电商平台的订单数量减少了, 收入降低了,质量指标如卡顿率上涨的,分析的主要目的是挖掘指标波动的原因, 及时发现业务的问题。
评估决策型 :主要是针对某个活动上线, 某个功能上线, 某个策略上线的效果评估以及下一步迭代方向的建议,这些建议是指导产品经理或者其他业务方决策的依据。
专题探索型 : 主要是针对业务发起的一些专题的分析, 比如增长类的专题分析, 怎么提高用户新增,活跃,留存,付费, 比如体验类的专题分析, 如何提高用户查找表情的效率, 比如方向性的探索, 微信引入视频号的功能的用户需求分析以及潜在机会分析。
明确了数据分析目的之后, 第二步就是根据我们的分析目的,提取相对应的数据,通常这一个环节是利用 hive sql 从数据仓库中提取数据。
提取的数据通常要注意提取的维度和对应的指标个数,以电商app 的付费流失严重分析案例,我们需要提取的维度和指标可以根据具体的业务流程来(如图):
首先从维度上,我们需要确定好,比如时间维度我们提取的时间跨度是多长,比如今天的数据和昨天的对比,那就是取2天的数据,如果是这周和上周那就是十四天的数据。
设备维度的值是否需要提取ios和安卓的用户进行不同的平台的对比,分析付费流失严重是否主要发生在某个平台。
年龄、性别、地域维度,就是提取用户这些维度的信息, 主要是为了在哪一个年龄层, 哪一个性别,哪一个地域流失最严重。
新老用户的维度, 主要是从新旧维度上分析流失严重是否是集中在新用户还是老用户(如图所示)
确定好了维度以后, 接下来就是指标信息, 维度+ 指标才是一个完整的数据 。
因为需要分析每一个环节的流失情况,所以需要提取下单的每一个环节对应的指标的人数和次数。
基于这些人数和次数,我们可以计算每一个环节之间的转化率。
活跃浏览比 = 浏览的人数/活跃的人数
浏览添加比 = 添加的人数/浏览的人数
添加下单比 = 点击下单人数/添加购物车人数
成功下单率 = 成功下单的人数/点击下单的人数
当我们知道我们应该从哪里获取数据, 以及获取哪些指标数据后,为了保证我们提取的数据的质量,我们通常要对数据进行处理。
常见的数据处理有异常值处理,空值处理。举个例子, 比如我们在提取用户的年龄数据之前,我们需要去除掉年龄中的空的数据以及异常的数据, 异常的数据指得是比如年龄超过120岁这种。
数据处理好了之后,就可以开始分析,根据我们的分析目标,我们要选择合适的分析方法和分析思路去做拆解和挖掘。
常见的分析方法包括:漏斗分析, 相关性分析, 5w2h 分析, aha 时刻分析, 麦肯锡逻辑树分析法,用户画像分析,RFM用户分群,对比分析等方法,这些方法详细的介绍会在第三章展开, 在这里不做赘述
针对我们的订单流失的问题,典型的分析思路和方法是利用漏斗分析和用户画像分析。
漏斗分析主要是可以挖掘付费流失严重的主要流失环节是在哪里。我们发现付费流失严重主要是因为用户活跃到浏览商品的转化率从50%跌倒30%, 减少了20%,那就可以把问题定位到为什么用户浏览变少的问题上。
用户画像分析,可以帮助我们分析流失严重的用户是什么特征,比如什么样的年龄, 性别, 地域等, 那就可以知道这种流失是集中在哪一个年龄群体,哪一个地域群体以及其他的行为特征。
通过数据分析得出结论后,还需要用图表展示出来,俗话说得好,“文不如表,表不如图",用图表可以更清晰展现你的结论,通常的可视化我们可以利用excel 自带的可视化的功能, 也可以通过python或者R脚本进行可视化。
常见的图表有: 柱形图,折线图,饼图,条形图,面积图, 散点图,组合图,箱线图
当我们利用图表把我们的数据分析结论展示出来以后,最后就是数据分析的总结的部分,主要分成我们得出了什么具体的结论以及给业务具体的建议,告诉他们改进的方向。
这就是一次完整的数据分析的流程,从分析目的到提取数据,到分析数据给出结论的完整的过程。
怎样用Excel做数据分析
前言
最近松懈了,花了很多时间在玩游戏看视频上,把学习计划耽搁了,总说要自律,但光说不做是没用的,最主要是自控能力太差了,得承认自己和大多数人一样,爱玩、不愿意迈出舒适区,“知行合一”,只四个字,大道至简,却超过99%的人都做不到。在前进的路上,希望自己能克服惰性,提升自控力,按计划耐心学习并践行。
1、数据分析步骤:
提出问题→理解数据→数据清洗→构建模型→数据可视化
2、实践案例:
利用一份招聘网站的数据作为实战案例。
第一步提出问题:
1)在哪些城市找到数据分师工作的机会比较大?
2)数据分师的薪水如何?
3)根据工作经验的不同,薪酬是怎样变化的?
第二步理解数据:
初始数据有6875条,14项内容。
设置表格列宽(步骤如下图),显示全部内容,方便后续操作,最后保存。
第三步清洗数据:
这一步需要花费的时间占大部分,把数据处理成自己想要的样子。
1、选择子集:选择公司全名和公司ID两列并隐藏(取消隐藏方法:全选表格→开始→格式→隐藏和取消隐藏→取消隐藏列)
2、列名重命名:双击列名可以修改成自己想要的列名。
3、删除重复值:选择职位ID将其重复值删除(步骤如下图)
4、缺失值处理:选择职位ID列计数5032,选择城市列计数5030,城市列缺失两个数据。
查找并定位城市列的缺失值(步骤如下图),缺失值填上海。
缺失值处理的4种方法,根据情况灵活使用:
1)通过人工手动补全;
2)删除缺失的数据;
3)用平均值代替缺失值;
4)用统计模型计算出的值去代替缺失值。
5、一致化处理:对“公司所属领域”进行一致化处理(步骤如下图)
将原来的“公司所属领域”列隐藏,并将复制的列进行分列:
6、数据排序:
7、异常值处理:
第四步构建模型
第五步数据可视化
通过上面的分析,我们可以得到的以下分析结论有:
1)数据分析这一岗位,有大量的工作机会集中在北上广深以及新一线城市,如果你将来去这些城市找工作,可以提高你成功的条件概率。
2)从待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。
3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年。
对于数据分析师来说,5年似乎是个瓶颈期,如果在5年之内没有提升自己的能力,大概以后的竞争压力会比较大。
4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。
3、划重点:
1)分列功能会覆盖掉右列单元格,所以我们记得先要复制这一列到最后一个空白列的地方,再进行分列操作。
2)上面图片中的函数:IF(COUNT(FIND({"数据运营","数据分析","分析师"},L2)),"是","否")。
3)Ctrl+Eneter快捷键,在不连续的单元格中同时输入同一个数据或公式时很好用。
4)精确查找和近似查找(模糊查找)的区别
(1)精确查找是指从第一行开始往最后一行逐个查找。一找到匹配项就停止查询,所以返回找到的第一个值。
(2)当你要近似查找的时候,它就会苦逼地查遍所有的数据,返回的是最后一个匹配到的值。
5)在使用vlookup函数时,在很多情况下使用的是精确匹配,而在进行分组时需要用模糊匹配,所以这里要输入“1”来进行模糊匹配。
6)Excel设置了快捷键F4帮助用户迅速切换相对引用、绝对引用和混合引用,步骤如下:
(1)选定包含该公式的单元格;
(2)在编辑栏中选择要更改的公式内容,并按 F4 键;
(3)以引用单元格A1为例,每次按 F4 键时,Excel会依次在以下组合间切换:
按一次F4是绝对引用
按两次、三次F4是混合引用
按四次F4是相对引用
7)使用这个函数过程中,如果出现错误标识“#N/A”,一般是3个原因导致:
(1)第2个参数:查找范围里第一列的值必须是要查找的值。
比如这个案例里第2个参数选定的的范围里第一列是姓名,是要查找值的列。
(2)数据存在空格,此时可以嵌套使用TRIM函数将空格批量删除。
(3)数据类型或格式不一致,此时将数据类型或格式转为一致即可。