百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

零基础入门Excel数据分析“函数篇”:10个常用的数据清洗类函数

yuyutoo 2024-10-25 19:16 6 浏览 0 评论

Excel是数据分析师最常用的一种工具,可以搞定绝大多数数据分析工作,所以,对于数据分析初学者来说,最好先从Excel函数开始学习,通过Excel函数感受Excel的强大与神奇。

关于Excel函数,可以分为5大类。

  1. 数据清洗类
  2. 关联匹配类
  3. 逻辑运算类
  4. 计算统计类
  5. 时间序列类

本文将会讲解第1类:数据清洗类,在开始讲解函数之前,需要先了解以下一些关于Excel的基础知识

1、我们可以在 Excel 中进行加、减、乘、除、幂等运算,无需使用任何函数。只需使用基本运算符:+(加)、-(减)、*(乘)、/(除)、^(幂)。

2、Excel是一个二维表格,由行、列组成,行采用数字编号,列采用字母编号。共有一百多万行和 16,000 多列

3、公式可包含常数、运算符及单元格引用。

注意:所有公式均以等号开头。

在了解了以上基础知识后,就可以正式开始Excel函数的学习了。

1、TRIM

功能:去除单元格两端的空格。

用法:=TRIM(text)

例如,单元格B2前后有空格(红色框线所示),通过trim函数作用后,空格被去除了。

说明:TRIM公式并不是去除所有空格,只是去除单元格前后的空格。

2、&符号

功能:字符串拼接

在Excel中,有一个特殊符号很有用,&(读作and连接符),可以连接字符串及单元格中的内容。

例如,将单元格A1和B1进行连接,直接使用公式:=A1&B1,即可得到结果。

3、CONCAT

功能:连接单元格的内容。

用法:= CONCAT(text1, [text2],…)

例如,通过CONCAT将单元格A1和B1进行连接,如下图所示。

说明:老版本公式为CONCATENATE。

4、MID

功能:提取字符串中间的字符串

用法:= MID(text, start_num, num_chars)

参数说明:

  • 第1个参数text:提取的目标字符串
  • 第2个参数start_num:从第一个字符开始提取
  • 第3个参数num_chars:提取几个字符

例如,从身份证号中提取出生年月(图中标红的部分),可以通过MID函数实现,提取目标为A2单元格,从第7个字符开始提取,提取个数为8。

5、LEFT

功能:提取字符串左边的字符串

用法:= LEFT(text, [num_chars])

参数说明:

  • 第1个参数text:要提取的目标字符串
  • 第2个参数 [num_chars](可缺省):提取几个字符。

说明:用中括号括起来的参数表示该参数可以不写,即缺省。

例如,通过LEFT函数从前面提取出来的年月日中提取年份,从左边开始,提取4个字符,如下图所示。

6、RIGHT

功能:提取字符串右边的字符串

用法:=RIGHT(text,[num_chars])

参数说明:

  • 第1个参数text:要提取的目标字符串
  • 第2个参数[num_chars]:提取几个字符。

RIGHT用法与LEFT类似,只是从字符串右边开B始提取。例如,从年月日中提取月日,如下图所示。

7、REPLACE

功能:替换字符串中的连续几个字符或者某个字符

用法:= REPLACE(old_text, start_num, num_chars, new_text)

参数说明:

  • 第1个参数old_text:被替换的原始字符串
  • 第2个参数start_num:从第几个字符开始替换
  • 第3个参数num_chars:要替换几个字符
  • 第4个参数new_text:替换后的新字符串

例如,用REPLACE函数将手机号的后4位均替换为星号(*),替换的原始字符串为单元格A2,从第8个字符开始替换,替换4个字符,替换为4个星号,如下图所示。

8、SUBSTITUTE

功能:替换字符串中的连续几个字符或者某个字符

用法:=SUBSTITUTE(text, old_text, new_text, [instance_num])

参数说明:

  • 第1个参数text:被替换的原始字符串
  • 第2个参数old_text:原始字符串中被替换的部分
  • 第3个参数new_text:替换后的新字符串
  • 第4个参数[instance_num]:从第几个字符开始替换,可缺省。

SUBSTITUTE可以实现与REPLACE相同的效果,只是用法有所差异。

例如,用SUBSTITUTE将手机号的后4位均替换为星号,要替换的原始字符串为A2单元格中的手机号,原始字符串中被替换的部分为后4位(通过RIGHT函数获取,前面已经介绍了RIGHT函数),替换后字符串为4个星号,如下图所示。

9、求字符串长度:LEN

功能:返回文本字符串中的字符个数。

用法:=LEN(text)

说明:还有另外一个函数LENB,也可以求字符串的长度。

10、求字符串长度:LENB

功能:返回文本字符串中的字符个数。

用法:=LENB(text)

LEN和LENB的区别在于,对于len来说,一个中文字符的长度计算为1,对于lenb来说,一个中文字符的长度计算为2,对于英文字符或者数字则没有差异。

例如,通过LEN和LENB分别获取字符串的长度,对于英文、数字没有差异,对于中文有差异,如下图所示。

关注我,学习更多数据分析知识!

Excel数据分析全套视频教程已上线,涵盖6大模块:Excel函数、Excel常用技巧、数据透视表、Excel图表、基础统计分析和Excel VBA,目前限时优惠中!

相关推荐

苹果要求全新App开发四月起必须支持“齐刘海”

今日消息,苹果公司通过邮件告知应用程序开发者,从2018年4月起提交给AppStore的所有新应用必须支持iPhoneX的超级视网膜显示器。这意味着新应用程序的开发者必须确保它们适应“齐刘海”,并...

耗时一年多,QEMU开发者成功在电脑上模拟了初版iPhone OS

IT之家12月24日消息,用户通过黑苹果(Hackintosh)工具,已经可以在非Mac设备上运行macOS系统。但由于种种限制,至今也没有多少人能够在PC上运行iOS系统。现...

下个月的WWDC后,苹果将发布原生Watch SDK测试版本

在近日Re/code举办的CodeConference上,苹果的运营副总裁JeffWilliams称,目前有4000多个AppleWatch应用上线,而未来的苹果表开发者套件,将允许开发者直接获...

苹果再次提醒:4月起强制要求APP进行适配

点击右上角关注我们,每天给您带来最新最潮的科技资讯,让您足不出户也知道科技圈大事!软件适配对于许多厂商来说都是一个比较头疼的事,苹果在握紧AppStore审核权的情况下情况要好许多。最近他们公布了...

苹果Xcode 16首个Beta版发布,AI代码补全最少需16GB内存

IT之家6月12日消息,在苹果WWDC24开发者大会上,苹果发布了iOS18、macOS15Sequoia等最新版本系统更新。与此同时,苹果推出了Xcode16开发工具的首...

传苹果已向特定开发者开放iWatch SDK

|责编:薄志强苹果会不会在这次发布会中发布全新的智能手表产品iWatch还很难说,不少人认为由于iWatch的消息少之又少,很可能这次还是没有iWatch。不过现在又有外媒传出消息称,苹果已经选定了...

苹果发布Swift 6语言:引入新测试框架、增强C++ 互操作性

IT之家9月20日消息,科技媒体devclass昨日(9月19日)报道,苹果公司在发布iOS/iPadOS18和macOS15Sequoia系统之外,还发布了Sw...

发布Siri SDK 之前苹果还是先想想这个问题

今年的GoogleI/O大会上,在预览GoogleHome时,我们就看到了设备可以互相对话的场景是多么惊艳,苹果快点跟上吧。最近因为亚马逊Echo和谷歌GoogleHome的火热...

iOS 17.2 SDK代码确认古尔曼爆料:免开箱更新苹果iPhone系统

IT之家10月27日消息,彭博社的马克古尔曼(MarkGurman)本月早些时候发布报道,称苹果正在研发新的系统,可以让员工在不拆开包装的情况下,升级iPhone的iOS系统。根据国...

《企业应用架构模式》之事件驱动架构

事件驱动架构(Event-DrivenArchitecture,EDA)是一种强调事件流和异步通信的应用程序架构。在该架构中,应用程序被分解为多个小型、可独立部署的组件,这些组件通过事件进行通信...

k8s中常用的controller以及用途和对应机制

controller的用途ReplicaSet、Deployment、StatefulSet:用于无状态和有状态应用的副本管理。DaemonSet:确保每个节点上都运行一个副本的控制器。...

Disruptor框架源码阅读-如何不重复消费

RingBuffer如何保证数据不丢失由于ringbuffer是一个环形的队列,那么生产者和消费者在遍历这个队列的时候,如何制衡呢?1、生产快,消费慢,数据丢失?生产者速度过快,导致一个对象还没消...

C# 控制电脑睡眠,休眠,关机以及唤醒

最近碰到一个关于芯片测试过程中的问题,这颗芯片是用在笔记本端口上,笔记本客户那边会有一个压力测试,就是频繁的电脑电源状态切换,S0(正常使用的开机状态),S3(睡眠模式),S4(休眠模式)以及S5(关...

大厂防止超卖的7种实现,很受用!(大厂防止超卖的7种实现,很受用的产品)

高并发场景在现场的日常工作中很常见,特别是在互联网公司中,这篇文章就来通过秒杀商品来模拟高并发的场景。本文环境:...

臻识车牌识别配制MQTT通讯,解析车号

在物联网项目中,我们的软件与车牌识别通讯,通常使用MQTT通讯更简单。...

取消回复欢迎 发表评论: