百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Excel中的4类数据清洗函数,让数据分析更高效,还不掌握就Out

yuyutoo 2024-10-25 19:14 14 浏览 0 评论

Excel作为数据分析最常用的工具之一,在实际的操作中也有很多的技巧。如果要对数据分析处理的结果准确率要100%,必须要有良好的数据源,所以,在数据的处理和分析中,对数据的清洗是必不可少的,是数据分析和处理的第一步。


一、数据清洗:提取类。

函数:Left、Right、Mid、Find。

目的:按照指定的要求提取指定的值。

方法:

在指定的目标单元格中依次输入:=LEFT(C3,6)、=MID(C3,7,8)、=RIGHT(C3,4)。

解读:

除了用Left、Mid和Right提取固定位置的值之外,还可以借助Find函数提取不固定位置的值。


目的:分别提取混合内容“姓名&工号”中的“姓名”和“工号”。

方法:

在目标单元格中输入公式:=LEFT(B3,FIND("-",B3)-1)、=MID(B3,FIND("-",B3)+1,100)。

解读:

1、公式中的-1和+1是修正值,在实际的应用中要灵活对待。

2、公式:=MID(B3,FIND("-",B3)+1,100)中的第3个参数“100”是自定义值,只要明显的大于要提取字段的长度即可。


二、数据清洗:清除类。

函数:Trim。

目的:清除“员工姓名&工号”中多余的空格。

方法:

在目标单元格中输入公式:=TRIM(B3)。

解读:

1、为了更清晰的进行对比,用Len函数对清除前后的字符串长度进行了测量。

2、如果字符串中间有多个空格,则只保留一个,其余的全部会清除。


三、数据清洗:替换类。

1、Replace函数。

功能:将指定字符串中的部分字符串用新的字符串进行替换。

语法结构:=Replace(源字符串,开始位置,字符长度,替换字符串)。

目的:将“员工姓名&工号”中的“-”替换为“*”。

方法:

在目标单元格中输入公式:=REPLACE(B3,FIND("-",B3),1,"*")。


2、Substitute函数。

功能:将指定字符串中指定的字符用心的字符进行替换。

语法结构:=Substitute(源字符串,被替换字符串,替换字符串,[替换序号])。

解读:

参数“替换序号”可省略,意思就是值如果“源字符串”中有两个或多个“被替换字符串”,通过参数“替换序号”来指定具体要替换第几个“被替换字符串”。例如:字符串“我爱我的祖国”中有2个“我”,如果“替换序号”为1,则只替换第1个“我”;如果“替换序号”为2,则只替换第2个“我”。

目的:将“员工姓名&工号”中的“-”替换为“*”。

方法:

在目标单元格中输入公式:=SUBSTITUTE(B3,"-","*")。


四、数据清洗:内容合并类。

1、Concat函数。

功能:连接列表或文本字符串区域。

语法结构:=Concat(字符串或单元格区域)。

目的:将同一员工的所有信息合并到“备注”列中。

方法:

在目标单元格中输入公式:=CONCAT(B3:F3)。


2、Phonetic函数。

功能:合并出数字外的字符串或区域。

语法结构:=Phonetic(字符串或单元格区域)。

目的:将同一员工的所有信息合并到“备注”列中。

方法:

在目标单元格中输入公式:=PHONETIC(B3:F3)。

解读:

合并的内容中并没有“月薪”是因为其功能决定的,Phonetic函数不能合并没有拼音的字符。


3、Textjoin函数。

功能:使用分隔符连接列表字符串区域。

语法结构:=Textjoin(分隔符,是否保留空格,合并区域)。

目的:将同一员工的所有信息合并到“备注”列中。

方法:

在目标单元格区域中输入公式:=TEXTJOIN("、",1,B3:F3)。

解读:

上述的3个合并字符串函数,除了按列合并内容外,还可以按行合并。


最美尾巴:

工欲善其事,必先利其器,数据的处理和分析也是如此,要得到正确的结果,首先要对数据进行清洗,文中从四个方面出发,介绍了4类数据清洗技巧,包括字符提取、字符清除、字符替换以及字符连接。在实际的应用中具有很高的应用价值哦!


相关推荐

苹果要求全新App开发四月起必须支持“齐刘海”

今日消息,苹果公司通过邮件告知应用程序开发者,从2018年4月起提交给AppStore的所有新应用必须支持iPhoneX的超级视网膜显示器。这意味着新应用程序的开发者必须确保它们适应“齐刘海”,并...

耗时一年多,QEMU开发者成功在电脑上模拟了初版iPhone OS

IT之家12月24日消息,用户通过黑苹果(Hackintosh)工具,已经可以在非Mac设备上运行macOS系统。但由于种种限制,至今也没有多少人能够在PC上运行iOS系统。现...

下个月的WWDC后,苹果将发布原生Watch SDK测试版本

在近日Re/code举办的CodeConference上,苹果的运营副总裁JeffWilliams称,目前有4000多个AppleWatch应用上线,而未来的苹果表开发者套件,将允许开发者直接获...

苹果再次提醒:4月起强制要求APP进行适配

点击右上角关注我们,每天给您带来最新最潮的科技资讯,让您足不出户也知道科技圈大事!软件适配对于许多厂商来说都是一个比较头疼的事,苹果在握紧AppStore审核权的情况下情况要好许多。最近他们公布了...

苹果Xcode 16首个Beta版发布,AI代码补全最少需16GB内存

IT之家6月12日消息,在苹果WWDC24开发者大会上,苹果发布了iOS18、macOS15Sequoia等最新版本系统更新。与此同时,苹果推出了Xcode16开发工具的首...

传苹果已向特定开发者开放iWatch SDK

|责编:薄志强苹果会不会在这次发布会中发布全新的智能手表产品iWatch还很难说,不少人认为由于iWatch的消息少之又少,很可能这次还是没有iWatch。不过现在又有外媒传出消息称,苹果已经选定了...

苹果发布Swift 6语言:引入新测试框架、增强C++ 互操作性

IT之家9月20日消息,科技媒体devclass昨日(9月19日)报道,苹果公司在发布iOS/iPadOS18和macOS15Sequoia系统之外,还发布了Sw...

发布Siri SDK 之前苹果还是先想想这个问题

今年的GoogleI/O大会上,在预览GoogleHome时,我们就看到了设备可以互相对话的场景是多么惊艳,苹果快点跟上吧。最近因为亚马逊Echo和谷歌GoogleHome的火热...

iOS 17.2 SDK代码确认古尔曼爆料:免开箱更新苹果iPhone系统

IT之家10月27日消息,彭博社的马克古尔曼(MarkGurman)本月早些时候发布报道,称苹果正在研发新的系统,可以让员工在不拆开包装的情况下,升级iPhone的iOS系统。根据国...

《企业应用架构模式》之事件驱动架构

事件驱动架构(Event-DrivenArchitecture,EDA)是一种强调事件流和异步通信的应用程序架构。在该架构中,应用程序被分解为多个小型、可独立部署的组件,这些组件通过事件进行通信...

k8s中常用的controller以及用途和对应机制

controller的用途ReplicaSet、Deployment、StatefulSet:用于无状态和有状态应用的副本管理。DaemonSet:确保每个节点上都运行一个副本的控制器。...

Disruptor框架源码阅读-如何不重复消费

RingBuffer如何保证数据不丢失由于ringbuffer是一个环形的队列,那么生产者和消费者在遍历这个队列的时候,如何制衡呢?1、生产快,消费慢,数据丢失?生产者速度过快,导致一个对象还没消...

C# 控制电脑睡眠,休眠,关机以及唤醒

最近碰到一个关于芯片测试过程中的问题,这颗芯片是用在笔记本端口上,笔记本客户那边会有一个压力测试,就是频繁的电脑电源状态切换,S0(正常使用的开机状态),S3(睡眠模式),S4(休眠模式)以及S5(关...

大厂防止超卖的7种实现,很受用!(大厂防止超卖的7种实现,很受用的产品)

高并发场景在现场的日常工作中很常见,特别是在互联网公司中,这篇文章就来通过秒杀商品来模拟高并发的场景。本文环境:...

臻识车牌识别配制MQTT通讯,解析车号

在物联网项目中,我们的软件与车牌识别通讯,通常使用MQTT通讯更简单。...

取消回复欢迎 发表评论: