百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

聊聊Java中String,StringBuilder,StringBuffer那些事

yuyutoo 2025-01-10 18:14 5 浏览 0 评论

对于这三个,我们首先能知道的就是String是不可变的,StringBuilder和StringBuffer是可变的,那么我们就先说说String,它为什么设计成不可变的以及怎么实现不可变的。

String为什么设计成不可变的?

我们其实能感觉到,字符串其实是我们开发过程中最常用的一种数据结构了,如果依赖于常规的对象创建方式,那么就会出现大量重复字符串值的对象,这会消耗大量空间,从而影响GC效率。

所以如果设计成不可变的情况下,同样一种值的多个对象的引用都会指向一个字符串对象,可以大大的减少堆内存,同时String中缓存了hash值,这也会对使用hash的地方提升很多的性能

同时设计成不可变的情况下,它就是线程安全的,即便在其他线程修改了值,那么也是创建或者引用已存在的对象,而不是修改当前的值。同时它对于安全性也是十分有保障的,一个不可变的内容,我们认为是可信的,如果可以随意的更改它的值,就太不可信了。

String设计如何实现不可变的?

先看一下jdk1.8中的源码

arduino
复制代码
public final class String implements java.io.Serializable, Comparable<String>, CharSequence { /** The value is used for character storage. */ private final char value[]; /** Cache the hash code for the string */ private int hash; // Default to 0 public String substring(int beginIndex) { if (beginIndex < 0) { throw new StringIndexOutOfBoundsException(beginIndex); } int subLen = value.length - beginIndex; if (subLen < 0) { throw new StringIndexOutOfBoundsException(subLen); } return (beginIndex == 0) ? this : new String(value, beginIndex, subLen); } public String concat(String str) { int otherLen = str.length(); if (otherLen == 0) { return this; } int len = value.length; char buf[] = Arrays.copyOf(value, len + otherLen); str.getChars(buf, len); return new String(buf, true); } }

从源码中我们可以看到,存储字符串的是用final修饰的char数组,表示这个字符数组不可变,而substring和concat方法返回的其实都是new String()。

扩展

在Java9及以上的版本,存储字符串的结构增加了一种,是byte数组,这其实是做了一层优化。而为什么这么做呢?Java内部使用UTF-16进行编码,也就是说即便一个单个字符可以用一个字节标识,用UTF-16之后也是占用两个字节,这其实是非常浪费时间的,而很多情况下的字符串其实都是可以用LATIN-1(单字节编码方案,可以标识包含ASCLL在内的128个字符)进行编码。所以引入了一种**“Compact String”** 的概念。那么该如何区分什么时候用UTF-16什么时候用LATIN-1呢?

在String的类中定义了一个名为coder 的字段,用来保存字符串是用什么进行编码的,然后根据类型存储到不同的存储结构中,与之相关的indexOf方法就需要这个字段来决定去哪个数组中找到对应字符。

当new String()的时候是做了什么?只是创建了一个对象吗?

Java对象在JVM中存储是有一定结构的,也就是对象模型 ,也包含了两个信息,一个是对象头,存储一些运行时的信息,比如线程,锁标识之类的,另一部分就是元数据,就是一个指向类信息的指针,关于JVM这方便的知识,后面我会单独的进行撰写。

其实不管怎么样,我们new的时候都会在堆上创建一个对象,但是对于字符串确实有一点特殊情况的,这个特殊情况就是常量池中的字符串常量 ,这个字符串其实是类编译阶段就进入到类常量池中的,当类第一次被ClassLoader加载时候,会从类常量池进入到运行时常量池(1.8以后字符串常量池移动到了堆中,为了更好的管理对象,防止内存泄露)。而字符串常量池中存储了字符串的引用与对象,引用存在String Table中,而new String()出来的都是在堆上面的对象实例,它的引用就是引用的字符串常量池中的字符串引用。所以可以看出,如果字符串常量池中没有这个对象,那么就可能创建两个对象,一个是在堆实例中,一个在字符串常量池中,创建一个还是两个对象都是取决于字符串常量池中有没有这个对象。

intern

上面经常在说字符串常量池,对于字符串常量池最通俗的解释就是程序运行时可以知道结果的字符串,比如下面这段代码

java
复制代码
public static void main(String[] args) { String a = "abc"; String b = "def"; String c = "abc"+"def"; }

反编译的结果就是String c="abcdef";当两个常量使用+的时候,就会变成一种常量。而另一种变量相加的方式

java
复制代码
public static void main(String[] args) { String a = "abc"; String b = "def"; String c = a+b; }

反编译的结果就是

java
复制代码
String c = (new StringBuilder()).append(a).append(b).toString();

而这种计算出来的结果值是不会进入到常量池中的,同时,这样的字符串还经常会用到呢,怎么办?所以intern的作用就体现出来了。它的作用就是两个,一个是如果常量池没有这个字符串的话,就将这个值加入到字符串常量池中,第二个就是返回这个常量的引用。

再次扩展-->String是否有长度限制呢?

答案是是有的,而且还不一样,在编译期间的String的最大长度为65535,运行期间的最大长度为int的最大值2^31-1。这里面涉及到了Java虚拟机规范的问题,大致点说就是虚拟机中用一个CONSTANT_Utf8_info的结构表示字符串常量,结构如下: CONSTANT_Utf8_info{ u1 tag; u2 length; u1 bytes[length]; } 其中U2标识2个字节的无符号数,一个字节8位,2个字节就是16位,所以最大值为2^16-1 = 65535。

StringBuilder和StringBuffer都是可变的,且StringBuffer是线程安全的

StringBuilder和StringBuffer都继承了AbstractStringBuilder这里面有两个属性

java
复制代码
char[] value; /** * The count is the number of characters used. */ int count;

并且都没有被final修饰,说明就是可变的,那么看一下他们的append源码

java
复制代码
public AbstractStringBuilder append(StringBuffer sb) { if (sb == null) return appendNull(); int len = sb.length(); ensureCapacityInternal(count + len); sb.getChars(0, len, value, count); count += len; return this; }

其实就是干了2件事扩容和放字符。 StringBuffer中重写了append方法

java
复制代码
@Override public synchronized StringBuffer append(String str) { toStringCache = null; super.append(str); return this; }

都加上了synchronized,说明这是一个线程安全的方法。


原文链接:https://juejin.cn/post/7279052777888497705

相关推荐

当 Linux 根分区 (/) 已满时如何释放空间?

根分区(/)是Linux文件系统的核心,包含操作系统核心文件、配置文件、日志文件、缓存和用户数据等。当根分区满载时,系统可能出现无法写入新文件、应用程序崩溃甚至无法启动的情况。常见原因包括:...

玩转 Linux 之:磁盘分区、挂载知多少?

今天来聊聊linux下磁盘分区、挂载的问题,篇幅所限,不会聊的太底层,纯当科普!!1、Linux分区简介1.1主分区vs扩展分区硬盘分区表中最多能存储四个分区,但我们实际使用时一般只分为两...

Linux 文件搜索神器 find 实战详解,建议收藏

在Linux系统使用中,作为一个管理员,我希望能查找系统中所有的大小超过200M文件,查看近7天系统中哪些文件被修改过,找出所有子目录中的可执行文件,这些任务需求...

Linux 操作系统磁盘操作(linux 磁盘命令)

一、文档介绍本文档描述Linux操作系统下多种场景下的磁盘操作情况。二、名词解释...

Win10新版19603推送:一键清理磁盘空间、首次集成Linux文件管理器

继上周四的Build19592后,微软今晨面向快速通道的Insider会员推送Windows10新预览版,操作系统版本号Build19603。除了一些常规修复,本次更新还带了不少新功能,一起来了...

Android 16允许Linux终端使用手机全部存储空间

IT之家4月20日消息,谷歌Pixel手机正朝着成为强大便携式计算设备的目标迈进。2025年3月的更新中,Linux终端应用的推出为这一转变奠定了重要基础。该应用允许兼容的安卓设备...

Linux 系统管理大容量磁盘(2TB+)操作指南

对于容量超过2TB的磁盘,传统MBR分区表的32位寻址机制存在限制(最大支持2.2TB)。需采用GPT(GUIDPartitionTable)分区方案,其支持64位寻址,理论上限为9.4ZB(9....

Linux 服务器上查看磁盘类型的方法

方法1:使用lsblk命令lsblk输出说明:TYPE列显示设备类型,如disk(物理磁盘)、part(分区)、rom(只读存储)等。...

ESXI7虚机上的Ubuntu Linux 22.04 LVM空间扩容操作记录

本人在实际的使用中经常遇到Vmware上安装的Linux虚机的LVM扩容情况,最终实现lv的扩容,大多数情况因为虚机都是有备用或者可停机的情况,一般情况下通过添加一块物理盘再加入vg,然后扩容lv来实...

5.4K Star很容易!Windows读取Linux磁盘格式工具

[开源日记],分享10k+Star的优质开源项目...

Linux 文件系统监控:用脚本自动化磁盘空间管理

在Linux系统中,文件系统监控是一项非常重要的任务,它可以帮助我们及时发现磁盘空间不足的问题,避免因磁盘满而导致的系统服务不可用。通过编写脚本自动化磁盘空间管理,我们可以更加高效地处理这一问题。下面...

Linux磁盘管理LVM实战(linux实验磁盘管理)

LVM(逻辑卷管理器,LogicalVolumeManager)是一种在Linux系统中用于灵活管理磁盘空间的技术,通过将物理磁盘抽象为逻辑卷,实现动态调整存储容量、跨磁盘扩展等功能。本章节...

Linux查看文件大小:`ls`和`du`为何结果不同?一文讲透原理!

Linux查看文件大小:ls和du为何结果不同?一文讲透原理!在Linux运维中,查看文件大小是日常高频操作。但你是否遇到过以下困惑?...

使用 df 命令检查服务器磁盘满了,但用 du 命令发现实际小于磁盘容量

在Linux系统中,管理员或开发者经常会遇到一个令人困惑的问题:使用...

Linux磁盘爆满紧急救援指南:5步清理释放50GB+小白也能轻松搞定

“服务器卡死?网站崩溃?当Linux系统弹出‘Nospaceleft’的红色警报,别慌!本文手把手教你从‘删库到跑路’进阶为‘磁盘清理大师’,5个关键步骤+30条救命命令,快速释放磁盘空间,拯救你...

取消回复欢迎 发表评论: