面试题:为什么JDK9要将String的底层实现由char[]改为byte[]?

createh53个月前 (01-13)技术教程47

在 JDK 9 中,并没有直接将String的底层实现由char[]改为byte[],而是引入了 Compact Strings 的优化。

节省内存空间

  1. 字符编码考虑
  • 在 Java 中,char类型占用 2 个字节,用于表示 Unicode 字符。然而,在很多实际应用场景中,字符串并不总是包含所有可能的 Unicode 字符,尤其是在处理大量 ASCII 字符时,使用char数组会浪费很多空间。
  • 而byte类型只占用 1 个字节,可以更紧凑地存储 ASCII 字符。对于只包含 ASCII 字符的字符串,使用byte数组可以节省一半的内存空间。
  • 例如,一个只包含英文字母和数字的字符串,如果使用char数组存储,每个字符占用 2 个字节;而使用byte数组存储,每个字符只占用 1 个字节。
  1. 字符串常量池优化
  • Java 中的字符串常量池是一个存储字符串常量的地方,它可以避免重复创建相同的字符串对象,从而节省内存空间。在 JDK 9 之前,字符串常量池中的字符串也是使用char数组存储的。
  • JDK 9 引入的 Compact Strings 优化对字符串常量池进行了改进。当字符串只包含 ASCII 字符时,可以使用更紧凑的存储方式,将其存储为byte数组,从而进一步节省内存空间。
  • 例如,在一个大型应用程序中,如果有很多相同的只包含 ASCII 字符的字符串常量,使用优化后的存储方式可以减少内存占用,提高性能。

提高性能

  1. 字符串操作效率
  • 在一些字符串操作中,使用byte数组可以提高性能。例如,在字符串比较、复制、拼接等操作中,byte数组的操作通常比char数组更快,因为byte类型占用的内存空间更小,操作起来更高效。
  • JDK 9 的 Compact Strings 优化在进行这些字符串操作时,可以根据字符串的实际情况选择更合适的存储方式和操作方法,从而提高性能。
  • 例如,在进行字符串比较时,如果字符串只包含 ASCII 字符,可以直接比较字节值,而不需要进行字符编码的转换。这可以减少比较的时间开销,提高性能。
  1. 垃圾回收压力减小
  • 使用byte数组存储字符串可以减少内存占用,从而减小垃圾回收的压力。在 Java 中,垃圾回收是一个比较耗时的操作,如果内存占用过大,会导致垃圾回收频繁发生,从而影响性能。
  • JDK 9 的 Compact Strings 优化可以减少字符串对象占用的内存空间,从而减小垃圾回收的压力,提高服务器的性能。
  • 例如,在一个长时间运行的服务器应用程序中,如果有很多字符串对象占用大量内存,使用优化后的存储方式可以减少内存占用,从而减小垃圾回收的压力,提高服务器的性能。

适应新的字符编码需求

  1. 支持更多字符编码
  • 在现代应用程序中,除了 Unicode 字符集,还可能需要支持其他字符编码,如 UTF-8、UTF-16LE、UTF-16BE 等。使用byte数组可以更灵活地支持不同的字符编码,因为可以根据需要选择不同的编码方式来存储字符串。
  • JDK 9 的 Compact Strings 优化允许在需要时将字符串转换为不同的编码方式,从而提高应用程序的灵活性和可扩展性。
  • 例如,在一个需要处理多种字符编码的应用程序中,可以使用byte数组来存储字符串,并根据需要进行编码转换。这样可以提高应用程序的灵活性和可扩展性。
  1. 与其他语言和系统的兼容性
  • 在与其他语言和系统进行交互时,可能需要使用不同的字符编码。使用byte数组可以更容易地与其他语言和系统进行交互,因为可以根据需要进行编码转换。
  • JDK 9 的 Compact Strings 优化使得 Java 字符串在与其他语言和系统进行交互时更加方便,提高了应用程序的兼容性。
  • 例如,在一个与 C 语言进行交互的 Java 应用程序中,C 语言通常使用字节数组来表示字符串。使用byte数组存储 Java 字符串可以更容易地与 C 语言进行交互,提高应用程序的兼容性。

在 JDK 9 中,引入的 Compact Strings 优化在不改变String底层主要存储结构的情况下,通过更灵活地运用byte数组和字符编码转换等方式,实现了节省内存空间、提高性能和适应新的字符编码需求的目标。这一改进使得 Java 应用程序在处理字符串时更加高效和灵活。

相关文章

Java Jackson 中如何将 JSON 对象转换为字符串

通常来说只需要下面的 1 行代码就可以完成下面的转换了。请考察下面的代码:String newsletterJSON = mapper.writerWithDefaultPrettyPrinter()...

Java Array 和 String 的转换

英文标题【Array to String Conversions】概述本页面中的内容对 Array 和 String 之间互相进行转换的方法进行一些说明。我们可以使用 原生 Java(vanilla...

Python字节转换为字符串 - 如何将字符串转换为字节,以及反向转换

你可以在Python中使用字节来表示二进制形式的数据。在本文中,你将学习如何将字节转换为字符串,以及反之亦然。在我们看转换之前,让我们谈谈Python中的字节是如何工作的。如果你已经理解了这一点,或者...

Java 字符串的split分割方法小细节

实践先来个图,简单展示一下split的两个重载方法;1、先拿一个入参的做个实验:逻辑:定义一个字符串,以 '分割'作为分割符,最后将结果转为集合输出:得两元素,正确;第二次再以 ...

Java 截取字符串的几种操作

在本文中,我们将学习在Java中把一个String截断到所需的字符数的集中方法。首先,我们将探索使用JDK本身来实现这一目标的方法。然后,我们将研究如何使用一些流行的第三方库来实现这一目标。使用JDK...

Java时间格式字符串与Date的相互转化

一、将Date转化为格式化字符串将Date转化为格式化字符串是利用SimpleDateFormat类继承自 java.text.DateFormat类的format方法实现的:public final...