3

Java 中 String 字符串可以有多长?65535?

 2 years ago
source link: http://www.justdojava.com/2021/11/06/string/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Java 中 String 字符串可以有多长?65535?

发表于 2021-11-06

| 分类于 Java

毫无疑问 String 是作为一个 Java 开发工程师天天都需要打交道的类,那么如果问你 String 字符串的最大长度是多少你知道吗?有的小伙伴可能想都没想,就直接回答 65535,那么问题来了,真的吗?今天阿粉就带你研究一下。

首先对于 String 我们可以有下面几种用法:

  1. 定义一个 String 类型的变量:private static final String STRING_TEST = "xxxxxxxxxxx"; 或者 String newString = "newString";
  2. 通过在方法中定义 String 类型的变量,通过字节流创建字符串:byte[] bytes = new byte[length];String s = new String(bytes);

有朋友可能会说,这两种不都是定义一个字符串变量,有什么区别吗?表面上看是没什么区别,但是实际上区别还是蛮大的。首先第一种方式定一个静态类变量,或者普通的字符串变量,这种形式字符串是存放在栈中的;而第二种方式字符串是存放在堆中的。这个时候有的小伙伴又要问了,这存在不同的地方有什么关系呢?首先这关系可大了!

当字符串存放在栈中的时候,根据 class 文件的结果规范,我们可以看到所采用的的存储格式是这样的:

 CONSTANT_Utf8_info {
       u1 tag;
       u2 length;
       u1 bytes[length];
   }

其中 u2 是一种类似于 Javaint 一样的数据类型,只是表示的是一个 2 个字节的数据类型,只不过 int 是 4 个字节,这也就意味着允许的最大长度为 65535 个字符。所以我们可以得出一个结果,当字符串存放在栈内存中的时候,字符串的长度可以达到 65535。

看到这里小伙伴又不耐烦了,说到:你看吧,我就说是 65535 吧,还不信。

别急,到这里我们才说了一半,接下来我们在看看第二种方式。很显然第二种方式不管是通过字节流的方式,还是 new 一个对象,存放的位置都是早 Java 的堆内存中,而且通过 String 的源码,我们可以看到了,底层是通过一个 char[] 数组来存放的。

 /** The value is used for character storage. */
    private final char value[];

那么我们就知道了,字符传的大小就跟数组的长度有直接关系了,另外在定义数组长度的时候,我们最多只能定义 int 类型的最大值,也就是Integer.MAX_VALUE = 0x7fffffff; 而且 String 类的 length() 方法的返回值也可以看出来,返回的类型是 int ,数值最大也是Integer.MAX_VALUE = 0x7fffffff;

/**
     * Returns the length of this string.
     * The length is equal to the number of <a href="Character.html#unicode">Unicode
     * code units</a> in the string.
     *
     * @return  the length of the sequence of characters represented by this
     *          object.
     */
    public int length() {
        return value.length;
    }

所以看到这里,我们又得出了一个结果,**当字符串存放在堆内存的时候,最大的长度为 Integer.MAX_VALUE = 0x7fffffff; **。不过需要注意的是,这个数值是理论上的,其实很多虚拟机会在数组中加入一些字符,所以实际的数值是达不到这么多,另外我们在 ArrayList 中也可以看到这个验证,这里定义的最大值就是Integer.MAX_VALUE - 8; 而不直接采用最大值。

01.png

此外上面说的最大值是在我们的虚拟机有这么大的内存的前提下,如果说我们的虚拟机配置的内存比这个要小,那也是达不到这么大。我们可以通过 JVM 参数来配置虚拟机的内存大小,-Xms512m 设置堆内存初始值大小。-Xmx1024m 设置堆内存最大值。下面是阿粉在自己的电脑上测试的效果,可以看到,当开始提示Requested array size exceeds VM limit,后面因为阿粉的电脑内存不够了,所以一直分配失败,达不到最大值,只能降低长度了。

02.png

另外还要注意一个点,那就是我们在这里说的长度针对的都是英文字符,如果是是中文的话是没有那么长的,那么如果对应中文的话字符串会有多长呢?这个问题留给大家在评论区里面回答了。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK