String类的编码和解码方式 - 问答

在Java中，String类通常使用UTF-16编码。UTF-16是一种变长编码，它使用两个或四个字节来表示字符。对于大多数常用字符，UTF-16只需要一个或两个字节，但对于某些辅助平面上的字符（如某些表情符号），则需要四个字节。

然而，需要注意的是，Java中的String类实际上并不直接负责字符的编码和解码。相反，它使用char类型来表示单个字符，这些字符在内部以UTF-16序列的形式存储。当你需要将字符串转换为字节流（例如，写入文件或网络传输）时，Java会自动将字符串转换为UTF-16编码的字节序列。同样地，当你从字节流中读取字符串时，Java会自动将UTF-16编码的字节序列转换回字符串。

如果你需要执行自定义的编码和解码操作，你可以使用Java的Charset类。例如，你可以使用StandardCharsets.UTF_16BE来表示UTF-16 Big-Endian编码，或使用StandardCharsets.UTF_16LE来表示UTF-16 Little-Endian编码。以下是一个简单的示例，演示了如何使用Charset类将字符串转换为UTF-16编码的字节序列，以及将字节序列转换回字符串：

import java.nio.charset.Charset;
import java.nio.charset.StandardCharsets;

public class StringEncodingExample {
    public static void main(String[] args) {
        String originalString = "Hello, World!";
        
        // 将字符串转换为UTF-16编码的字节序列
        byte[] utf16Bytes = originalString.getBytes(StandardCharsets.UTF_16BE);
        System.out.println("UTF-16 Big-Endian bytes: " + new String(utf16Bytes, StandardCharsets.UTF_16BE));
        
        // 将UTF-16编码的字节序列转换回字符串
        String decodedString = new String(utf16Bytes, StandardCharsets.UTF_16BE);
        System.out.println("Decoded string: " + decodedString);
    }
}

在这个示例中，我们首先将原始字符串转换为UTF-16 Big-Endian编码的字节序列，然后再将其转换回字符串。输出结果应该与原始字符串相同。

0 赞

0 踩