在Java中,字符和字符串默认使用Unicode编码
\u
表示法:public class UnicodeExample {
public static void main(String[] args) {
char unicodeChar = '\u4F60'; // 你
System.out.println("Unicode character: " + unicodeChar);
String unicodeString = "\u4F60\u597D"; // 你好
System.out.println("Unicode string: " + unicodeString);
}
}
Character
类的方法:public class UnicodeExample {
public static void main(String[] args) {
char unicodeChar = Character.toChars(0x4F60)[0]; // 你
System.out.println("Unicode character: " + unicodeChar);
}
}
String
类的构造函数:public class UnicodeExample {
public static void main(String[] args) {
byte[] unicodeBytes = new byte[]{(byte) 0xE4, (byte) 0xBD, (byte) 0xA0}; // 你
try {
String unicodeString = new String(unicodeBytes, "UTF-8");
System.out.println("Unicode string: " + unicodeString);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
}
注意:在处理Unicode字符时,请确保源代码文件的编码格式与Unicode字符匹配。通常情况下,建议使用UTF-8编码。