5分钟课堂:输入输出汉字乱码的解决方法

createh55个月前 (02-01)技术教程33

从JDK 19升级到JDK 21和22之后,之前示例程序出现键盘输入的汉字在程序处理时乱码。
具体现象:只要是键盘输入的汉字,不管是输出还是保存到文件,汉字都是乱码,而程序中的汉字字符串常量的输出和保存则没有问题。

非UTF-8格式的源文件编译错解决办法

Windows系统往往默认保存文本文件(包括源代码文件)格式为ANSI/GBK。

JDK 21起全面使用UTF-8作为字符编码,带有汉字注释的源代码如果是ANSI格式,则编译会出错:

javac WriteFile.java

WriteFile.java:9: 错误: 编码 UTF8 的不可映射字符 (0xC3)
      // ?????д??????????????GBK
         ^
WriteFile.java:9: 错误: 编码 UTF8 的不可映射字符 (0xFC)
      // ?????д??????????????GBK
          ^
WriteFile.java:9: 错误: 编码 UTF8 的不可映射字符 (0xC1)
      // ?????д??????????????GBK

解决办法:编译时选择指定字符编码为GBK

javac -encoding GBK WriteFile.java

或者使用文本编辑器程序将源文件另存为UTF-8格式保存后,直接编译也没有问题。

控制台输入输出汉字乱码解决办法

使用如下代码测试,直接输出汉字字符串常量没有问题,初步分析应该是输入处理的问题。

FileWriter fw =  new FileWriter(file);
PrintWriter out = new PrintWriter(fw);
out.println("测试汉字输出 by CHEN");

原来程序的键盘输入语句为:

String s;
BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
while ((s = in.readLine()) != null) {
        out.println(s);
}

输出的文件除了测试的内容汉字正常,其他键盘输入的内容乱码。分析原因应该是命令行窗口默认字符编码为GBK,为了避免乱码,需要在转换处理流这里指定字符集编码为GBK。

修改代码指定字符集GBK:

BufferedReader in = new BufferedReader(
              new InputStreamReader(System.in,"GBK"));

再次测试,文件内容可正常保存汉字。

附完整测试程序代码:

import java.io.*;

public class WriteFile {
  public static void main (String args[]) {
    // Create file
    File file = new File(args[0]);

    try {
      // 命令行窗口默认字符编码为GBK
      //为了避免乱码,需要在转换处理流这里指定字符集编码为GBK
      BufferedReader in = new BufferedReader(
        new InputStreamReader(System.in,"GBK"));   
      
      //默认输出文件编码为UTF-8
      FileWriter fw =  new FileWriter(file);
      PrintWriter out = new PrintWriter(fw);
      out.println("测试汉字输出 by CHEN");
      
      System.out.print("Enter file text.  ");
      System.out.println("[Type cntl-z to stop.]");

      String s;
			// Read each input line and echo it to the screen.
      while ((s = in.readLine()) != null) {
        out.println(s);
      }

      // Close the buffered reader and the file print writer.
      in.close();
      out.close();

    } catch (IOException e) {
      // Catch any IO exceptions.
      e.printStackTrace();
    }
  }
}

相关文章

小技巧!两分钟解决IntelliJ IDEA中文乱码问题

首先,IntelliJ IDEA真的是一款很方便的Java开发工具,但是关于中文乱码这个问题我不得不吐槽,这个编码也弄得这么麻烦干嘛呀?!下面就说一下怎么解决中文乱码问题:1.首先是编辑器的乱码,这个...

照着做!三步搞定Intellij IDEA中文乱码问题

关于JAVA IDE开发工具,Eclipse系列和Intelli IDEA是大部分公司的主要选择,从开发者的选择角度,Intellij IDEA似乎比Eclipse系列更受欢迎一些。当我们使用Inte...

彻底搞定JAVA乱码问题来龙去脉(java如何处理乱码)

在从事JAVA软件程序开发过程中之所以遇到乱码,问题根本原因是解码和编码不一致造成的,比如将某字符串采用utf8编码存入txt,但是读出时却采用gbk,那么打印字符串时输出肯定是会出现乱码的。这个根本...

# mysql 中文乱码问题分析(#mysql表中文乱码)

# mysql 中文乱码问题分析## 一、问题分析:MySQL 中文乱码通常是因为字符集设置不正确导致的。MySQL 有多种字符集,如 latin1、utf8、utf8mb4 等,如果在创建数据库、数...

乱码是怎么产生的?一“文”打尽乱码问题

在我们处理文件或者处理程序字符时,时不时会遇到乱码的情况,而且这些乱码的情况让人很困惑,大多时候都是CV某度一下,看看有没有相关类似情况的博文出现,如果有那就按照博文上的方式一步一步去解决就好,如果没...

一招教你如何解决中文乱码(中文乱码有什么意义)

#头条创作挑战赛#前言在开发JavaWeb项目时,由于不同的浏览器和服务器对请求和响应处理的编码格式不同,从而导致了中文乱码的现象出现。同时许多的编码方式对中文的处理并不是特别好,所以一般我们需要对请...