更改JDK默认编码为UTF-8

/

2019-7-29

描述

由于JDK是国际版的,在编译的时候,如果我们没有用 -encoding 参数指定我们的JAVA源程序的编码格式,则javac.exe首先获得我们操作系统默认采用的编码格式,也即在编译java程序时,若我们不指定源程序文件的编码格式,JDK首先获得操作系统的file.encoding参数(它保存的就是操作系统默认的编码格式,如WIN2k,WIN7,它的值为GBK),然后JDK就把我们的java源程序从file.encoding编码格式转化为JAVA内部默认的UNICODE格式放入内存中。然后,javac把转换后的unicode格式的文件进行编译成.class类文件,此时.class文件是UNICODE编码的,它暂放在内存中,紧接着,JDK将此以UNICODE编码的编译后的class文件保存到我们的操作系统中形成我们见到的.class文件。对我们来说,我们最终获得的.class文件是内容以UNICODE编码格式保存的类文件,它内部包含我们源程序中的中文字符串,只不过此时它己经由file.encoding格式转化为UNICODE格式了。当我们不加设置就编译时,相当于使用了参数:javac -encoding gbk XX.java,当然就会出现不兼容的情况。

解决办法是:

应该使用-encoding参数指明编码方式:javac -encoding UTF-8 XX.java

获取系统默认编码:

  1. System.out.println("Default Charset=" + Charset.defaultCharset());
  2. System.out.println("file.encoding=" + System.getProperty("file.encoding"));
  3. System.out.println("Default Charset in Use=" + FileTools.getDefaultCharSet());
  4. public static String getDefaultCharSet() {
  5. OutputStreamWriter writer = new OutputStreamWriter(new ByteArrayOutputStream());
  6. String enc = writer.getEncoding();
  7. try {
  8. writer.close();
  9. } catch (IOException e){
  10. e.printStackTrace();
  11. }
  12. return enc;
  13. }

使用的时候最好是统一的格式,比如java文件保存格式也同样为 UTF-8 格式的


在命令行的中使用时先设置一个java变量
set JAVA_TOOL_OPTIONS=-Dfile.encoding=utf-8 -Duser.language=en -Duser.country=US


通过命令行对JAVA文件进行编译
javac -d ../ *.java

这样生成出来的.CLASS文件格式也同样为 UTF-8 编码的

同样在执行java或者jar包前,要设置一个临时的或者永久的变量
set JAVA_TOOL_OPTIONS=-Dfile.encoding=utf-8 -Duser.language=en -Duser.country=US

这样才可以保证你的程序在运行时,也采用的是 UTF-8 编码格式

JAVA_TOOL_OPTIONS 官方解释
官方解释

encodeURIComponent编码后java后台的解码

解决方法一:

JavaScript:

window.self.location=”searchbytext.action?searchtext=”+encodeURIComponent(encodeURIComponent(seartext));

java:

searchtext=java.net.URLDecoder.decode(searchtext,”UTF-8”);

为什么要两次编码的原因:后台java代码给searchtext赋值的时候,本身已经使用了一次解码,不过解码的结果依然不对。所以我们可以在页面上进行两次编码操作,这样后台自动的那次就可以抵消掉一次,然后在使用searchtext=java.net.URLDecoder.decode(searchtext,”UTF-8”);进行一次解码就好了。

解决方法二:

另外还有一种方法是JavaScript进行一次编码,后台java处理时换种想法就好了:

java代码:

String s = new String(request.getParameter(“name”).getBytes(“ISO8859-1”), “UTF-8”);

js解码函数 escape,encodeURI,encodeURIComponent比较

js对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decodeURIComponent

1、 传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断。

例如:

  1. <script language="javascript">
  2. document.write('<a href="http://passport.baidu.com/?logout&aid=7&u='+encodeURIComponent("http://cang.baidu.com/bruce42")+'">退出</a>');
  3. </script>

2、 进行url跳转时可以整体使用encodeURI

例如:

  1. Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21");

3、 js使用数据时可以使用escape

例如:搜藏中history纪录。

4、 escape对0-255以外的unicode值进行编码时输出%u****格式,其它情况下escape,encodeURI,encodeURIComponent编码结果相同。

最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,所以如果给后台传递参数需要使用encodeURIComponent时需要后台解码对utf-8支持(form中的编码方式和当前页面编码方式相同)

escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z

encodeURI不编码字符有82个:!,#,$,&,’,(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z

encodeURIComponent不编码字符有71个:!, ‘,(,),*,-,.,_,~,0-9,a-z,A-Z

Reproduced please indicate the author and the source, and error a link to this page.
text link: /jdkcoding.html

不要让懒惰占据你的大脑,不让要妥协拖跨你的人生。青春就是一张票,能不能赶上时代的快车,你的步伐掌握在你的脚下,good luck3

Say something...

Website
Username
Email
2019/7/29上线