public class CharsetGuessTools extends Object
Constructor and Description |
---|
CharsetGuessTools() |
Modifier and Type | Method and Description |
---|---|
static String |
doGuess(byte[] bytes)
根据字节码数组,猜测编码类型
依据:如果文本头有bom信息则可知其对应的字符编码。 此外,GBK与UTF-8都有可能,二者都可以没有bom信息。经观察发现,ASCII对应的字符是二者一致的部分, 经尝试多个中文字符,发现在UTF-8中的编码在以16进制字符串表示时,基本上是以“E”开头,而GBK则不是。 准确性还有待验证,如果猜测不准确,请联系作者:嗨啵 电子邮箱:J@hybo.net |
Copyright © 2018. All rights reserved.