美好365app官方下载-beat365体育ios版下载-365bet手机客户端

中文乱码

中文Big5码被误认为ASCII 编辑 欧洲生产的某些电脑并无法辨识Big5双位元字码的中文字元,相反的,它们会把位于00到7F间的字码视为ASCII,而80到FF

中文乱码

中文Big5码被误认为ASCII

编辑

欧洲生产的某些电脑并无法辨识Big5双位元字码的中文字元,相反的,它们会把位于00到7F间的字码视为ASCII,而80到FF间的字码则视为EASCII,例如:

中文字

Big5码的高位/低位位元

BA

FB

B0

F2

A6

CA

AC

EC

A4

A4

A4

E5

A4

6A

A4

AD

BD

58

对应的ASCII/EASCII字元

º

û

°

ò

¦

Ê

¬

ì

¤

¤

¤

å

¤

j

¤

­

½

X

也因此,中文字串“維基百科中文大五碼”会显示为乱码“ºû°ò¦Ê¬ì¤¤¤å¤j¤ ½X”。

UTF-8与Big5的相互转换

编辑

随著UTF-8的普及化,许多繁体中文的IRC频道也逐渐从Big5转变成UTF-8;然而在这种过渡时期中,仍然有不少IRC频道是采用Big5的,所以使用者参与了新的频道时,通常会想要先确定自己的字元编码有没有设错,人们最常用的测试字眼不外乎:

编码

内容

UTF-8

中文

測試

導航

Big5

銝剜��

皜祈岫

撠舘⏛

嚙踝蕭乱码问题

编辑

当一段大五码文本被错误地以UTF-8解码再编码再以大五码解码,由于在被以UTF-8解码时的无效字符被以Unicode的“未识别字符(U+FFFD)”作为内码记录,而那替代字符的UTF-8编码的十六进制为“EF BF BD”。当那替代字符因为按UTF-8解码会出现大比例的无效字符而令其大片大片地出现,进而在被UTF-8再编码再以大五码解码后读码框取到UTF-8替代字符的编码的第一个字节和第二个字节的十六进制“EF BF”解码得到“嚙”字,接下来的读码框横跨两个UTF-8替代字符取到第一个UTF-8替代字符的第三个字节和第二个UTF-8替代字符的第一个字节的十六进制“BD EF”解码得到“踝”字,再接下来的读码框取到第二个UTF-8替代字符的第二个字节和第三个字节的十六进制“BF BD”解码得到“蕭”字,连起来就是“嚙踝蕭”。这样的情况反复出现就令其中出现大量“嚙踝蕭”字样。并且由于在被以UTF-8解码时所出现的各种无效字符与有效字符的各种组合,再以大五码解码后其中会有许多不是出现在“嚙踝蕭”子序列中的“嚙”、“蕭”字样。

另外其他编码的非UTF-8文本或非文本二进制数据被错误地以UTF-8解码再编码再以大五码解码也会如上产生嚙踝蕭乱码,然而由于原字节序列的特征会部分地传递至以UTF-8解码后所产生的中间阶段乱码,这样因此由这些方式产生的乱码跟大五码文本被错误地以UTF-8解码再编码再以大五码解码所产生的乱码便具有不同的特征。

← 上一篇: 日本狗的品种及特点(揭秘日本犬之多样性与魅力)
下一篇: 书香苏州怎么还书 书香苏州还书时间多长 →

相关推荐

喜马拉雅

喜马拉雅

开放平台对接海量精彩内容 云剪辑在线音频剪辑神器 主播培训兼职副业,兴趣赚钱 小雅智能智能硬件,连接赋能 车联网平台自在出行,听我想

微信朋友圈发不出去的解决方法

微信朋友圈发不出去的解决方法

在数字社交日益普及的今天,微信朋友圈已成为我们分享生活点滴、交流情感的重要平台。然而,偶尔遇到朋友圈内容发布失败的情况,无疑会

steam一直正在登录转圈进不去、卡在正在登录界面的解决策略

steam一直正在登录转圈进不去、卡在正在登录界面的解决策略

Steam作为全球知名的游戏平台,汇聚了海量的精彩游戏。不少玩家在登录Steam时却遇到了“一直正在登录转圈进不去,卡在正在登录界面”的棘手

15款适合初学者的动画制作软件,新手必看!

15款适合初学者的动画制作软件,新手必看!

随着技术的不断发展,在手机、网页等媒介中,使用动效可以为用户提供更好的动态沉浸式体验,增加亲和力和趣味性,也有利于品牌的建立。

今年最流行的动漫,不会是17年前的《猪猪侠》吧?

今年最流行的动漫,不会是17年前的《猪猪侠》吧?

原创 差评君 差评 最近有什么热度直线上升的网络人物么? 有的,比如猪猪侠。 不知道什么时候开始,猪猪侠突然开始以表情包的形式乱飞,

鸡蛋和鸭蛋,哪个更有营养?为什么我们天天吃鸡蛋,而不是鸭蛋?

鸡蛋和鸭蛋,哪个更有营养?为什么我们天天吃鸡蛋,而不是鸭蛋?

同样是蛋,为什么我们几乎每天都会吃鸡蛋,而鸭蛋偶尔才吃一次? 关于这个问题,在很小的时候,我就问过大人,每个人对于鸡蛋和鸭蛋的不