记事本utf8编码什么意思,记事本怎么转utf-8

首页 > 大全 > 作者:YD1662022-12-25 02:07:10

ASCII:

ASCII码用一个字节(8bit)表示,总共有128个,包含了大小写字母、数字和一些符号。

GB2312:

为了把中文进行编码,中国制定了GB2312编码,一个中文占用两个字节。

Unicode:
全世界各个国家都有自己的编码标准,那么在使用到多个国家的文字的文本时就会出现乱码。

这时Unicode编码标准出现了,Unicode把各种文字都统一到Unicode字符集里,一个字符占用两个字节,比较生僻的字符需占用4个字节。

UTF-8:

Unicode标准解决了各个国家文字编码的冲突问题,这时如果有一文本主要都是英文的话,使用Unicode编码所需要的存储空间就比Ascii编码要多一倍。于是UTF-8出现了,UTF-8是一种可变长编码,它把Unicode字符编码成1-6个字节,汉字是3个字节,比较生僻的需要4-6个字节,而且UTF-8编码很好地兼容ASCII编码,使得原来使用ASCII编码的软件能够正常运行。

因为在内存中定长的编码可以被快速访问到,所以为提高处理效率,在计算机内存中使用Unicode编码。而为提高存储利用率,需要存储到硬盘时使用UTF-8编码。

用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件。

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.