Python学习笔记 (字符串和编码)

字符串和编码
1、ASCII 码没有中文,一个英文一个字节
2、Unicode  支持中文,两个字节一个字符,英文字符前面补0
3、UTF-8,变长编码,1-6个字节。常用的英文是一个字节,汉字是三个字节,生僻字符4-6个字节。能够比Unicode节省空间。
字符        ASCII                   Unicode                            UTF-8
A            01000001            00000000 01000001         01000001
          x                          01001110 00101101         11100100 10111000 10101101
4、计算机内存中使用Unicode编码,当要保存到硬盘或者需要传输的时候,转换为UTF-8编码。
5、占位符
占位符替换内容
%d整数
%f浮点数
%s字符串
%x十六进制整数
整数和浮点数还可以指定是否补0和整数与小数的位数,%0d表示前面补一个0,%.4f表示小数点后4位。
还可以指定位数,%2s表示有两个字符,如果替换的字符串是1个字符,前面补空格。
例子
print('%2s'%'a')
返回  ‘空格a’

评论