python3如何改变默认的ascii编码?

422次阅读
没有评论

python3如何改变默认的ascii编码?

我们都知道很多软件里会自带一些工具,大部分使用起来还是比较顺手的,但是总会遇到一些不好用的工具,这时候我们就需要找一些其他的方法替换一下。提到utf-8小伙伴们肯定不陌生,我们在之前的文章中有反复提及。python的字符串默认的的是另一种编码,很多人还是喜欢用utf-8,所以今天小编教大家改变默认的ascii编码方法。

 

Python默认字符串采用的是ascii编码方式,如下所示:

python -c "import sys; print sys.getdefaultencoding()"
Ascii

 

可以通过#coding:utf-8 指定页面默认编码为utf-8(ps:但系统默认还是ascii)

字符串的编解码都是以unicode为中间编码,无法直接完成转换,python会自动按其系统默认编码方式解码为unicode,再编码成另一中编码格式

比如:

#coding:utf-8
s = '中文'
print s.decode('gbk')

 

报错解决:

#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys
# reload(sys)
# sys.setdefaultencoding('utf-8')
s = '中文'
 
print [s]
print s.encode('gbk')

此时报错为UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe4 in position 0: ordinal not in range(128) 猜测虽然指定了当前页面为utf-8,但因为直接encode()转换程序会自动先按照系统默认的编码(此时还是ascii) decode一次成unicode,再从unicode编码为gbk, 因为s编码为utf-8,明显解码出错

 

有两种解决办法

1 手动解码 print s.decode(‘utf-8’).encode(‘gbk’)

2 改变系统默认编码,即加入这两句

reload(sys)
sys.setdefaultencoding('utf-8')

 

相信看完本篇文章后,我们已经学会把默认字符串采用的ascii编码换成utf-8了,相信后者大家使用起来更为顺手。

 

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:wuyou2021-05-21发表,共计922字。
新手QQ群:570568346,欢迎进群讨论 Python51学习