文档章节

python unicode 引发的血案!!! unicode

siri李
 siri李
发布于 2016/11/24 17:26
字数 256
阅读 8
收藏 0

今天执行一个简单的入库操作,但是发现入库的中文都是 unicode编码,在网上查了半天,也没检查出什么原因,最后还是找到了解决的方法,这里只讲思路。

    1:确认是什么类型,拿到变量以后,可以通过type来判断到底是什么类型,有unicode 和str类型。

    2:如果是unicode类型,需要调用encde 和decode 方法进行解码,加码。

    

for segment in segments:
#         print segment[0]
#           segments_en.append(   [ segment[0] ,   wordAttr.get(segment[1]) ])
#         print isinstance(segment[0], unicode);
        word = segment[0].encode('utf-8');
#         print 'aaa',isinstance(word, str);
#         print isinstance(segment[0], str);
#         print word;
        item={'word':word,'wordtype':wordAttr.get(segment[1])}
#         print item;
        segments_en.append(item);
#     return segments,segments_en

#最后作为json字符串输出的时候的这个ensure_ascii=False,很重要,就是通过这个,将整个json入库的时候,显示中文成功的。
    return json.dumps(segments_en,encoding="UTF-8", ensure_ascii=False);

以此记录

© 著作权归作者所有

共有 人打赏支持
siri李
粉丝 3
博文 34
码字总数 22317
作品 0
昌平
高级程序员
私信 提问
python chr()、unichr()和ord()

chr()、unichr()和ord() chr()函数用一个范围在range(256)内的(就是0~255)整数作参数,返回一个对应的字符。unichr()跟它一样,只不过返回的是Unicode字符,这个从Python 2.0才加入的u...

索隆
2012/04/23
0
0
Python str() 引发的 UnicodeEncodeError

起因 众所周知,Python 2 中的 UnicodeEncodeError 与 UnicodeDecodeError 是比较棘手的问题,有时候遇到这类问题的发生,总是一头雾水,感觉莫名其妙。甚至,《Fluent Python》的作者还提出...

浮生若梦的编程
2018/10/30
0
0
python 的 string 和 PyQt 的 QString 的区别

以下在 Python2.6和PyQt4.4.4 for Python2,6环境下讨论: Python中有两种有关字符的类型:Python string object和Python Unicode object。主要使用Python string object进行数据输入输出。 ...

不必在乎朕是谁
2013/08/26
0
0
详解 python 中文编码与处理

注意:本文只是针对 python 2,在 python 3 中,编码方式与处理技巧有些许变化,具体请参考: Python 2 与 Python 3 的差异对比: http://my.oschina.net/leejun2005/blog/173553 一、使用中...

大数据之路
2012/08/24
0
0
转-How to Use UTF-8 with Python

from: http://www.evanjones.ca/python-utf8.html Tim Bray describes why Unicode and UTF-8 are wonderful much better than I could, so go read that for an overview of what Unicode i......

玉龙
2012/03/16
0
0

没有更多内容

加载失败,请刷新页面

加载更多

阿里大规模数据中心性能分析

郭健美,阿里巴巴高级技术专家,目前主要从事数据中心的性能分析和软硬件结合的性能优化。CCF 系统软件专委和软件工程专委的委员。曾主持国家自然科学基金面上项目、入选上海市浦江人才计划A...

阿里云官方博客
20分钟前
0
0
Coding and Paper Letter(四十四)

资源整理。 1 Coding: 1.Rstudio2019年会“机器学习应用”的幻灯片,代码和数据 rstudio conf 2019 2.R语言包sparkxgb,Spark上XGBoost的R接口。 sparkxgb 3.自动SQL注入和数据库接管工具。 ...

胖胖雕
22分钟前
0
0
Ubuntu最新的主要操作系统放弃32位支持?

现在是2018年,2019年即将到来——64位处理器已经成为主流很长一段时间了。如果你仍然使用32位的电脑,那么是时候把它扔进垃圾箱了。 我为所有基于Linux的操作系统维护者感到自豪,他们有勇气...

Linux就该这么学
23分钟前
0
0
Fundebug发布Vue插件,简化BUG监控接入代码

摘要: 代码越短越好! 我们发布了fundebug-vue插件,可以简化Vue框架接入Fundebug的代码。 Vue如何接入Fundebug 1. 安装fundebug-javascript与fundebug-vue npm install fundebug-javascrip...

Fundebug
30分钟前
0
0
MySQL学习笔记之二

数据库的操作总结就是:增删改查(CURD),今天记录一下基础的检索查询工作。 检索MySQL 1.查询表中所有的记录 mysql> select * from apps;+----+------------+-----------------------+------...

凌宇之蓝
41分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部