python unicode 引发的血案!!! unicode
python unicode 引发的血案!!! unicode
李雷岗 发表于11个月前
python unicode 引发的血案!!! unicode
  • 发表于 11个月前
  • 阅读 0
  • 收藏 0
  • 点赞 0
  • 评论 0

腾讯云实验室 1小时搭建人工智能应用,让技术更容易入门 免费体验 >>>   

摘要: 基础不牢靠,对东西一知半解,总是会浪费很多的时间跟尽力

今天执行一个简单的入库操作,但是发现入库的中文都是 unicode编码,在网上查了半天,也没检查出什么原因,最后还是找到了解决的方法,这里只讲思路。

    1:确认是什么类型,拿到变量以后,可以通过type来判断到底是什么类型,有unicode 和str类型。

    2:如果是unicode类型,需要调用encde 和decode 方法进行解码,加码。

    

for segment in segments:
#         print segment[0]
#           segments_en.append(   [ segment[0] ,   wordAttr.get(segment[1]) ])
#         print isinstance(segment[0], unicode);
        word = segment[0].encode('utf-8');
#         print 'aaa',isinstance(word, str);
#         print isinstance(segment[0], str);
#         print word;
        item={'word':word,'wordtype':wordAttr.get(segment[1])}
#         print item;
        segments_en.append(item);
#     return segments,segments_en

#最后作为json字符串输出的时候的这个ensure_ascii=False,很重要,就是通过这个,将整个json入库的时候,显示中文成功的。
    return json.dumps(segments_en,encoding="UTF-8", ensure_ascii=False);

以此记录

共有 人打赏支持
粉丝 2
博文 34
码字总数 22317
×
李雷岗
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: