文档章节

#数据科学#定期整理

Hochikong
 Hochikong
发布于 2017/05/04 01:17
字数 360
阅读 107
收藏 0

illustration

最近沉迷P5无法自拔,不过也遇上一些工作上的挑战

第一是用xshell连接虚拟机时执行python程序,如果写那种用raw_input的程序,只要输错了,按其他键都没法修改输错的内容,此时要用ctrl+backspace删除输错的字符。之前一直不知道这点结果每次都得重新跑程序。

第二是scikit learn的FeatureHasher,主要是拿来把字符串转换为numpy数组,这个函数主要有三种输入:dict、pair(tuple)和string(list),这里重点记录下string样式:

>>> hasher = sklearn.feature_extraction.FeatureHasher(n_features=10,
...                                                   non_negative=True,
...                                                   input_type='string')
>>> X_new = hasher.fit_transform([['a', 'b'], ['a', 'c']])
>>> X_new.toarray()
array([[ 1.,  1.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 1.,  0.,  0.,  0.,  0.,  0.,  0.,  1.,  0.,  0.]])

不过就算只输入一个字符串也可以用:
illustration

scikit learn还有其他的诸如词向量化的函数,不过我似乎暂时用不上。不过我想后面的项目会用到这个。而且我也得早点着手做SOA sklearn的项目。

暂时遇到的问题就是这样。大创项目必定是靠python3,找个时间补下python2迁移到python3的知识比较好

----------------------------------------------5月5日更新---------------------------------------------------

FeatureHasher的执行结果是不变的....对于特定字符必然只出一种结果

参考:
关于featureHasher的示例

FeatureHasher

关于错误字符

© 著作权归作者所有

Hochikong
粉丝 19
博文 113
码字总数 59961
作品 1
广州
程序员
私信 提问
为什么说分析操作是实现业务价值的关键?

按照目前的现状,分析成为不断优化的业务运营的基本框架的内在组成部分的主观感觉之间。如今,数据科学通常是通过一次性努力,或临时部署到生产环境,从而获取新的洞察力和模型的流程,并需要...

avril024
2017/06/27
48
1
数据科学家薪资大比拼,看看行业内TOP5

专栏 | 九章算法 网址 | http://www.jiuzhang.com 虽然数据科学这项工作已经出现了近十年,但到今天为止,还是只有顶尖的科技人才才能胜任这项工作,因此数据科学从业人员的薪资水平在 IT 领...

九章算法
2018/04/30
0
0
数据科学相关文章合集(玉树芝兰)

我写了若干数据科学应用案例文章。为了让读者找寻的时候更方便,在这里做个汇总。今后会定期进行更新维护。 如何用Python做词云? 如何用Python做中文分词? 如何用Python做情感分析? 如何用...

王树义
2017/11/08
0
0
Kaggle调查:2018年数据科学家最常用(和最推荐)的编程语言榜单

数据科学的实践需要使用分析工具,技术和编程语言来帮助数据专业人员从数据中提取见解和价值。Kaggle最近对近24,000名数据专业人员进行的调查显示,Python,SQL和R是最流行的编程语言。到目前...

CashCat
01/24
0
0
月薪 50K 大牛整理!6 张 Python 图谱,看完茅塞顿开!

很多人对于为什么学Python感到迷茫,甚至很多大学里,学校会灌输这样一个概念:Java才是做项目的,Python只是爬数据的。 但是!Python真的不是这样的傻白甜语言,借用经典的Automate the Bo...

CSDN资讯
2018/12/11
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Spring Boot + Mybatis-Plus 集成与使用(二)

前言: 本章节介绍MyBatis-Puls的CRUD使用。在开始之前,先简单讲解下上章节关于Spring Boot是如何自动配置MyBatis-Plus。 一、自动配置 当Spring Boot应用从主方法main()启动后,首先加载S...

伴学编程
昨天
7
0
用最通俗的方法讲spring [一] ──── AOP

@[TOC](用最通俗的方法讲spring [一] ──── AOP) 写这个系列的目的(可以跳过不看) 自己写这个系列的目的,是因为自己是个比较笨的人,我曾一度怀疑自己的智商不适合干编程这个行业.因为在我...

小贼贼子
昨天
7
0
Flutter系列之在 macOS 上安装和配置 Flutter 开发环境

本文为Flutter开发环境在macOS下安装全过程: 一、系统配置要求 想要安装并运行 Flutter,你的开发环境需要最低满足以下要求: 操作系统:macOS(64位) 磁盘空间:700 MB(不包含 IDE 或其余...

過愙
昨天
6
0
OSChina 周六乱弹 —— 早上儿子问我他是怎么来的

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @凉小生 :#今日歌曲推荐# 少点戾气,愿你和这个世界温柔以待。中岛美嘉的单曲《僕が死のうと思ったのは (曾经我也想过一了百了)》 《僕が死の...

小小编辑
昨天
2.5K
16
Excption与Error包结构,OOM 你遇到过哪些情况,SOF 你遇到过哪些情况

Throwable 是 Java 中所有错误与异常的超类,Throwable 包含两个子类,Error 与 Exception 。用于指示发生了异常情况。 Java 抛出的 Throwable 可以分成三种类型。 被检查异常(checked Exc...

Garphy
昨天
42
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部