加载中
掘金15W沸点简单分析(二)

一、数据预处理与入库 获取到了原始数据之后,下一步就是清洗入库。 1.1 数据模型 因为是简单分析,所以只获取话题、用户、消息三块内容。具体如下: class Pins(object): """ 沸点 """ msg_...

2020/09/01 16:51
2.6K
掘金15W沸点简单分析(一)

数据分析之数据采集(仅Web爬虫相关)。本文继续从爬虫入手。不过这次使用的是Python。 一、另一种方式的爬虫 爬虫通常是:①得到目标网页URL;②发起HTTP请求得到网页数据;③使用各种方式解析...

Jinja2初探

使用Flask也有一段时间了,一直对Jinja2模板了解并不是太深。只是在用到的时候,去查一下文档而已。

2017/08/07 16:27
81
python基础 -- 内建函数

合理利用内建函数,提高代码效率以及长度

2014/11/20 20:29
728
virtualenv 安装及使用

virtualenv is a tool to create isolated Python environments.

2014/11/12 17:37
3.6W
Git 分布式版本控制 -- (1、基本使用)

git分布式版本控制,基本使用。

2014/11/11 10:51
405
python爬虫----(scrapy框架提高(1),自定义Request爬取)

之前一直使用默认的parse入口,以及SgmlLinkExtractor自动抓取url。但是一般使用的时候都是需要自己写具体的url抓取函数的。

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部