加载中
使用浏览器内核爬取OTA数据

因为业务需要,所以会有一些爬虫的设计需求。 目前这一部分的内容都是外包项目,领导说需要根据实际情况,研究一下自己研发的可能性。 但是绝大部分这些OTA网站都做了大量的异步加载,并且接...

2015/10/01 22:56
746
Flask principal 权限管理组件

# -*- coding: utf-8 -*- from flask import (     abort,     flash,     Flask,     g,     redirect,     render_template,     request,     s...

2015/05/21 13:41
778
[转]Servlet3特征 异步Servlet

转自:http://www.importnew.com/8864.html 理解异步Servlet之前,让我们试着理解为什么需要它。假设我们有一个Servlet需要很多的时间来处理,类似下面的内容: package com.journaldev.ser...

2014/12/05 22:18
37
Python的OO思想

想当年大二的时候,在学校学习Java, 最牛逼的OO思想,用了3页纸就讲完了,还是清华大学出版社的呢。 后来全凭自己啃视频,啃代码才搞懂什么叫做OO。 现在学习Python,就用自己的方式,好好学...

2014/12/05 22:18
30
使用MySQL作为SOLR的索引源

首先,需要在solrconfig.xml中增加 <lib dir="../../../dist/" regex="solr-dataimporthandler-.*\.jar" /> <!--需要增加依赖包,如果有数据库驱动,也需要增加到依赖路径中 --> <reques...

2014/12/05 22:18
70
Log4j MDC使用案例

Log4j MDC使用案例 import java.io.IOException; import java.util.Map; import java.util.UUID; import javax.servlet.Filter; import javax.servlet.FilterChain; import javax.serv...

2014/12/05 22:18
159
Oozie使用java启动外部包

在Oozie的workflow上面调用jar包,可以有两种方式, 一种是使用shell来调用: <action name="user_action_info_q_node"> <shell xmlns="uri:oozie:shell-action:0.2"> ...

2014/12/05 22:18
58
Solr debugQuery使用体会

使用solr,就使用到各种的排序和boost。 在公司的站内搜索引擎,就遇到了排序的问题,各种各样的条件,融合在最后一个分数里面。 开启debugQuery,就可以看到每个document的打分逻辑原理。 ...

2014/12/05 22:18
72
使用System.getProperties()获取系统参数 配置代理

1.java的System.getProperty()方法可以获取的值 java.version Java 运行时环境版本 java.vendor Java 运行时环境供应商 java.vendor.url Java 供应商的 URL java.home Java 安装目录 java.v...

2014/12/05 22:18
35
Hive连接超长Hbase宽表异常

我们用Hive去连接一个Hbase款表,大概有150多个字段。 因此,就报了异常: FAILED: Error in metadata: MetaException(message:javax.jdo.JDODataStoreException: Put request failed : INS...

2014/12/05 22:18
79
[转]前端看Cookie

这是掌握cookie最后的一个障碍: 缺省情况下cookie只能被在 同一个Web服务器上同一个路径下设置了该cookie的网页读取. 例如,如果在http://chimp.webmonkey.com/food/bananas/banana_puree....

2014/12/05 22:18
14
Bloom Filter布尔过滤

最近在研究Python,想用Python写一个爬虫来爬数据。 爬虫有几个关键的地方,一个是防止如何递归地重复爬一个网址,一个就是页面信息的解析。 那么这里主要介绍一下如何通过bloom filter达到判...

2014/12/05 22:18
16
iBatis里面使用事务

一般事务层都是由Spring AOP进行管理的。 但是遇到一些特殊的insert需要批量处理。这里我们就会用到iBatis的事务功能。 贴一下代码,注意,顺序不能搞错。搞错了就会报错!! try {   this.g...

2014/12/05 22:18
46
SQL之WITH语句进阶

WITH语句其实是SQL ANSI标准语句之一。 我们在Oracle里面使用CONNECT BY语句进行递归查询。实际上,CONNECT BY仅仅属于Oracle自身的递归查询实现。 在标准的数据库中,如DB2,SQL SERVER,P...

2014/12/05 22:18
38
图解FPGrowth 算法

最近接触到一些用Mahout开发的数据挖掘代码,于是顺便就把算法原理给研究了一下。 得到了附件中的PPT FP-Growth算法的应用有很多。 除了最令人熟悉的啤酒尿布算法以外。 还有“共词”提取。 ...

(转)什么是“第一方Cookie”、“第三方Cookie”

在了解什么是“第一方Cookies”、“第三方Cookies”之前,我们应该先了解一下,什么叫Cookie? 什么叫Cookie? Cookie是网站存放在客户端的一小段数据。一般的,网站为了提升用户体验,在客户...

2014/12/05 22:18
10
将你的Linux命令放在后台执行

文章refer to: http://www.cnblogs.com/lwm-1988/archive/2011/08/20/2147299.html 有两种方式: 1. command & : 后台运行,你关掉终端会停止运行 2. nohup command & : 后台运行,你关掉终...

2014/12/05 22:18
19
[转]Python version 2.7 required, which was not found in the registry

refer:http://www.cnblogs.com/min0208/archive/2012/05/24/2515584.html 不能在注册表中识别出来python2.7 在网上找了方法,仅作笔记,供下次使用 方法: 新建一个register.py 文件,把一下...

2014/12/05 22:18
7
Hive的UDTF

Refer to:http://blog.csdn.net/wf1982/article/details/7623708 1.介绍 UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many maping) 的需求。同时,也可...

2014/12/05 22:18
53
StringTokenizer初步了解

在Hadoop里面经常看到有StringTokenizer,用来分割字符串。 那么在这里就简单地了解一下这个类到底有什么用。 1. StringTokenizer(String str):构造一个用来解析str的StringTokenizer对象。...

2014/12/05 22:18
6

没有更多内容

加载失败,请刷新页面

返回顶部
顶部