加载中
linux环境的Discuz 安装笔记

给一个朋友公司部署一套Discuz, 之前没有接触过,所以需要从头学习安装。 在此记录下,便于下次安装时参照

2016/05/06 17:16
32
nutch2.1中文网站抓取

接上篇,对nutch添加中文网站抓取功能。 1、中文网页抓取 A、调整mysql配置,避免存入mysql的中文出现乱码。修改 ${APACHE_NUTCH_HOME} /runtime/local/conf/gora.properties ###############...

Nutch2.1+mysql+solr3.6.1安装部署

参考资料:http://nlp.solutions.asia/?p=180#tab-3 1、mysql 数据库配置 linux mysql安装步骤省略。 创建数据库与表 CREATE DATABASE nutch DEFAULT CHARACTER SET utf8 DEFAULT COLLATE u...

IntelliJ IDEA 14 database组建执行sql bug

今天在使用idea 14执行一个sql的时候出现了点问题,导致直接删除了整张表的数据。 幸好当天的数据可以通过业务操作重新生成。 所以直接恢复到当天凌晨的数据即可。

2016/05/11 18:02
381
lucene集成IK实现中文分词检索

接上篇,解决lucene中文分词问题。 这里采用IK分词器。 IKAnalyzer2012_u5.zip下载地址:http://code.google.com/p/ik-analyzer/downloads/detail?name=IKAnalyzer2012_u5.zip&can=2&q= 解压...

lucene简单实例

应工作需求,写了个简单lucene索引/检索的实例。就两个main方法,没考虑代码抽象和封装。 lucene包下载: http://labs.mop.com/apache-mirror/lucene/java/3.6.1/ 下载lucene-3.6.1.zip 索引...

《自己动手写网络爬虫》读书笔记-如何判断对象是否存在于海量键值对中

在爬虫系统中,避免重复爬取的方式是将已爬取的url存起来,在爬取新url前对比已爬取的url,如发现已存在则放弃爬取。 类似hotmail等公众邮件系统,需要过滤来自发送垃圾邮件人的垃圾邮件。如...

《自己动手写网络爬虫》读书笔记-简单抓取实例

共包括6个文件,实现获取指定站点的url,并下载页面到本地。 主要支持包: Queue.java package com.hkc.core; import java.util.LinkedList; /** *用链表方式实现队列,用来存储未访问过的u...

dota大神与项目经理

昨天跟朋友玩dota,有点感悟。 朋友是大神级别,于是我随便选一个英雄辅助。 一局下来,输的很郁闷。朋友说你玩辅助就得包鸡包眼(玩dota的童靴,你了解的)。。。。 听着这话似乎很耳熟, ...

项目问题总结三、分表跨月查询速度优化

接上文, 短彩信群发平台的一个特点是数据量大。按日均发送量50W条每天,每月数据在1500W左右。 所以历史库采用分表策略, 每月一张表。另外为提高历史表入库速度,建有当天表一张,每天晚上...

项目问题总结二、hibernate和多线程同时使用需要注意

项目中有段代码,经缩减去掉中间调用环节后如下: XXXService.java private void doXXX(){ ...... bean.setState(1);//任务正在创建中 this.xxxDao.getHibernateTemplate().update(bean); R...

项目问题总结一、全局变量引起的并发问题

最近刚完成了一个短彩信群发平台的开发工作,系统采用springmvc+hibernate+jdbctemplate+mysql架构。其中遇见许多问题,闲暇之余记录下来以避免在后续项目中再犯同样的错误。 先看下面小段代...

冒泡排序法

//定义数组 int num[] = new int[10]; //初始化数组 Random random = new Random(); for(int i=0;i<10;i++){ num[i] = random.nextInt(100); } System.out.println(Arrays.toString(num)); /...

2012/09/07 14:30
30

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部