加载中
修改user-agent爬取数据 遇到的问题

背景: 爬取某网站数据 发现每次请求修改user-agent可以防止被封 于是就了以下代码: Long s = System.nanoTime() % 100; Long s1 = System.nanoTime() % 100; headersList.add(new BasicHe...

2018/01/30 21:46
83
java.util.StringTokenizer源码学习记录

StringTokenizer stringTokenizer = new StringTokenizer("1aksdhka111as23sda", "as"); while (stringTokenizer.hasMoreTokens()) { System.out.println(stringTokenizer.nextToken());...

2018/01/12 14:44
11
有关字符编码学习记录

Surrogate 這個概念,不是來自 Java 語言,而是來自 Unicode 編碼方式之一 UTF-16 。 具體請見: UTF-16 簡而言之,Java 語言內部的字符信息是使用 UTF-16 編碼。因為,char 這個類型是 16-b...

2018/01/12 14:21
5
idea playframework1.x 日志无法在控制台正常输出

play.Logger.java 中的init方法 就是playframework加载日志文件逻辑 public static void init() { String log4jPath = Play.configuration.getProperty("application.log.path", "/log4...

2018/01/10 16:57
5
LinkedBlockingQueue源码学习笔记

public E take() throws InterruptedException { E x; int c = -1; final AtomicInteger count = this.count; //队列中元素数量 final ReentrantLock takeLock = this.take...

2017/12/21 13:34
6
jsoup解析xml

// 使用Jsoup的xml解析器解析desc Document descXml = Jsoup.parse(desc, "", Parser.xmlParser()); // 修改打印格式为精简打印 descXml.outputSettings(descXml.outputSettings().prettyPr...

2017/12/21 13:12
12
lucene IK分词器 同义词

public class IKSynonymsAnalyzer5x extends Analyzer { @Override protected TokenStreamComponents createComponents(String fieldName) { IKTokenizer5x tokenizer5x = n...

2017/12/13 21:24
140
lucene 学习笔记

http://iamyida.iteye.com/category/335240 各种Query TermRangeQuery NumericRangeQuery PrefixQuery FuzzyQuery WildcardQuery SpanQuery PhraseQuery FunctionQuery CustomScoreQuery Qu...

2017/12/07 14:11
7
lucene IKAnalyzer中文分词器学习(4)

Dictionary类 private Dictionary(Configuration cfg) { this.cfg = cfg; this.loadMainDict(); this.loadStopWordDict(); this.loadQuantifierDict(); } load词库是根据Configurati...

2017/12/02 15:33
11
lucene IKAnalyzer中文分词器学习(3)

/** * 分词,获取下一个词元 * @return Lexeme 词元对象 * @throws IOException */ public synchronized Lexeme next() throws IOException { Lexeme l = null; while ((l = context...

2017/12/02 15:24
6
lucene IKAnalyzer中文分词器学习(1)

<dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</artifactId> <version>5.3.1</version> </dependency> <!--一般分词器,适用于英文分词--> <depe...

2017/12/01 21:21
10
JSON解析工具学习

各个JSON技术的简介和优劣 http://blog.csdn.net/bingducaijun/article/details/51811367 Gson学习 <dependency> <groupId>com.google.code.gson</groupId> <artifactId>gson</artifactI...

2017/11/25 13:45
3
String类 intern方法 学习笔记

http://blog.csdn.net/seu_calvin/article/details/52291082 public static void main(String[] args) { String ss = new StringBuilder("flo").append("at").toString(); System.ou...

2017/11/23 20:41
11
DecimalFormat 用法

http://blog.csdn.net/evangel_z/article/details/7624503

2017/11/16 14:53
3
Intger 自动装拆箱

public static void main(String[] args) { Integer a = 1; Integer b = 2; swap(a, b); System.out.println("a="+a); System.out.println("b="+b); } public stat...

2017/11/16 13:35
2
类加载器学习笔记

自底向上检查类是否已经加载 自顶向下尝试加载类 运行参数 -Xbootclasspath/a:D:/tmp/clz // 由app加载器加载 public class HelloLoader { public void print(){   System.out.println("I am ...

2017/11/09 10:38
3
KMP算法 串匹配

http://www.cnblogs.com/aaronjs/p/4225442.html

2017/11/03 21:46
5

没有更多内容

加载失败,请刷新页面

返回顶部
顶部