搜索引擎中每个term的倒排表是按照ID排序的,排序是为了求交时方便归并。书上说的搜索引擎的倒排索引,倒排表都是按照ID升序排列的。但是仔细看我厂的搜索引擎,倒排表是按照ID降序排列的。毕...
多参数是允许的,会把多余的参数丢弃。少参数是不允许的。(如果方法有默认参数,可以少参数,但Func不支持默认参数功能)。 实现会在多个参数版本中选择实现一个。 fr_Obj sys_Func_call__...
Android Studio 下载后还有很多东西要联网下载,由于不能说的原因都下载失败。 Android SDK 可以设置网络代理来下载 File->Setting->Appeaarance & Behavior -> System Settings ->Http Prox...
启动速度比Eclipse慢,但是运行速度比Eclipse快很多。还有很多皮肤可以换,新出的FlatLaf系列皮肤都很好看,还有很多第三方的皮肤可以配。缺点就是对中文支持不好,要做一些配置。Eclipse的黑...
select,poll,epoll都是IO多路复用的机制。 select select每次调用都有拷贝列表数据到内核,每次都要做很多添加等待队列工作,唤醒时又要做很多移除工作。 进程唤醒后,还需要遍历一次才能知...
Wikipedia上介绍了一种叫weighted reference counting的方法。大概思路是不一定要建一个引用就把引用计数加1,也可以是建一个引用就把引用计数加n,只要销毁引用的时候也减相同的n就能保证语...
所谓新词,需要做到词内凝固度足够高,左右相邻字自由度足够高。 我们使用点互信息(pointwise mutual information)来衡量凝固度,使用信息熵来衡量自由度。 互信息 PMI = p(x,y) / (p(x)p(y)...
查看CPU信息 lscpu cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c 查看内存信息 grep MemTotal /proc/meminfo cat /proc/meminfo 查看操作系统 uname -a cat /etc/issue 查看硬盘 ...
方差简化公式 平均差 平均差是总体所有单位与其算术平均数的离差绝对值的算术平均数 四分位差 四分位差(quartile deviation),它是上四分位数(Q3,即位于75%)与下四分位数(Q1,即位于2...
Viterbi和Dijkstra算法看起来比较像,两者的区别: Dijkstra算法适应范围更广。Viterbi算法用在特殊的有向无环图中,而Dijkstra算法可以用在大部分图结构中(有向无向、有环无环都可以)。 搜索...
吐槽Python语言
信息熵 互信息(Mulual information) 条件熵 交叉熵 H(p,q)=∑ p(x)∗log( 1/q(i) ) 联合熵 H(X,Y)=−∑ p(x,y) ln p(x,y) 相对熵 D(p||q)=H(p,q)-H(p)......
没有更多内容
加载失败,请刷新页面