加载中
楼主 其实问的是 把带转义符的引号去掉转义符。楼上说通过json解析的是比较标准的答案,但是能直接把 转义符加上引号替换为引号是我认为比较合理的,比把转义符替换为空,要准确,又比用json解析的方式更加效率。这个问题其实就类似 使用圆周率到底是用根本的无效循环小数还是用3.14还是3.141592653的问题
@5G加ios
"column":["1"]}},"writer":{"name":"hdfswriter","parameter...
int是4byte,32bit,乘以50万乘以8千,看是多少GB咯。如果你的矩阵 里面不是int就换对应的内存占用数了。CPU不够执行时间长呗,不存在说CPU 不够的说法。
@sky_m
求指教自己写了一个perl 程序,目的是生成50万*8千的矩阵。可能是内存或是CPU不足导致out of memo...
查重,你还以为有什么可以自动帮你解析。不规则的网页的方式吗?征服的这些网站你都,觉得没有规律,你觉得全网的网站会有规律吗? 300个。政府网站那你就要有300个规则。
@wdyyy
需要做我国近300个地级市关于政府应急预案的爬虫,考虑了利用selenium调用网站搜索框,网站全爬和google...
同问,如果是真的那就牛B了。可能我在传统行业,加班也不少,这文章的第一阶段我用了三年,第二阶段,是第四年换了项目换了岗位才开始的,也用了两年。现在重新换工作,从头开始。
@编辑部的故事
在某一线互联网公司的任职生涯马上就要结束了,回想起来,从 16 年校招加入,到今年年初离职,在这快三年的时间里,公...
帖子原本也没有提到技术,就是讲万维网之父对现在互联网的看法和自己的期望。再者,我的评论答复说的都是层主的局限性眼光,这种局限性让层主这位不识庐山真面目,只缘身在此山中。让他这位在这些回复的人里面离解决这个问题最近最有可能的从业者,一叶障目不见泰山。这是多么的可惜。如果说,层主跳出了,现有的所有技术已经思考过了,把所有的可能方案分析过,再来说搞不了,我和二楼不会来哔哔。而且会从我们无知的层面来和层主讨论,方案,也许还能给出灵感。当然,说句不好听的。这个方案在这里讨论的很完美又怎么样,还不是落不了地,相比于万维网之父。我们更加人微言轻。
@h4cd
在本周二一个万维网 30 周年的纪念活动上,万维网之父 Tim Berners-Lee 表示当前的网络已经远离初心...
从层主的答复来看,你局限在你现有的技术里面了。从我的理解,你提出的三个问题,alwayson和家庭宽带的带宽的瓶颈来说,我觉得你是有什么误解,把你平时所涉及技术,自动对号入座的带入了。我的隐私为什么要alwayson,还有我的公开给大家的数据为什么要放在我自己本地。之后再说,你说的我不懂你说的技术。计算机科学与技术的专业底子,完全有能力从二进制开始的层面往上到OS,到内核,到协议,再到应用层,去理解,甚至重构这个计算机和网络世界。只是这么多年的技术沉淀,而且除非体系重构,做出来的还是在业务层面原来一样的东西没有意义罢了。层主口口声声说,聊技术不聊政治,那你又说Tim搞不定Apple搞得定,这是聊技术还是商业?单说你说Tim搞不定,就已经在说政治了。而我的本意和政治无关,我说的就是,不要做一个书呆子,陷入现有技术太深,要有推翻现有技术的勇气和意识。没有说一定要你去推翻现有技术,而是说如果你没有这个意识,有些问题,不跳出现有技术的框框,你是找不到解决方案的,只有 思路打开了,才有可能,把可行的技术方案揉进现有的技术里。这是方法论,和政治无关,也和技术无关。last reply。
@h4cd
在本周二一个万维网 30 周年的纪念活动上,万维网之父 Tim Berners-Lee 表示当前的网络已经远离初心...
我和一楼的观点有一点是相似的。第一,哪怕你说万维网之父 说的内容是假大空没法落地,哪怕他的初衷 是为了博眼球,是为了私利,但是 他说的这个事,的确是 利球利人的万世基业。第二,我们不是相关专业的从业者,可能无法像你一样去看到你说的那些问题。但是我们觉得不应该消极看待,再难的问题总能找到合适的解决方案。层主是相关从业者,那是不是更应该为这个有益的事业,贡献力量。你也说 只是太难,不是违反数学物理,等客观规则。如果万维网之父,不从 国际国家的层面呼吁 隐私保护公约,那谁有资格来呼吁。
@h4cd
在本周二一个万维网 30 周年的纪念活动上,万维网之父 Tim Berners-Lee 表示当前的网络已经远离初心...
层主,你说的 第二个问题,国家工信部在推IPv6,2020年,三大运营商所有对外公网,和核心网,承载网,全部都要支持IPv6而且现在基本上至少运营商内部来说,都已经割接完了,剩下的是接入网的事情了。慢慢替换就行了。另外,你说的难道要每个人都会做IP映射做dmz配置。这个就更简单了,应用层面,有需求就有人去做。以前配置个路由器都要稍微有点it知识的人吧,现在的路由器,扫个二维码,就打开路由器管理页面了,吭哧吭哧几下就配置好了。只要保护隐私的解决方案成熟了,每个人有保护隐私的需求,大把大把的家用路由器厂商会去思考,怎么傻瓜式的搞定。
@h4cd
在本周二一个万维网 30 周年的纪念活动上,万维网之父 Tim Berners-Lee 表示当前的网络已经远离初心...
第一,思考的高度和落地是两码事。人家万维网之父思考的是隐私是社会层面的。我说的是你不能理解人家的初衷是因为你的高度不够。你的思维高度是,做不了或者难做的事情就不做。
第二,www组织扩充协议不一定是一刀切的替换,而是新协议,新设备支持。网络设备的升级是国家基建,工信部要求多少年内替换完成是做得到的,哪怕有延时。家庭个人层面,路由器三五年换一个也不是不可以,过渡期间,你就用原来的路由器嘛,别人的隐私可以自己保存,你的继续在互联网泄露嘛。
第三,至于实现方式你也是猜想,你想不到好办法不代表别人不行。而且你一上来就是反着想,想这个事情做不到,那怎么会做得到?就像1楼答复你的,不感想如何科技创新,如何带动产业升级。你说的明星流量问题,人家说的是个人隐私存在自己家里,没有说,她的微博存在自己家里,你发到微博上的是你的隐私?还有说 个人的隐私信息不在线了,你的私站就访问不了了。那就是看你的技术实现了,你不去想,哪里找的到方案。
@h4cd
在本周二一个万维网 30 周年的纪念活动上,万维网之父 Tim Berners-Lee 表示当前的网络已经远离初心...
正确,层主的答复是建立在现有的网络结构上的。你知道万维网最开始是固网拨号连接,走的固网路由么,在那个时代,http协议,数据网络路由协议才刚刚诞生,更别说家庭网关了。人家站的高度和层面都不是层主你理解的。他提出改写万维网的基础,意味着,现有的交换机路由协议等都需要,www组织重新定义了。层主too young too simple了。
@h4cd
在本周二一个万维网 30 周年的纪念活动上,万维网之父 Tim Berners-Lee 表示当前的网络已经远离初心...
前几天才看过的文章中的部分内容,只是不记得在哪看过了。
@James-
本文我们来看看,如果大量客户端对NameNode发起高并发(比如每秒上千次)访问来修改元数据,此时NameNode...
首先,你得搞清楚,你同一个Tomcat部署的两个网站不能访问的问题原因是什么。其次,你得弄清楚,反向代理是做什么都是解决什么问题的。
@风追着浪
使用Tomcat部署了两个网站,现在有个情况就是这两个网站会出现有时可以访问,有时无法访问的情况。所以就想用反向代...
ericsoul 2018/07/22 19:08 回答了问题: HBASE数据导入问题
日志里面有成功多少条,失败多少条,还有 输出失败记录的文件。理论上讲都成功了,那你只能相信返回结果
@大侠xhn
我使用hbase的import工具把hdfs中的数据导入了hbase中,我要怎么才可以确定数据已经导入成功了呢?数...
ericsoul 2018/07/10 22:06 回答了问题: zookeeper重启会影响其他程序吗?
三个一个个重启是不影响业务的。一起重启是会影响业务的。我猜hdfs应该会宕掉重启。
@aaronx_x
我不了解zk这些软件。现在我删除了zk的日志,需要重启一下。但是不清楚重启zk会不会影响其他程序的运行,导致挂掉。...
这份代码爬别的网站正常么?另外有单独研究ssl unexpected eof么?有在stackoverflow上问过了么?
@余康
import requestshttps_ip_link = "这里是代理IP的链接"https_ip_list ...
把你的解决步骤发出来,惠及大家了。
@idea_jiang
2018-05-26 20:06:21,215 FATAL [nodea:16000.activeMasterMa...
根据第一个标记的报错信息看,你的 hmaster访问了second namenode。所以无法访问hdfs。你应该是hbase没有配置好hdfs信息。
@idea_jiang
2018-05-26 20:06:21,215 FATAL [nodea:16000.activeMasterMa...
没很看懂回帖的立场。我的描述是一个概率问题。不是说,没有读过大学的都是不行的,只是概率大一些。那些半路出家的不是计算机相关专业科班出身的,很大东西理解起来就会比科班出身的人差,假如两个人的想提升的欲望是一样的。
@六库科技
在当前IT界爆炸的时代,不人少人转向了这一行业,尤其是当前大数据,人工智能的流行,更是让这一行业,马上火了起来。不...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部