文档章节

数据科学初学者九种常见错误

乱蓬头
 乱蓬头
发布于 2017/07/04 14:17
字数 983
阅读 4
收藏 0

摘要: 当开始进入数据科学领域时,我们可能会犯一些错误。本文罗列了9种初学者常见的错误,并提出避免犯错的建议。

更多深度文章,请关注:https://yq.aliyun.com/cloud

如果你想开始一个数据科学方面的职业,你可以通过避免这9个会使你付出高代价的初学者错误来免去几天,几个星期甚至几个月的挫折。

如果你不仔细,这些错误将会消耗你最宝贵的资源:你的时间、精力和动力。

我们将它们分为三类:

 

  • 学习数据科学时的错误
  • 求职时的错误
  • 求职面试中的错误

 

8abe7275a6210ee03253521786380a0f8d4b67b1

学习数据科学

第一组错误是“隐蔽的”,很难发现。没有丝毫的预兆,它们如同温水煮青蛙般耗尽你的时间和精力,并且它们产生的误解围绕这个领域。

1.花费太多时间在理论上

许多初学者陷入了花费太多时间在理论上的陷阱,无论是数学相关(线性代数,统计学等)还是机器学习相关的(算法,派生等)。

这种方法效率低下有三个主要原因:

 

  • 首先,这是缓慢而艰巨的。如果你曾经被所有要学的东西压垮,那么你很有可能陷入了这个陷阱。
  • 第二,你也不会保留这些概念。数据科学是一个应用领域,而巩固技能的最好方法是实践。
  • 最后,还有一个更大的风险就是如果你不明白你所学的东西与现实内容有什么联系,那么你会变得消极然后放弃。

 

传统上这种重理论的方法在学术界中传授,但大多数从业者可以从更注重结果的观念中受益。

为了避免这个错误:

 

  • 平衡你的研究和你实践的项目。
  • 学会适应局部知识。当你进步的时候,你自然会填补空白。
  • 了解每一部分如何适应大局(包括在我们免费7天速成课程)。

 

2.从头开始编写太多的算法

下一个错误也会导致学生片面重视局部而忽略了整体。一开始你真的不需要从头开始编写每个算法。

虽然为了学习而实现一些这么做很好,但现实是算法正在成为商品。由于成熟的机器学习库和基于云的解决方案,大多数从业者实际上从不从头编写代码。

今天,了解如何在正确的设置(以正确的方式)中应用正确的算法更为重要。

为了避免这个错误:

 

 

3.急于深入更高的层次

有些人进入这个领域是因为他们想要构建未来的技术:自驾车,高级机器人,计算机视觉等。 这些技术由深度学习和自然语言处理等技术所驱动。

但是,掌握基本原理很重要。 一口吃不成胖子。每个奥运潜水员都需要先学习如何游泳,那么你也应该如此。

为了避免这个错误:

 

  • 首先掌握“经典”机器学习的技术和算法,以此作为高级课题的基石。
  • 要知道经典机器学习仍然具有惊人的潜力。虽然算法已经成熟,但我们仍然处于发现使用富有成效的方法的早期阶段。

本文转载自:http://click.aliyun.com/m/24905/

共有 人打赏支持
乱蓬头
粉丝 0
博文 382
码字总数 2595
作品 0
初入数据科学职业时,要避免的9个错误

如果你想要在数据科学方向发展,避免这9个代价不菲的初学者错误,你能够免去数天,数周甚至数月的受挫。 如果您不小心,这些错误将会消耗您最宝贵的资源:您的时间,精力和动力。 我们将它们...

Datartisan
2017/10/19
0
0
如何入手数据科学竞赛——以kaggle为例

感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定! 对商业智能BI、大数据分析挖...

天善智能
05/17
0
0
业界 | 数据科学家要先学逻辑回归?图样图森破!

     大数据文摘编译作品   编译:王梦泽、笪洁琼 、夏雅薇   逻辑回归的结果很难解读,在真实的商业环境中考虑到你要跟你的老板或同事解释模型的时候,有可能自己都无法解释清楚,所...

大数据文摘
05/29
0
0
Kaggle入门手册

Kaggle是数据科学竞赛的热门平台,它可能会让初学者陷入困境。 毕竟,一些比赛有超过100万美元奖池和数百个竞争对手。 顶尖的团队拥有数十年的综合经验,处理有挑战的问题,如改善机场安全或...

Datartisan
2017/11/09
0
0
数据科学的5个常见误解,看完想走弯路都难

  【IT168 资讯】尽管大数据、机器学习和预测分析带来了巨大的好处,但数据科学对于各种规模的企业来说,仍然是一个的敏感话题。很多人不仅不愿意采用相关的系统和硬件,而且在转型时,在收...

it168网站
2017/12/29
0
0

没有更多内容

加载失败,请刷新页面

加载更多

你为什么在Redis里读到了本应过期的数据

一个事故的故事 晚上睡的正香突然被电话吵醒,对面是开发焦急的声音:我们的程序在访问redis的时候读到了本应过期的key导致整个业务逻辑出了问题,需要马上解决。 看到这里你可能会想:这是不...

IT--小哥
今天
2
0
祝大家节日快乐,阖家幸福! centos GnuTLS 漏洞

yum update -y gnutls 修复了GnuTLS 漏洞。更新到最新 gnutls.x86_64 0:2.12.23-22.el6 版本

yizhichao
昨天
5
0
Scrapy 1.5.0之选择器

构造选择器 Scrapy选择器是通过文本(Text)或 TextResponse 对象构造的 Selector 类的实例。 它根据输入类型自动选择最佳的解析规则(XML vs HTML): >>> from scrapy.selector import Sele...

Eappo_Geng
昨天
4
0
Windows下Git多账号配置,同一电脑多个ssh-key的管理

Windows下Git多账号配置,同一电脑多个ssh-key的管理   这一篇文章是对上一篇文章《Git-TortoiseGit完整配置流程》的拓展,所以需要对上一篇文章有所了解,当然直接往下看也可以,其中也有...

morpheusWB
昨天
5
0
中秋快乐!!!

HiBlock
昨天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部