加载中
数据竞赛答辩之最强攻略

前言 众所周知,国内的比赛如果有什么可以称之为“中国特色”的话,那一定是答辩了。答辩环节的设立,有利有弊。好的地方,大家自我总结复盘其实是有帮助的,线下答辩也给了大家互相交流认识...

数据竞赛EDA:JR東日本列車運行予測

前言 最近了解了日本竞赛平台signate举办的数据挖掘竞赛列车运行延误预测,类似于预测地铁每一站晚点时间。由于涉及到地铁站点之间的拓扑关系,不同列车的时间关系,同时和我们的生活也息息相...

数据竞赛:工业互联网算法大赛装备赛道Top5方案

背景 分享一下第二届工业互联网算法大赛装备赛道的思路,这是一个工业应用场景。我们也换一种分享方式,类似日志一样记录分享每天的尝试与进展,这种分享对于过程、优化和弯路能更方便的看出...

2021/08/24 20:16
97
数据竞赛EDA:首届电子商务AI算法大赛

(马克思红绿灯) 背景 刚刚混迹完🐶都不做工业互联网比赛后,发现了这个还有3天的比赛,秉承着练习为主的姿态就卷进去了。这是三天的参赛历程,比赛链接:https://www.automl.ai/competiti...

2021/08/19 00:01
116
工业类数据比赛集锦1

应用场景 大数据与人工智能在工业中得到了越来越广泛的应用。本文将以各大平台的数据比赛为例介绍其应用,比赛与Top代码可参考:https://github.com/hongyingyue/Competition-solutions/blob...

数据竞赛:工业互联网算法大赛能源赛道风机轴承剩余寿命预测

(看很多人还是很认真对待比赛) 背景 做好比赛的关键大概是:“唯手熟尔”。熟练后,I guess取得成绩只是或早或晚的事情(sooner or later)。技能熟悉后,主要是要找到任务和数据的特殊之处并着...

数据竞赛EDA:SODIC人岗匹配

(2021年7月-weibo) 背景 在阅读一些开源代码或方案时,我们经常会对模型、优化有了理解,但是懒得再去看数据,也懒得跑一下代码。因此,我会把一些对数据的认知和分析分享出来。这样在阅读T...

Web基础:记录简单个人网站建站过程

(2021年6月-欧洲杯-from CJ) 背景 作为计算机工作者,有自己的网站看起来总是专业一些,有利于所谓的个人品牌;同时,基本的web开发技巧也是每个计算机工作者不可获取的技能。因此,利用周末...

机器学习:二分类F1指标的优化

(2021年5月-北京) 背景 二分类作为最常见的机器学习任务之一,见于欺诈、匹配、故障预测等多个场景。而F1兼顾精确率与召回率,是二分类中常见的评价指标。 因此,本文梳理一下二分类的F1评...

数据竞赛:厄尔尼诺预测第5名方案和代码

背景 照例先感谢国家,国家提倡就地过年、没让回家,只好找个有意思的事情、才找了这个比赛做的。过年期间就是一边循环播放三体、一拳超人、赌博默示录,另一边就一直做比赛,大概累计出门了...

数据挖掘敏感度:以AI earth为栗子

前言 之前在数据挖掘III:数据敏感性中介绍过数据敏感性的重要性。对数据的认识和解读往往是高质量完成任务的关键,本篇通过天池气象预测实例讲述如何通过对数据的认识来提高模型的精度,趁着...

2021/04/01 21:27
205
数据竞赛:预测厄尔尼诺气候指标22分baseline

任务 由给定的前12个月的数据,预测未来24个月的厄尔尼诺指标。链接:https://tianchi.aliyun.com/competition/entrance/531871/introduction 数据 cmip:由已知的规律,经过模拟出的数据 so...

机器学习小技巧:模型训练完成后发送邮件

未富先老,未强先秃 前言 因为数据量变大(别人)或计算资源不足(我),训练时间变得越来越长。耐心不足如我,总想时不时看一眼训练的怎么样了,导致心不在焉。所以产生了本篇文章,就是训练结...

2021/02/08 20:11
128
时间序列预测:I概述

(摄于云南省博物馆01/2021) 模型 本文主要介绍一个学习路线,后续详细介绍各部分内容。常用的模型,以下基本可以涵盖主流思想: 传统时序模型:ARIMA,Prophet,EMD 构造时序特征的统计学习...

制造工业中的机器学习应用:I概览

(进击的巨人-马莱篇) 前言 简单回顾一下工业中的实际的机器学习应用。这里的工业指的是第二产业,即生产制造。有时候工业界,是为了和学术界进行区分,那时的工业界更广泛一些,甚至主要指第...

2021/01/23 12:25
50
可视化:中国地图 python/ geopandas/ echarts

(区块链现在也成了“牛夫人”) 前言 地图,在可视化中总是引人注目的。之前我们介绍了如何用R语言中的ggplot2画中国地图。本篇我们在python中搞定地图,主要结合我在BMW丰富的画地图经历总结...

目标检测:Yolov5集百家之长

(1920,被识别为泰迪熊?有排面) 背景 2017年底,我已毕业多年了。用起Excel和PPT、研究车的质量问题俨然老手的样子。有一晚,照着一个帖子跑了一下Yolov1的inference,惊为天人。蹑手蹑脚的...

数据挖掘:空气质量时序预测

背景 多年以后当我呼吸到新鲜空气的时候,也许会想起那年在北京,突然有一天室内飘起淡黄色的雾,伴随着酱油的味道。后来这种现象有了一个家喻户晓的名字“雾霾”。再后来听说了一个空气质量...

数据竞赛:记录3天进入比赛Top3%的全过程

这几天花了3天时间尝试了一个CCF比赛:大数据时代的Serverless工作负载预测。比赛链接:https://www.datafountain.cn/competitions/468/teams 这里简单记录一下如何利用三天时间进入Top3%,虽...

数据挖掘:分享两个Pandas使用小陷阱

这里主要分享数据分析过程中两个很小的陷阱。 concat比较耗时 背景是有上万个csv文件,想把他们整合到一个文件里,推荐整合后的格式保存为大数据里的.parquet,可以节省很多空间。 整合多文件...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部