干货满满阿里天池CIKM2017Rank生存
时间:2020-05-10 03:06:22 来源:西贡环保厂家 浏览量:2
干货满满,阿里天池CIKM2017 Rank4比赛经验分享
(公众号:) AI 科技评论按:由深圳气象局与阿里巴巴联合承办的CIKM AnalytiCup 2017第一赛季已经宣告结束。本次比赛的目标是利用雷达数据(多普勒雷达回波外推数据),来建立一个准确的降水预报模型。
这次比赛吸引了1395支队伍参赛,排行榜也已在阿里天池平台进行公示
。
在这次比赛中,来自中国科学院的怀北村明远湖队(队员Zhang Rui,Qiao Fengchun,Guo Ran)在GitHub上分享了自己的代码和方法,他们在第一阶段获得第三名,第二阶段获得第四名。 AI科技评论将他们发布的内容进行了整理,如下:
背景介绍
在这次比赛中,主办方提供了一组不同时间跨度(间隔为6分钟,共15个时间跨度)和不同高度下(0.5km、1.5km、2.5km、3.5km)测量的雷达图,每个雷达图都包含目标站点和目标站点周围区域的雷达反射率值。每个雷达图覆盖以目标站点为中心,面积为101 * 101平方公里的区域。该区域被标记为101×101格,目标站点位于中心,即(50,50)。
数据集中包含真实的雷达图和气象观测中心收集到的目标站点降水量。
比赛的任务是预测在未来个小时内每个目标站点的总降雨量。
数据处理过程
Percentil Method百分位数法
他们采用统计的方法来降低雷达数据的维度。对于每个雷达图,他们对目标站附近到整个地图范围内不同大小的区域都选取了雷达反射率值的25、50、75、100百分位。
图:以目标站点为中心选取不同的区域
Wind法
他们首先将原始数据(15*4*101*101)压缩成稍小的数据(15*4*10*10),然后通过判断风向,将数据压缩到15*4*6*6个特征。整个预处理过程都是利用卷积神经络的方法,特别是卷积运算和最大池化。
图:卷积计算表征
图:池化计算表征
他们利用第四层的数据来判断风向。然后,为了计算最终风向,用两种方法来选择有代表性的数据。第一种方法在每10*10单元中使用最大的值作为表征,第二种方法则采用最大的5个数据的平均值作为表征。
在选出有代表性的数据之后,通过每两个时间间隔之间数据的偏差值算出移动方向,最终基于给定的阈值统计不同移动方向的数目,按照数目最多移动方向的确定最终风向。
图:当风向为西、西北、西南时提取特征的方法
模型
在这次任务中,他们的模型结合了Random Forestry、XGBoost和双向GRU单元(Bidirectional Gated Recurrent Unit)等,得出了较为满意的结果。
运用的工具
Python 3.6
Keras
XGBoost
Sklearn
他们的代码:
via:GitHub
AI科技评论
原创文章,未经授权禁止转载。详情见转载须知。
牛皮癣补充哪种维生素原发性痛经怎么缓解
江西白癜风治疗费用

- 上一篇:7种食物帮你除痘痘和雀斑调研
- 下一篇:中国制造业将成海外收购重要力量区域
-
怎样训练苏格兰牧羊犬的胆量位置
怎样训练苏格兰牧羊犬的胆量怎样训练苏格兰牧羊犬的胆量导读: 有些养苏牧犬的家长会很烦恼,家里的苏牧胆子太小了,经常一点响声就吓得它要躲到...[详细]
2022-06-10
-
怎样训练狗装死和转弯位置
怎样训练狗“装死”和“转弯”怎样训练狗“装死”和“转弯” 宠物犬 刚开始,转弯会出现一个问题,您必须记住,左转弯前使狗狗“跟着走”同...[详细]
2022-06-10
-
怎样训练金毛犬送东西位置
怎样训练金毛犬送东西怎样训练金毛犬送东西 06:27:37出处:络点击:946 导读: 在电影上对于金毛犬送东西对于这...[详细]
2022-06-10
-
怎样训练藏獒进出笼图位置
怎样训练藏獒进出笼【图】怎样训练藏獒进出笼【图】 09:39:06出处:络点击:872 导读: 对于藏獒也不是那种不能...[详细]
2022-06-10
-
怎样训练英国短毛猫抽水马桶上厕所位置
怎样训练英国短毛猫抽水马桶上厕所发布时间: :妍妍 怎样训练英国短毛猫抽水马桶...[详细]
2022-06-10
-
怎样训练比格犬不乱吃东西位置
怎样训练比格犬不乱吃东西怎样训练比格犬不乱吃东西导读: 在我们生活里面如果我们 狗都会给它们进行训练,因为只有通过训练它们才能在我们的家庭...[详细]
2022-06-10