阿里推荐大赛:写给这五个月

今天早上出完成绩后,其实不怎么想写这篇文章的。因为五个月的努力,最终也没能证明自己。虽然已经不需要前 50 的「校招绿色通道」,但是心里还是会有一些失落。自己劝慰自己「毕竟是一个人单挑」,可是前 50 单挑的也不少。想想还是自己有很多的不足之处,在最终跑融合集的时候,两次脚本参数跑错导致浪费了宝贵的线上机会。而在删除集方面的尝试终于有些效果了,比赛却戛然而止了。

其实在早上看到最终成绩的时候,心情还是比较平静的,我貌似已经淡定地接受了这一切。静静地看着这五个月来的一幕幕如潮水般涌来。

第一次听说这个比赛是在 13 年下半年,一次偶然的机会看到 @得福 做的一次天猫推荐的分享,在那次分享的最后介绍了今年3月份会举办面向高校的推荐大赛。很期待阿里也要举办类似 Netflix 的比赛,而且这次是真正的大数据。

果然在3月初的时候,比赛如期而至,毫不犹豫地报名了。因此也展开了黑白颠倒的五个月。

在报名之初,对于没什么机器学习底子的自己,完全不知道能走多远。第一季报名的队伍如洪水般泛滥,黑科技也层出不穷,摸着石子过河的我完全找不到方向,一度处在一千名开外的位置。后来渐渐找到方法挺进了第二季。

在第二季刚开放的最初几天,迫不及待地进入天池系统一睹真正的大数据。5.7 亿条真实行为记录,1250 万位用户,以及 3 万种品牌。海量的数据跑在 ODPS 平台上,真的非常佩服 ODPS 的技术,处理上亿条的数据秒秒钟的事。当然一开始大家都用的比较温柔,所以比较快,而到最后疯狂的七天也算是体验到什么叫龟速了。ODPS 是一个伟大的产品,因为他不同于以往的 PaaS 、SaaS 服务,ODPS 是一个直接面向计算的云平台。而且现在 ODPS 已经进入了水电模式,像水电一样存在了。ODPS 按照每条 SQL 指令收费,据说整个比赛的费用几乎让主办部门破产,真的非常感谢阿里能免费给我们这个学习环境。

在最初的几天,新鲜感促使我迅速完成了两篇关于 ODPS 的文章,一篇 SQL 入门 一篇 离线评估构建 。这两篇文章帮到了很多同学,也迅速使我的博客日 UV 顺利破千,日 PV 也达到了 1600 之多。后来看到其他小伙伴分享的文章,以及群里聊天的时候,发现好多小伙伴都用的我的评估代码,包括首页的大神们,心里还是挺荣幸的。

分享博客的过程中,让我认识了很多牛人,他们都是对技术有着无比热情的人,能为一个特征一个算法钻研废寝忘食的人。有一位小伙伴,聊着聊着发现我俩的家乡居然就在隔壁城市。

比赛没有留给我耀眼的奖项,但留给我的远比奖项多。比赛期间的孤独无助,毫无进展,熬夜的艰苦多次让我萌生了退堂鼓的念头,但是最后还是坚持了下来,走到了最后。对自己的多次突破,让我相信人的潜力是无限的。从选手们身上对技术的追求也让我学到很多。

写的有点乱,想到哪儿写到哪儿。就这样把,追寻阿里的步伐不会因此而结束,我们校招三面见。

仅以此文献给那些一起拼了五个月的选手们。献给那些日子凌晨 4 点的日出。

最后纪念下换数据前夕充当的华丽的分割线。

-EOF-