如何看待携程举办的大数据比赛?

论坛 期权论坛 期权     
最后的起灵   2018-10-15 23:20   1958   10
前段时间无聊,参加了一个携程的比赛:科赛 - Kesci.com ,侥幸得了第一名。

比赛过后,我将我们的代码分享在了我的github上,并且在科赛 - Kesci.com上分享了我们的解题思路。在思路中,我们明确说明了我们使用了yin叔在比赛过程中发现的leak,对于leak,我们并没有隐瞒。



然后代表10data这个公司参赛的王佳技选手在查看了我的代码之后,提出了我们使用的leak在实际生产过程中没有预测功能。
而对于这一leak,官方明确回复过可以使用!

我们也承认,这是在第二天产生的数据,在实际生产环境中是拿不到这些数据的。因此这是一个leak!!!
我们完全在规则内完成着自己的作品,但是第三名以我们第一和第二名代码有leak为由(当时第二名也开源了),把第一名和奖金发给他们!!!


为此,携程又在比赛字段不变的情况下,举行了一场邀请赛,只是把test中原本7天的数据变成了1天的,这样我们的确拿不到了前一天的信息了,也就不存在了上次比赛中存在的leak了。
但是!!!!我们和第二名已经开源了!!!!而10data队并未开源!!!!并且从上面的回复中可知:他看过了我的代码!!!!
于是我们又进行了两周的邀请赛。结果我们又侥幸拿了第一名。

代码审核的最终结果是:






对于携程的这个描述,我认为我们的代码在生产环境中完全不存在leak!!!
想象一下:当一个用户点击,我们立刻就要去预测出他的结果,而此时是完全没有未来数据的!!!
而对于线上的分数,携程方坚持认为该维度存在leak。我说既然你们觉得是那就把这个去掉重新跑一遍。
他们也同意了!



最终我们跑出来的分数还是比第二名高出一大截。(因为我们直接单模型的分数就有0.4664+的分数啦。而那个leak出现在了stacking中了。)
然后携程的又出来跟我们扯这些:




回到问题的本身:
1.我不认为这个模型使用中会存在leak。
2.我当然也不会意识到这是leak。
3.既然你们认为是leak,那我同意你们去掉。
4.携程方去掉leak之后发现我们的分数还是很高!!!然后就开始取消成绩了?
我们可以理解为:
1.如果你是新手,参加了一个比赛,然后还不知道什么是leak就这样瞎做啊瞎做,最后拿了个第一,然后主办方以你使用了leak为由,取消你的成绩!以后还有玩家敢做比赛?
2.如果去掉了leak,然后分数还是领先,然后取消了你的成绩。自己再把代码拿去使用了,严重侵害知识产权!
3.把他们所谓的leak等同于作弊!!这是严重的人格侮辱!!
所以我要求携程方做出如下:
1.在比赛页面公开致歉。
2.赔偿我们22,23号交涉的时间损失。
3.给予我们应得的荣誉和奖金。

分享到 :
0 人收藏

10 个回复

倒序浏览
2#
夜尘  2级吧友 | 2018-10-15 23:20:08 发帖IP地址来自
去年就听说什么手动核对答案的蛋疼之事,没想到今年更蠢。携程也是够了。远离携程保平安。
3#
匿名用户   | 2018-10-15 23:20:09 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
4#
威震天  1级新秀 | 2018-10-15 23:20:10 发帖IP地址来自
携程举办没什么意思
5#
文学20138  4级常客 | 2018-10-15 23:20:11 发帖IP地址来自
恶心的携程,话说植物佬还是参加kaggle这种吧
6#
李建伟  3级会员 | 2018-10-15 23:20:12 发帖IP地址来自
难道拿到的代金券是  酒店代金券!!!?
真是一家没有诚信的公司!
7#
匿名用户   | 2018-10-15 23:20:13 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
8#
放牛娃  1级新秀 | 2018-10-15 23:20:14 发帖IP地址来自
携程这样干以后还想不想办比赛了,,
9#
首刀房主经验加倍  3级会员 | 2018-10-15 23:20:15 发帖IP地址来自
奖品是代金劵?太搞笑了实在,这么好笑的事允许转载吧?
10#
wekali  1级新秀 | 2018-10-15 23:20:16 发帖IP地址来自
去年携程在kesci上的比赛奖金到现在也还没有发
11#
White   | 2018-10-15 23:20:17 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP