比赛总结

article/2025/9/13 16:13:20

比赛总结

9743044-4b31e40a020ca01a.png
比赛总结-a5165.png

初赛终于结束了,头一次如此投入去打比赛,这一个多月以来真是痛并快乐着。最大的感悟是:构造线下验证集并没有什么用,做了一堆工作还不如一个leak。首先取得这个成绩算是给自己一个交代了,圆了之前腾讯社交算法大赛的遗憾。

在比赛过程中主要遇到的一些问题

1. 数据预处理

对缺失值进行处理,分割某些拼接一起的特征,比如item_property_list,丢弃一些没有用的特征(缺失值非常多,或者取值几乎一样的)。清洗缺失值比较多的数据。

对于数据不平衡的问题,一开始我尝试通过上采样下采样解决,效果变差。通过查资料推测是采样方案不好导致的。现在lgb自带用于处理不平衡数据集的采样技术,所以方便了很多。

2. 如何构造特征

这个部分是最耗精力的。 必须要 摸清线上测试集的分布。

还有就是,比如说统计特征对a榜无效,在b榜中起到的作用也不大。a榜花了大量的时间其构造统计特征以及交叉特征,线下效果还不错,线上效果很有限。这个时候就要考虑一个问题:线上测试集的分布跟线下是否不一致。当时官方直播讲解的时候说到测试集是按用户抽取的,于是我就按测试集出现的用户在训练集采样,用来训练模型。第二天线上直接崩了。现在想来,当时那几天有些疯狂,颇有些一不做二不休的节奏,不过整个比赛最刺激的就是这些疯狂的尝试,也给我打击最大。其实即使要做采样,也应该另外在剩下的数据集中抽取30%合并在一起构成a榜的训练集。可惜每天只能提交一次,后来有很多想法都没来得及验证。

至于转化率,做了全局的,在a榜作用不大,后来b榜提交次数太有限了没有实验。下听说是需要按天计算才起效,这个我还没来得及试验。

还有就是,要观察训练集有没有什么规律。说不定你会发现leak。b榜开始后,我将所有想到的能尝试的办法,基本上都尝试过了,分数勉强进复赛。后来有个人在群里面说了句“用户距离下一次点击的时间,贼猛”,我立马做了实验,效果非常好。这让我开始注意时序,然后发现了在各种比赛经验上面经常提到的leak。我刚发现数据的这个规律时并不知道这是个leak,后来发现这个上分有点猛,才明白这是leak。然后就围绕着这个leak做了许多的特征,最后两天从几百名开外一直冲到一百多名,后面就明白了前排为什么会效果这么好了。在这上面多做点文章,基本上就能上榜了。

3. 如何验证特征的有效性

  • a榜前半部分使用xgb来筛选特征,结果不是十分稳定。后期使用cv来验证特征的有效性,取得比较好的效果。但是考虑到有些特征需要一起使用才会有效,所以最好结合两者构造比较好的特征验证方案,这个非常重要。
  • 特征并不是越多越好,不好的特征就相当于引入了噪声,会使结果变差。大胆的丢掉没用的特征,后面再挖掘它们的作用。

3. 模型融合

模型融合的方法有很多,常规的就是stacking和blending

4. 管理好代码

维护代码是个成本很高的工作,所以在写的时候就应该考虑到以后的拓展和使用

5. 交流十分重要

整个初赛的转折点,是在加了一个跟我一样在复赛线徘徊的选手。在跟他交流的过程中我注意到了很多我忽略的问题。

不得不说交流能力真的很重要,连跟其他人扯淡都扯不下去,那么其他的情报也就不用说了。

最后

基本就是这样了。虽然不算很好,不过取得这个成绩还是出乎我意料的。新手做比赛确实挺累的,最好有个老司机带。看着自己辛辛苦苦做出来的特征线下很美好,线上却崩掉的时候,是挺崩溃的,会迷茫。这个时候需要坚持,然后好好理顺逻辑分析一下原因。

复赛应该是没时间做了,这一个月以来是顶着导师的压力私底下打的比赛,接下来要好好干活。秋招也快要开始了,要好好准备,扎实的基础是一切的根本,不管是比赛还是找工作都是的。


http://chatgpt.dhexx.cn/article/SvrSbVpx.shtml

相关文章

关于全国大学生软件测试大赛总结与反思

关于全国大学生软件测试大赛总结与反思 文章目录 一、软件测试大赛简介二、可能出现的错误三、个人总结与反思四、谈谈软件测试工程师1、测试的三个阶段2、就业优势3、就业要求4、参考薪资 一、软件测试大赛简介 由教育部软件工程专业教学指导委员会、全国高等院校计算机基础教…

【赛后总结】第十三届服务外包创新创业大赛总结——A14

目录 前言组队&选题分工&项目推进提交材料&项目答辩区域赛初赛区域赛决赛全国总决赛 写在最后 前言 先摆两个参赛视频 初赛视频 决赛视频 比赛已经过去几个月了,也算是想起来这个比赛可以写一个总结了。在历时8个月左右的时间之后,我…

计算机大赛总结发言稿,学校技能比赛总结发言稿

学校技能比赛总结发言稿 总结就是把一个时间段取得的成绩、存在的问题及得到的经验和教训进行一次全面系统的总结的书面材料,写总结有利于我们学习和工作能力的提高,因此十分有必须要写一份总结哦。那么总结要注意有什么内容呢?以下是小编帮大…

计算机知识与技能比赛活动总结,中职技能大赛总结(精选6篇)

中职技能大赛总结(精选6篇) 总结是对取得的成绩、存在的问题及得到的经验和教训等方面情况进行评价与描述的一种书面材料,它能够使头脑更加清醒,目标更加明确,因此我们需要回头归纳,写一份总结了。那么你知道总结如何写吗&#xf…

稳定的iOS迅雷来了 不用再每次想用都要重装

迅雷iOS下载:www.xunlei-iosd.top 用过苹果产品的朋友都知道,在iOS系统里,迅雷这一APP是不存在的。当有朋友分享了某些资源给你,只能想办法使用复杂的操作安装一个寿命只有几天的迅雷APP。 今天,官方推出了“永久版”iOS迅雷&…

iOS - Threads 多线程

1、Threads 1.1 进程 进程是指在系统中正在运行的一个应用程序。每个进程之间是独立的,每个进程均运行在其专用且受保护的内存空间内。 比如同时打开 QQ、Xcode,系统就会分别启动两个进程。通过 “活动监视器” 可以查看 Mac 系统中所开启的进程。 一个程…

iOS面试知识点梳理

1.iOS开发者账号类型 “个人”开发者可以申请升级“公司”,可以通过拨打苹果公司客服电话(400 6701 855)来咨询和办理。公司账号允许多个开发者进行协作开发,比个人多一些帐号管理的设置,可设置多个Apple ID&#xff0…

2019年iOS面试真题大全(3-5年)

如果你想去大公司,如果你是3年左右的iOS开发者,如果你对面试的未知没有十足的信心,如果你期望的薪资在15K,那么请认真刷完这300道面试题,都是真实公司经历的…答案会在近期更新!你要先自思考,看个人那些方面还不足! 1、自我介绍 2、如何实现一个倒计时功能,类似于蘑…

IOS开发系列之阿堂教程:构建开发IOS应用的虚拟机开发环境实践

说到IOS的开发,不能不说 到一个问题,如何配置和构建一个IOS的开发环境!我下面要说的主要是针对没有MAC Apple机的网友,如何安装和配置一个属于自己的IOS开发环境。如果已经有MAC 苹果机的网友,请忽略此文。因为有MAC 苹果机,就只需要安装XCODE的IDE开发工具就行了。 …

web安全渗透测试基础知识

渗透测试入门 渗透测试前置知识靶场环境搭建windows基础网络基础web应用/架构搭建/站库分离/路由访问web四大件-系统web四大件-中间件web四大件-数据库web四大件-源码路由访问 web架构/前后端分离/建站分配Web架构/OSS存储/CDN加速/反向代理APP架构反弹SHELL/文件下载抓包技术算…

《iOS移动开发从入门到精通》图书连载2:如何成为一名iOS开发者

iOS开发人员,和其它传统开发者相比有哪些不同之处?需要具备怎样的硬件和软件条件?今天我们就来说说这一部分的内容。 一.硬件上的需求 开发iOS应用,首先您需要使用Apple的电脑。尽管您可以使用黑苹果或者虚拟机,在PC上…

Jetson Nano目标检测手把手实战教程(pytorch训练、tensorrt推理,含完整代码和数据)

目录 一、概述 1.1 深度学习和边缘计算 1.2 Jetson Nano简介 二、深度学习环境安装 2.1 Pytorch框架 2.2 在Jetson Nano上安装Pytorch 三、算法原理 四、具体实现步骤 4.1 工程代码和环境准备 4.2 模型训练和推理 4.2.1数据集准备 4.2.2训练 4.2.3模型转换 4.2.4…

各种HOOK方式和检测对抗方法

一、什么是HOOK? hook翻译过来是拦截的意思, 我们很多时候也叫钩子,其实是很形象的. hook有什么作用呢? 1.当代码执行到某行时,获取寄存器值和内存里的值,进行调试分析,例如hook明文包. 2.当代码执行到某行时,插入想执行的代码.例如迅雷拦截发包函…

2019 - iOS最新最全面试题梳理(内含框架和算法题)

内存中的区域划分 栈区(stack):由系统自动分配和释放,存放局部变量的值,容量小速度快,有序 堆:一般由程序员分配和释放,如果不释放,则出现内存泄露。程序会回收您的内存,特点:容量大…

②(常识篇)、《史上最全iOS八股文面试题》2022年,金三银四我为你准备了,iOS《1000条》笔试题以及面试题(包含答案)。带面试你过关斩将,(赶紧过来背iOS八股文)

iOS面试题 一共分为笔试题和面试题两部分 笔试题 一共分为10个 总共613题 面试题 一共400题 笔试题 一个10个系列 分别为 ①(语法篇) 共147题 已更新 ②(常识篇) 共72题 已更新 ③(界面篇) 共83题 已更新 ④(iOS篇) 共52题 已更新 ⑤(操作篇) 共68题 已更新 ⑥(数据结构篇) 共2…

【功能测试】part1

目录 1、什么是软件测试 2、计算机基础知识 --硬件系统 --软件系统 1、系统软件:控制硬件(不做测试) 2、应用软件(测试) --B/S和C/S架构 B/S:Browser-Server C/S:Client-Server B/S软…

直播平台搭建,完整产业链和操作流程解析

直播平台的出现丰富并创新了国民的娱乐方式。因为直播是全平台开放,对主播的要求门槛并不是太高,所以几乎人人都可以参与并以自己独特的方式向观众分享娱乐。 完整的直播产业链包含5个模块: 内容提供方:用以生产内容和打造网红产…

直播平台php搭建框架,搭建自己的直播平台需要知道这些内容

原标题:搭建自己的直播平台需要知道这些内容 虽说当今的移动互联网风口在短视频,但直播平台依旧有着自己的“江湖地位”。近年来直播平台开发技术越来越完善,使得搭建直播平台的门槛大大降低,如果要搭建自己的直播平台需要知道哪些…

带货直播平台搭建有何不同之处

直播平台已经逐步在向商务方向发展,人们对直播的要求也变得越来越多样化,但是无论怎样发展,归根结底还是要靠着流量发展,对于带货直播搭建平台来说,更是如此,当代,直播平台的用户是混合的,那么带货直播平台搭建与其他方式相比有何不同之处呢?    1、带货直播平台搭…

带货直播平台搭建功能模块详细介绍

从近几年开始,直播的发展可谓是越来越快,直播已经贯穿到生活的方方面面,大街上,公园里,景点前,随处可见都是主播的身影,到如今,直播已经注入了许多新的元素,比如:带货直播。带货直播是一种新型的零售方式,它打破了传统零售的固有方式,让购物变得更加时尚,更加方便…