- 性 别:男 年 龄:26
- 手 机:185-5500-1270 邮 箱:[email protected]
- 专 业:计算机科学与技术 岗 位:算法工程师
- 同济大学 2017.9~2020.5 计算机技术专业-研究生
- 同济大学 2013.9~2017.7 计算机科学与技术专业-本科
- 美团 2020.5~至今 信息安全部-平台治理中心
- 部门职责:识别公司各平台上的涉政、涉黄、违禁、暴恐、垃圾文字等内容风险,为公司的业务发展保驾护航。
- 个人职责:主要负责平台涉黄内容(包括招嫖内容)的识别和治理,具体工作包括涉黄图片、文字模型在线上的应用策略,招嫖内容的识别以及招嫖用户画像的搭建,以及参与首页信息流低俗内容的治理。
-
美团 - 招嫖用户治理 - 2020.10- 至今
- 点评和美团侧均有大量招嫖用户漏过,急需止血,降低前端漏过,对漏过分析后发现当前识别主要存在三个问题机审召回低、人审易漏过以及招嫖用户识别时效性差。
- 提高机审召回:招嫖内容之前主要使用内容模型和词库进行识别,但招嫖风险对抗性较强,内容模型易被绕过。于是分析招嫖用户的行为特征以及在业务、商户、用户下的统计特征,构建用户画像,补充实时策略,同时从设备聚集、联系方式聚集角度出发,开发设备黑名单和联系方式黑名单,防止招嫖用户绕过线上策略,招嫖用户漏过率从2%降低至0.05%。
- 提高识别时效和准确率:优化规则准确率,上线大量机禁策略,机禁率从25%提升至80%;上线大量招嫖用户实时识别策略,实时用户识别比例从37%提升至90%。
-
美团 - 涉黄综合模型开发 - 2020.06- 2020.08
- 涉黄图片标签漏过较高(标签漏过指涉黄内容被非涉黄规则召回),需要降低涉黄图片标签漏过,解决线上漏过问题。
- 通过分析发现,现有图片模型都是单独使用,阈值固定,并且图片的风险概率和具体业务、用户、商户都存在关联性,所以对业务特征、用户特征、商户特征进行提取,并结合线上涉黄图片模型、图片OCR识别结果,使用Xgboost模型开发涉黄图片综合模型。
- 日标签漏过量从614降低至226,降低比例63%
- 熟练使用Python、HiveSql编程
- 熟悉Xgboost、逻辑回归、神经网络等分类模型
- 掌握Spark分布式框架,具备大数据开发经验
- 2019年研究生国家奖学金
- 2018年研究生数学建模竞赛二等奖
- 本科阶段获同济大学二、三等奖学金若干次