Code Monkey home page Code Monkey logo

ainlp-archive's Introduction

AINLP-Archive

AINLP公众号 公众号文章分类存档,每天同步更新,欢迎关注AINLP公众号:

如何学习NLP和相关学习资源

如何学习自然语言处理:一本书和一门课

如何学习自然语言处理:NLP领域经典《自然语言处理综论》英文版第三版更新

自然语言处理圣经SLP3终于又更新了

这门斯坦福大学自然语言处理经典入门课,我放到B站了

数学之美中盛赞的 Michael Collins 教授,他的NLP课程要不要收藏?

学自然语言处理,其实更应该学好英语

李纪为博士:初入NLP领域的一些小建议

老宋同学的学习建议和论文:听说你急缺论文大礼包?

从老宋的角度看,自然语言处理领域如何学习?

刘知远老师NLP研究入门之道:NLP推荐书目

NLP研究入门之道:自然语言处理简介

NLP研究入门之道:走近NLP学术界

NLP研究入门之道:如何通过文献掌握学术动态

NLP研究入门之道:如何写一篇合格的学术论文

NLP研究入门之道:本科生如何开始科研训练

自然语言理解难在哪儿?

好的研究想法从哪里来

你是如何了解或者进入NLP这个领域的?

NLP is hard! 自然语言处理太难了系列

2021年NLP入门书籍推荐|理论&实战

词向量

相似词查询:玩转腾讯 AI Lab 中文词向量

玩转腾讯词向量:词语相似度计算和在线查询

腾讯词向量实战:通过Annoy进行索引和快速查询

玩转腾讯词向量:Game of Words(词语的加减游戏)

词向量游戏:梅西-阿根廷+葡萄牙=?

腾讯 800 万中文词向量 API Demo 搭建

相似词检索,近义词查询,同义词大全,这里不仅仅限于中文

机器学习竞赛必备基础知识Word2Vec

NLP中的词向量对比:word2vec/glove/fastText/elmo/GPT/bert

【关于 Word2vec】 那些你不知道的事

预训练语言模型

BERT基础

四万字全面详解 | 深度学习中的注意力机制(完结篇)

自然语言处理中注意力机制综述

从零开始实现卷积神经网络CNN

从零开始实现循环神经网络(无框架)

【重温序列模型】再回首DeepLearning遇见了LSTM和GRU

Transformer家族简史(PART II)

Transformer的一家!

关于Transformer,面试官们都怎么问

以自注意力机制破局Transformer

我们用transformer干啥?

AAAI21最佳论文Informer:效果远超Transformer的长序列预测神器!

放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较

预训练在自然语言处理的发展: 从Word Embedding到BERT模型

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

Dive into BERT:语言模型与知识

BERT论文笔记

bert之我见-attention篇

bert之我见-positional encoding

BERT 的演进和应用

BERT时代与后时代的NLP

谷歌BERT模型深度解析

BERT_Paper_Chinese_Translation: BERT论文中文翻译版

一步步理解BERT

BERT相关论文、文章和代码资源汇总

BERT中CLS效果真的好嘛?这篇文章告诉你答案

关于BERT,面试官们都怎么问

NAACL2021论文:UniDrop:一种简单而有效的Transformer提升技术

BERT源码

BERT源码分析PART I

BERT源码分析PART II

BERT源码分析PART III

听说你还没读过 Bert 源码?

BERT应用

Bert时代的创新(应用篇):Bert在NLP各领域的应用进展

当BERT遇上知识图谱

BERT meet KG 第二弹:新训练方式,新问题视角

万万没想到,BERT学会写SQL了

Bert 改进: 如何融入知识

【Github】BERT-NER-Pytorch:三种不同模式的BERT中文NER实验

NLP - BERT/ERNIE 文本分类和部署

详解BERT阅读理解

简单高效的Bert中文文本分类模型开发和部署

当BERT遇上搜索引擎

跨界出圈 | 谈谈BERT跨模态预训练

还在用[CLS]?从BERT得到最强句子Embedding的打开方式!

2021年了,你还在手写SQL吗?

2021年如何科学的“微调”预训练模型?

BERT实战

最简单的BERT模型调用方法

模型压缩实践系列之——layer dropout

模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法

模型压缩实践收尾篇——模型蒸馏以及其他一些技巧实践小结

我不懂BERT系列——有关RealFormer的一些有趣现象

知识蒸馏:让LSTM重返巅峰!

如何有效的降低BERT参数量

如何写好BERT知识蒸馏的损失函数代码(一)

【Github】BERT-train2deploy:BERT模型从训练到部署

【模型压缩系列】一:模型替换

【模型压缩系列】二:模型蒸馏

模型压缩与蒸馏!BERT的忒修斯船

深度学习中的知识蒸馏技术(上)

深度学习中的知识蒸馏技术(下)-知识蒸馏与推荐系统

模型压缩与蒸馏!BERT家族的瘦身之路

如何提升BERT在下游任务中的性能

如果只能做整数Integer运算还能用BERT吗?

如何在脱敏数据中使用BERT等预训练模型

ALL in BERT:一套操作冲进排行榜首页

BERT之外

效果惊人的GPT 2.0模型:它告诉了我们什么

GPT 的野望

XLNet:运行机制及和Bert的异同比较

站在BERT肩膀上的NLP新秀们(PART I)

站在BERT肩膀上的NLP新秀们(PART II)

站在BERT肩膀上的NLP新秀们(PART III)

Nvidia League Player:来呀比到天荒地老

中文预训练模型ERNIE超详细使用指南

Bert 之后:预训练语言模型与自然语言生成

就最近看的paper谈谈预训练语言模型发展

RealFormer:Real 简单,Real 有效

Transformer哪家强?Google爸爸辨优良!

超赞,以QA形式对NLP预训练模型进行的全面总结!

NLP前沿预训练语言模型大赏

ALBERT 告诉了我们什么?

XLNet 论文笔记

ERNIE Tutorial(论文笔记 + 实践指南)

DistilBERT Understanding

最新语言表示方法XLNet

深度剖析知识增强语义表示模型——ERNIE

12个NLP预训练模型的学习笔记

transformer-XL与XLNet笔记

Reformer: The Efficient Transformer

逆向而行,中文轻量级预训练模型的探索之路

【NLP】ALBERT粗读(李如同学)

BERT/注意力机制/Transformer/迁移学习NLP资源大列表:awesome-bert-nlp

中文预训练ALBERT模型来了:小模型登顶GLUE,Base版模型小10倍速度快1倍

超小型bert横空出世:训练和预测提速10倍

RoBERTa for Chinese:大规模中文预训练RoBERTa模型

中文语言理解基准测评(chineseGLUE)来了,公开征集数据集进行中

CLUECorpus2020:可能是史上最大的开源中文语料库以及高质量中文预训练模型集合

语言模型发展思路

GPT-3的最强落地方式?陈丹琦提出小样本微调方法,比普通微调提升11%

小米在预训练模型的探索与优化

拿到参考资料的预训练模型,太可怕了!

如何又好又快的做文本匹配

ICLR 2021 | 微软DeBERTa超越人类,造就SuperGLUE上的新王者

【微软力作】虚拟对抗训练:让预训练模型再次强大!

T5: 文本到文本的Transformer迁移学习

SOTA来啦!BERT又又又又又又魔改了!DeBERTa登顶GLUE~

【关于 FastBERT 实现】那些你不知道的事

软硬兼施极限轻量BERT!能比ALBERT再轻13倍?!

【关于自训练 + 预训练 = 更好的自然语言理解模型 】 那些的你不知道的事

NeurIPS 2020 之预训练语言模型压缩

深入解读首个万亿级语言模型 Switch Transformer

预训练语言模型fine-tuning近期进展概述

打脸!一个线性变换就能媲美“最强句子embedding”?

中文分词/词性标注

五款中文分词工具在线PK: Jieba, SnowNLP, PkuSeg, THULAC, HanLP

中文分词工具在线PK新增:FoolNLTK、LTP、StanfordCoreNLP

Python中文分词工具大合集:安装、使用和测试

八款中文词性标注工具使用及在线测试

百度深度学习中文词法分析工具LAC试用之旅

中文分词文章索引和分词数据资源分享

中文分词入门之资源

自然语言理解太难了之中文分词八级测试

中文分词工具评估:chinese-segmentation-evaluation

简单有效的多标准中文分词

通俗介绍什么是分词

命名实体识别

中文命名实体识别工具(NER)哪家强?

NLP - 基于 BERT 的中文命名实体识别(NER)

打开你的脑洞:NER如何进行数据增强 ?

如何在只有词典的情况下提升NER落地效果

FLAT——中文NER该怎么做

Lex-BERT:超越FLAT的中文NER模型?

【论文笔记】命名实体识别论文

一文详解深度学习在命名实体识别(NER)中的应用

中文NER任务实验小结报告——深入模型实现细节

CLUENER2020:中文细粒度命名实体识别数据集来了

Transformer为啥在NER上表现不好

近期做NER的反思

ner自动化打标方法

2018年的一篇NER综述笔记

ICLR2021 | 唯一录取的NER论文:NER数据存在漏标怎么办?

微软+韩家炜课题组的全面调研:NER标注数据少,怎么办?

流水的NLP铁打的NER:命名实体识别实践与探索

文本分类/情感分析

来,试试百度的深度学习情感分析工具

AINLP公众号新增SnowNLP情感分析模块

一份最新的、全面的NLP文本分类综述

深度学习文本分类|模型&代码&技巧

新闻上的文本分类:机器学习大乱斗

韩家炜课题组重磅发文:文本分类只需标签名称,不需要任何标注数据!

几个可作为Baseline的文本分类模型

清华THUNLP多标签分类论文笔记:基于类别属性的注意力机制解决标签不均衡和标签相似问题

【论文串烧】基于特定实体的文本情感分类总结(PART I)

基于特定实体的文本情感分类总结(PART II)

基于特定实体的文本情感分类总结(PART III)

深度学习实践:从零开始做电影评论文本情感分析

【ACL2020】用于改进文本分类的特征投影

从零实现爬虫和情感分类模型(一)

从零实现爬虫和情感分类模型(二)

5个例子,秒懂分类算法(达观数据王子豪)

NLP - 15 分钟搭建中文文本分类模型

LCM:缓解标签不独立+噪声标签问题

用模型“想象”出来的target来训练,可以提高分类的效果!

医疗领域情感分析

华为云细粒度文本情感分析及应用

【关于 文本分类 trick】那些你不知道的事

文本摘要

抛开模型,探究文本自动摘要的本质——ACL2019 论文佳作研读系列

文本自动摘要任务的“不完全”心得总结

BottleSum——文本摘要论文系列解读

文本自动摘要任务的“不完全”心得总结番外篇——submodular函数优化

文本摘要(text summarization)最新研究热点、发展趋势,里程碑论文推荐

2015-2019年摘要模型(Summarization Model)发展综述(一)

2015-2019年摘要模型(Summarization Model)发展综述(二)

真正理解指针生成网络——Summarization with Pointer-Generator Networks

中文摘要数据集汇总

主题挖掘

医疗领域热门话题挖掘

文本匹配

阿里RE2:如何将残差与文本匹配模型融合

Github13K!相似搜索百宝箱,文本匹配入门必备!

问答系统/对话系统/聊天机器人

一行Python代码实现夸夸聊天机器人

为了夸夸聊天机器人,爬了一份夸夸语料库

夸夸聊天机器人升级:从随机到准个性化

Unilm对话生成之夸夸式闲聊机器人

来,试试语音(识别)聊天(机器人)

来,试试成语接龙

推荐一份中文数据,来试试汉字、词语、成语、歇后语在线检索

AINLP公众号新增"狗屁不通文章生成器"接口

来,试试彩虹屁生成器

总结|开放领域问答梳理系列(1)

收藏|开放领域问答梳理2

生成式对话seq2seq:从rnn到transformer

构建任务型多轮对话助理的 6 大阶段

QA问答系统中的深度学习技术实现

从产品完整性的角度浅谈chatbot

来谈谈那些很棒的检索式Chatbots论文(一)

来谈谈那些很棒的检索式Chatbots论文(二)

Rasa介绍:对话系统、产品与技术

基于RASA的task-orient对话系统解析(一)

基于RASA的task-orient对话系统解析(二)——对话管理核心模块

基于RASA的task-orient对话系统解析(三)——基于rasa的会议室预定对话系统实例

Rasa入坑指南一:初识Rasa

Rasa 入坑指南二:基于 Rasa 构建天气查询机器人

5分钟搭建多轮对话系统

做对话机器人的各家企业,都在关注哪些问题

从互联网爬虫、自动驾驶到对话机器人,什么是Semantic(语义)?

谈谈文本匹配和多轮检索

CRSLab:可能是最适合你的对话推荐系统开源库

对话的囧境?

达摩院基于元学习的对话系统

百分点智能对话技术探索实践

赛尔原创@AAAI 2021 | 数据增强没效果?试试用Cluster-to-Cluster生成更多样化的新数据吧

赛尔原创@AAAI 2021 | 纠结于联合学习中的建模方法?快来看看图网络显式建模!

赛尔笔记 | 新分类!全总结!最新Awesome-SLU-Survey资源库开源!

2021年了,对话系统凉透了吗?

美团智能问答技术探索与实践

EMNLP 2020 | 大道至简,后浪选手DPR暴打前浪BM25

达摩院Conversational AI研究进展及应用

国外有哪些领先的智能对话平台?

文本生成

风云三尺剑,花鸟一床书---对联数据集和自动对联机器人

自动对联活动获奖结果以及机器对联赏析

"自动作诗机"上线,代码和数据都是公开的

鼠年春节,用 GPT-2 自动写对联和对对联

用 GPT-2 自动写诗,从五言绝句开始

自动作诗机&藏头诗生成器:五言、七言、绝句、律诗全了

仅供娱乐,藏尾诗生成器来了

文本生成魔改方案汇总!

知识增强的文本生成研究进展

【ICLR2021】CoCon:一种自监督的可控文本生成方法

超详细中文注释的GPT2新闻标题生成项目

Facebook大公开:解决NLG模型落地难题!工业界的新一波春天?

电脑也能写出连贯的文章吗?

如何让BERT具有文本生成能力

聊聊这两天刷屏的OpenAI新作,你注意到CLIP了吗

"妙笔"生花:一个易用、高效的文本生成开源库

阅读理解

阅读理解之(bidaf)双向注意力流网络

陈丹琦博士论文翻译:神经阅读理解与超越(Neural Reading Comprehension and Beyond)

机器翻译

Philipp Koehn大神的神经网络机器翻译学习资料:NMT Book

清华大学NLP组整理的机器翻译论文阅读清单

机器翻译中的强化学习:优点、缺点以及不足

赛尔笔记 | 篇章级机器翻译简介

自然语言推理

迈向NLP大师 | 自然语言推理入门

推荐算法/推荐系统

当推荐系统遇见知识图谱

Attention!当推荐系统遇见注意力机制

深度融合 | 当推荐系统遇上知识图谱(二)

如何将用户行为和属性用于推荐系统?

FM:推荐算法中的瑞士军刀

万变不离其宗:用统一框架理解向量化召回

MIND新闻推荐冠军分享细节揭秘

一文梳理工业界大规模推荐系统Serving架构分析

推荐系统之线上Serving

推荐多目标之自适应权重学习

推荐系统之推荐引擎

推荐特征工程之特征抽取

推荐粗排(召回)工程实践之双塔DNN模型

推荐实践之召回算法梳理与优化思考

推荐排序深度模型演进及特征与模型关系思考

推荐系统之标签修正

推荐系统之样本加权

推荐系统之连续值DNN模型

推荐系统之未登录特征值处理

推荐系统之Position-Bias建模

推荐系统之Co-action Network理解与实践

推荐系统之ContextDNN模型

推荐系统之多目标优化小结

推荐系统中的召回

当我们谈论“推荐系统”时在谈论什么?

推荐系统中的矩阵分解技术

受限玻尔兹曼机原理及在推荐系统中的应用

推荐系统召回四模型之:全能的FM模型

推荐系统召回四模型之二:沉重的FFM模型

推荐系统技术演进趋势:从召回到排序再到重排

【Github】深度学习在推荐系统中的应用及论文小结

推荐精排模型之经典排序模型

推荐模型之DeepMCP模型

基于约束的推荐系统

情景感知推荐系统

推荐系统中的数据挖掘方法

推荐模型之用户行为序列处理

推荐系统之Exploitation & Exploration

推荐多目标之自适应权重学习进阶

推荐系统之样本增强

推荐系统之多目标优化小结

NLP+基于内容的推荐

推荐领域又一经典paper,分分钟搞清楚Attention机制

AAAI2021推荐系统论文清单

从200多篇顶会论文看推荐系统前沿方向与最新进展

从200多篇顶会论文看推荐系统前沿方向与最新进展

从零开始写一个自己的推荐算法库

推荐实践(2):数据集的载入与切割

推荐实践(3):调用算法接口实现一个 demo

推荐实践(4):从KNNBasic() 了解整个算法部分的结构梳理

推荐实践(5):Algo_base() 类的功能介绍

推荐实践(6):accuracy()--surprise 支持哪些指标测量呢?

推荐实践(7):trainset.Trainset() 通过调整数据集让代码更优雅

一篇长文学懂入门推荐算法库:surprise

推荐生态中的bias和debias

支持多值带权重、稀疏、共享embedding权重的DSSM召回实现(tensorflow2)

YouTube基于多任务学习的视频排序推荐系统

推荐系统产品概述

智能重排序在推荐场景中的应用

推荐系统解构

多目标学习(MMOE/ESMM/PLE)在推荐系统的实战经验分享

是不是你的模型又线下线上不一致啦?

深入理解推荐系统:十大序列化推荐算法梳理

多目标排序在快手短视频推荐中的实践kkk

排序(rank)后重排(re-rank)?

小白都能懂的推荐算法入门(一),从上古时期的LR开始聊起

小白都能懂的推荐算法入门(二),FM为什么强大能代替LR?

小白都能懂的推荐算法入门(三),FM、类别特征以及Embedding

浅谈推荐,从FM到深度学习

计算广告/广告系统

计算广告之在线广告市场和背景

oCPC中转化率模型与校准

广告算法工程师的日常

广告模型初探(一)

广告模型初探(二)

广告模型初探(三)

OCPC产品初探

玩儿转oCPC

广告主成本怎么又超了!

点击率预估与冷启动(一)

点击率预估与冷启动(二)

广告流量分析之评价指标的选择(一)

广告流量分析之评价指标的选择(二)

广告成本控制-PID算法

广告智能定向技术lookalike

转化率模型之转化数据延迟

互联网大厂CTR预估前沿进展

CTR学习笔记&代码实现1-深度学习的前奏LR->FFM

CTR学习笔记&代码实现2-深度ctr模型 MLP->Wide&Deep

增量学习在CTR模型训练中的实践

CTR预估系列炼丹入门手册

CTR神经网络特征交叉汇总!

CTR模型越来越"深",如何让它变"轻"?

这个CTR模型,有点意思

特征交互新路线|阿里 Co-action Network论文解读

Normalization在CTR问题中的迷之效果!

神级特征交叉, 基于张量的多语义交叉网络TFNET!

曾今的CTR竞赛王者NFM

计算广告OCPC实践(四) 如何从0开始建立ocpc业务

怎样将Embedding融入传统机器学习框架?

腾讯赛霸榜神技ONN_NFFM

读了那么多CTR论文, 真正有效的又有几个呢?

搜索引擎/搜索系统

谈谈工业界落地能力最强的机器学习算法

搜索中涉及的算法问题

搜索系统中的召回

搜索系统中的纠错问题

中文文本纠错算法--错别字纠正的二三事

纠错:pycorrector的错误检测

纠错:pycorrector的候选召回

浅谈Query理解和分析

搜索中的意图识别

搜索领域算法需要掌握的知识

用户画像初探

浅谈用户理解

做用户,绕不开画像!

【杂谈】选搜索还是选推荐?

负样本为王:评Facebook的向量化召回算法

Airbnb搜索:Embedding表示学习

[Search] 爱彼迎在搜索中应用深度学习的经验

浅谈Learning to Rank中的RankNet和LambdaRank算法

知乎搜索文本相关性与知识蒸馏

知乎搜索排序模型的演进

CVR预估之延迟反馈问题

效果远超FM,CF最新利器HFM!

Transformer是巧合还是必然?搜索推荐领域的新潮流

Airbnb搜索:深度学习排序算法如何进化?

Airbnb搜索:重排序阶段如何优化搜索结果多样性?

CIKM 2020 搜索推荐广告论文集锦

搜索推荐广告排序之用户行为序列建模

如何构建一个好的电商搜索引擎?

流量为王:ABTest流量分层分桶机制

【Recall】MIND:阿里多兴趣网络模型

搜索推荐广告之重排序

关系抽取

从头来看关系抽取

从头来看关系抽取-远程监督来袭

综述:关系抽取,挑战与机遇并存!

关系提取简述

【论文】Awesome Relation Classification Paper(关系分类)(PART I)

【论文】Awesome Relation Classification Paper(关系分类)(PART II)

【论文】Awesome Relation Extraction Paper(关系抽取)(PART III

【论文】Awesome Relation Extraction Paper(关系抽取)(PART IV)

【论文】Awesome Relation Extraction Paper(关系抽取)(PART V)

刘知远老师的“灵魂发问”:关系抽取到底在乎什么?

关系抽取一步到位!

实体关系抽取新范式!TPLinker:单阶段联合抽取,并解决暴漏偏差

事件抽取

超全必读!事件抽取综述(上)

NLP 事件抽取综述(中)—— 模型篇

超全必读!NLP 事件抽取综述(下)

科大讯飞大赛 事件抽取挑战赛冠军分享

百度事件图谱技术与应用

知识图谱

问答知识图谱还缺少什么信息?

知识表示与融入技术前沿进展及应用

知识表示学习-链接预测指标介绍

知识图谱能否拯救NLP的未来?

无需人工!无需训练!构建知识图谱 BERT一下就行了!

赛尔笔记 | 概念体系自动构建

知识图谱补全技术

DGL-KE:亚马逊开源知识图谱嵌入库,亲测快到飞起

“原子”因果常识图谱

知识图谱存储与查询:自然语言记忆模块(NLM)

知识图谱从哪里来:实体关系抽取的现状与未来

知识图谱在小米的应用与探索

百度知识图谱技术及应用

图神经网络

图神经网络综述(一)

图神经网络综述(二)

万物皆可Graph | 当推荐系统遇上图神经网络

GNN教程:图神经网络“开山之作”!

GNN教程:GraghSAGE算法细节详解!

2021年,我终于决定入门GCN

KDD20 | 基于差分变量去相关的稳定学习

经验谈 | 边生万物:关于近期GNN进展的一点思考

图嵌入表示TADW:当DeepWalk加上外部文本信息

SDNE:深度模型图网络

MM'19 | MMGCN 面向短视频推荐的多模态图神经网络

强化学习

解读TRPO论文,深度强化学习结合传统优化方法

多任务学习

2021年浅谈多任务学习

一文"看透"多任务学习

Multi-Task 多任务学习, 那些你不知道的事

敢问多任务学习优化算法路在何方?|附代码

如何利用多任务学习提升模型性能?

多任务学习(MTL)在转化率预估上的应用

竞赛之路

iFLYTEK 多语种文本挖掘挑战赛冠军分享

小布助手对话短文本语义匹配-周星星分享

AI Challenger 2017 奇遇记

AI Challenger 2018 简记

AI Challenger 2018 文本挖掘类竞赛相关代码及解决方案汇总

AI Challenger 2018 机器翻译冠军参赛总结

AI Challenger_2018英中文本机器翻译_参赛小结

AI Challenger 2018 冠军 PPT 分享---细粒度情感分析赛道

AI Challenger 2018 冠军代码分享---细粒度情感分析赛道

AI Challenger 2018 第4名PPT分享---细粒度情感分析赛道

提供一个10分钟跑通 AI Challenger 细粒度用户评论情感分析的fastText Baseline

法研杯要素识别第二名方案总结:多标签分类实践与效果对比

2019法研杯比赛--阅读理解任务第4名团队参赛总结

法研杯cail2019阅读理解比赛记录(第5名团队分享)

【Github】2019年达观信息提取比赛第九名代码和答辩PPT

CCF BDCI2019 金融信息负面及主体判定 冠军方案解析

flyai医疗智能问答比赛小结

【Github】Data Competition Top Solution: 数据竞赛top解决方案开源整理

2020 Kaggle 10大竞赛方案汇总

Kaggle实战之单类别变量特征工程总结!

一人之力,刷爆三路榜单!信息抽取竞赛夺冠经验分享

数据科学竞赛:你从未见过的究极进化秘笈

天池NLP赛道top指南

竞赛中的文本相似性!

求职面试相关

面试-RNN的梯度消失有什么与众不同的地方

腾讯、百度、滴滴最新NLP算法面经

入职半年小结 | 给应届校招算法同学的几点建议

2021算法阿里&腾讯&快手上岸,菜鸟小硕经验分享

【NLP高频面试题】神经网络及其优化

【NLP高频面试题】词表征

【NLP高频面试题】文本处理

2021 校招算法岗, 劝退还是继续

EE转CS,拿了多个行业offer,最终选择NLP算法岗的同学的秋招总结

算法岗通关宝典 | 社招一年经验,字节5轮、阿里7轮

算法岗通关宝典 | 社招一年经验,字节5轮、阿里7轮

14种模式解决面试算法编程题(PART I)

14种模式解决面试算法编程题(PART II)

2020秋招总结:凡是过往,皆为序章

【Github】NLPer-Interview: NLP 算法工程师相关的面试题

【Github】ML-NLP:机器学习、NLP面试中常考到的知识点和代码实现

2021校招算法面试锦囊|华为、网易游戏

劝退文|听说你要转AI

程序员们,想进互联网大厂的看过来

校招60w年薪!互联网企业为什么这么有钱?

核心技巧!如何应对面试笔试环节中的算法题?

【经验分享】半路出身、终去鹅厂算法岗, 总结、分析踩过的坑

秋招算法岗,面试复盘

面经 | NLP算法岗(微软)

算法工程师之路

李沐:工作五年反思

四化大业:论算法工程师的自我修养

NLP算法工程师的日常以及核心竞争力

程序员之算法攻城撕的就业方向、日常、技能及职业规划

算法在岗一年的经验总结

浅谈NLP算法工程师的核心竞争力

以算法岗为例:我最想对入职前的自己说些什么?

20->21:算法工程师的成长思考

业务,工程和算法的互殴现场

那一年,让我整个人升华的C++ BERT项目

[杂谈] 算法工程师们到底在干什么?

为什么要挤破头进大厂?说说那些你不知道的潜在原因

想做算法,你需要哪些条件?

浅谈解决问题的能力

算法工程师内功修炼

算法工程师如何顺利毕业?

【杂谈】在职业生涯早期就要创造出优势

知乎 | 一年半的时间成为算法工程师,这可能吗?

诸葛越:关于算法工程师职业发展的思考

从菜鸟到老鸟!学习算法的三个阶段

实战经验分享

模型debug实战| Ng算法诊断理论的应用

浅谈模型的局限性

如何修正NLP问题的bad case

Apex 到 PyTorch 自带混合精度代码修改

算法工程师常说的【处理数据】究竟是在做什么

ML&DEV | bad case分析

快速从无到有建模完成思路

系统架构

Mesh-Tensorflow: 广义分布式训练大模型

机器学习基础

认真的聊一聊决策树和随机森林

论文笔记

无心插柳 | 聊聊我的 ACL2020 论文

带噪学习研究及其在内容审核业务下的工业级应用

KDD'19| ConcepT 腾讯如何打造概念标签体系?

序列推荐的一些秘密HGN

用腻了 CRF,试试 LAN 吧?

Meta-Learning:Learning to Learn and Applications

可解释性论文阅读笔记1-Tree Regularization

可解释性论文阅读笔记2-Leveraging Language Models

使用Python复现SIGKDD2017的PAMAE算法(并行k-medoids算法)

From Word Embeddings To Document Distances 阅读笔记

Node2Vec 论文+代码笔记

树模型奠基性论文解读| GBM: Gradient Boosting Machine

AdaBelief:一个有“信仰”的优化器

不要浪费没有标注的数据!超强文本半监督方法MixText来袭!

顶会集结+深度解析:医疗+AI如此火爆,NLP如何赋能?

损失函数的“噪音免疫力”

当卷积网络遇上事件检测 (经典论文解读)

5分钟读完史上第一篇二维卷积序列推荐的论文

在PPoPP 2021会议上中了一篇分布式训练论文——DAPPLE

课程笔记

Hello NLP(1)——词向量Why&How

【Hello NLP】CS224n笔记[2]:Word2Vec算法推导&实现

【Hello NLP】CS224n学习笔记[3]:共现矩阵、SVD与GloVe词向量

【Hello NLP】CS224n笔记[4]:自然语言中的依存分析(Dependency Parsing)

【Hello NLP】CS224n笔记[5]:语言模型(LM)和循环神经网络(RNNs)

【Hello NLP】CS224n笔记[7]:机器翻译和seq2seq

CS224n笔记[6]:更好的我们,更好的RNNs

【CS224N课程笔记】词向量II: GloVe, 评估和训练

CS224N学习小结

【CS224N课程笔记】神经网络与反向传播

开源项目及资源

复旦大学自然语言处理实验室发布模型鲁棒性评测平台TextFlint

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

中文自然语言处理相关的开放任务,数据集,以及当前最佳结果

【Github】nlp-paper: 按主题分类的自然语言处理文献大列表

CLUEDatasetSearch:搜索所有中文数据集,附常用英文数据集

用于中文闲聊的GPT2模型:GPT2-chitchat

中文歌词生成,缺不缺语料?这里有一个开源项目值得推荐

深度学习资源大列表:关于深度学习你需要了解的一切

funNLP: 从文本中抽取结构化信息的超级资源包

NLP 2018 Highlights:2018自然语言处理技术亮点汇总

NLP Chinese Corpus项目:大规模中文自然语言处理语料

Awesome-Chinese-NLP:中文自然语言处理相关资料

Jiagu:中文深度学习自然语言处理工具

上百种预训练中文词向量:Chinese-Word-Vectors

lazynlp:构建大规模语料库的"懒人"工具箱

关于聊天机器人,这里有一份中文聊天语料库资源

复旦NLP实验室NLP上手教程

AI算法工程师手册

NLP学习新资料:旧金山大学2019夏季自然语言处理课程

中文自然语言处理数据集:ChineseNLPCorpus

【Github】nlp-journey: NLP相关代码、书目、论文、博文、算法、项目资源链接

NeuralNLP-NeuralClassifier:腾讯开源深度学习文本分类工具

【Github】Chinese-poetry: 最全中华古诗词数据库

【Github】ML-NOTE:注重数学推导的机器学习算法整理

【Github】All4NLP:自然语言处理相关资源整理

【Github】GPT2-Chinese:中文的GPT2训练代码

【Github】nlp-tutorial:TensorFlow 和 PyTorch 实现各种NLP模型

【Github】nlp-roadmap:自然语言处理路相关路线图(思维导图)和关键词(知识点)

【Github】TextCluster:短文本聚类预处理模块 Short text cluster

基于Netty的联机版坦克大战

【数据集】OCR_DataSet:有关OCR的数据集并统一标注格式

公开课、开源书籍或者学习笔记等

认真推荐一份深度学习笔记:简约而不简单

自然语言处理经典《Speech and Language Processing》第三版最新版下载(含第二版)

强化学习圣经:《强化学习导论》第二版(附PDF下载)

2019斯坦福CS224n深度学习自然语言处理课程视频和相关资料分享

CS224N 2019最全20视频分享:斯坦福大学深度学习自然语言处理课程资源索引

CMU-2020最新《神经网络自然语言处理》课程视频+课件+代码分享(附下载)

宅家追课正当时,李宏毅老师2020新课深度学习与人类语言处理正式开放上线

86岁MIT教授Gilbert Strang的线性代数小课:2020新视野下的线性代数

Springer面向公众开放电子书籍,附65本数学、编程、机器学习、深度学习、数据挖掘、数据科学等书籍链接及打包下载

新书下载 | 面向机器学习的数学(Mathematics for Machine Learning)

【新书】从Word2Vec到BERT的自然语言处理嵌入进展,附下载

机器学习数学全书,1900 页 PDF 下载

李航老师《统计学习方法(第二版)》清华大学课件完整版下载!

400页《TensorFlow 2.0 深度学习算法实战》中文版教材免费下载(附随书代码+pdf)

图文并茂!746页机器学习笔记等你领取(附下载)

2020最新版《神经网络与深度学习》中文版更新完毕,pdf开放下载

**科学技术大学计算机学院课程资源:USTC-CS-Courses-Resource

那些值得推荐和收藏的线性代数学习资源

斯坦福大学——人工智能本科4年课程清单

NLP相关工具及在线测试(公众号对话测试)

五款中文分词工具在线PK: Jieba, SnowNLP, PkuSeg, THULAC, HanLP

中文分词工具在线PK新增:FoolNLTK、LTP、StanfordCoreNLP

Python中文分词工具大合集:安装、使用和测试

八款中文词性标注工具使用及在线测试

百度深度学习中文词法分析工具LAC试用之旅

来,试试百度的深度学习情感分析工具

AINLP公众号新增SnowNLP情感分析模块

斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用

自动对联及作诗机

风云三尺剑,花鸟一床书---对联数据集和自动对联机器人

自动对联活动获奖结果以及机器对联赏析

"自动作诗机"上线,代码和数据都是公开的

鼠年春节,用 GPT-2 自动写对联和对对联

用 GPT-2 自动写诗,从五言绝句开始

自动作诗机&藏头诗生成器:五言、七言、绝句、律诗全了

仅供娱乐,藏尾诗生成器来了

夸夸聊天机器人及其他技能

一行Python代码实现夸夸聊天机器人

为了夸夸聊天机器人,爬了一份夸夸语料库

夸夸聊天机器人升级:从随机到准个性化

Unilm对话生成之夸夸式闲聊机器人

来,试试语音(识别)聊天(机器人)

来,试试成语接龙

推荐一份中文数据,来试试汉字、词语、成语、歇后语在线检索

AINLP公众号新增"狗屁不通文章生成器"接口

来,试试彩虹屁生成器

其他相关文章

自然语言处理领域的数据增广方法

NLP中一些简单的数据增强技术

NLP模型中的数字原来这么有趣(一)

浅谈文本增强技术

Meta Learning 1: 基于度量的方法

Meta Learning 2: 更多基于度量的方法

Meta Learning 3: 少样本文本分类 InductionNet

元学习综述 | 进入Meta Learning的世界(一)

自监督学习: 人工智能的未来

从顶会看自监督学习最新研究进展

21个经典深度学习句间关系模型|代码&技巧

AoAFFM:Attention+FFM强强组合

pyspark杂记

我的第一篇论文诞生的故事

神经网络佛系炼丹手册

一文弄懂各种loss function

通过Docker部署深度学习项目环境

GPU 显存不足怎么办?

大幅减少GPU显存占用:可逆残差网络(The Reversible Residual Network)

AINLP-DBC GPU 使用体验指南

用 SQL 而不是 Python 处理文本数据

200行写一个自动微分工具

定个小目标,发它一个亿条微博语料

推荐两份NLP读书笔记和一份NLTK书籍代码中文注释版

微软深度学习入门教程更新

Gilbert Strang教授的MIT公开课:数据分析、信号处理和机器学习中的矩阵方法

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

如何计算两个文档的相似度一

如何计算两个文档的相似度二

如何计算两个文档的相似度三

Hands-on Machine Learning with Scikit-Learn and TensorFlow 学习笔记

感知智能到认知智能中对知识的思考

polyglot:Pipeline 多语言NLP工具

A/B测试的数学原理与深入理解

详解TensorFlow™ GPU 安装

fastText原理及实践

NLP 百问百答

【关于 TF-idf】 那些你不知道的事

这20个技巧让你的NN训练事半功倍

概率图模型系列(一):概率图模型简介

Calibration: 一个工业价值极大,学术界却鲜有研究的问题!

【科普】 AI是什么?AI可以做什么?AI会取代人的工作吗?

连环六问让假 AI 无所遁形

将神拉到人间(Linus 自传读后感)

ML中的数学学习

什么是NLP、NLU、NLG

Spark NLP:Spark可以完成NLP任务?

Hulu在Content Embedding的探索与实践

测试集没标签,可以拿来测模型吗?

学好偏导竟能追到心仪的妹子

盘点高效的KNN实现算法

实话实说:中文自然语言处理的N个真实情况

7分钟搞懂逻辑回归的来龙去脉

数据分析的价值

【Git】从“用”到“懂”

“神奇的”标签增强技术(Label Enhancement)

有关 AI 伦理,我们可以读一读这几本书

样本混进了噪声怎么办?通过Loss分布把它们揪出来!

炼丹师最强危机,谷歌开源最强AutoML工具!

三十多岁就别转行做算法了

谷歌、CMU发文:别压榨单模型了!集成+级联上分效率更高!

Facebook新模型SEER|图像预训练的内卷

增量学习(Incremental Learning)小综述

你还在为如何搞科研而发愁么?

动手学正则表达式(含Python代码实践)

机器学习该怎么入门?(绝对干货)

从Few-shot Learning再次认识机器学习

NeurIPS 2020 | 没有乘法的神经网络,照样起飞?

一文看懂贝叶斯优化/Bayesian Optimization

在机器学习中处理大量数据!

线上线下效果一致性杂谈

内卷的世界,我们是否可以换一种思维生活?

LambdaLoss | Google排序学习优化框架

手把手用AI算法实现冰雪奇缘中的“冰雪魔法”

C++基础知识点整理(一)

C++基础知识点整理(二)

王喆:一个程序员的理财观

【关于 过拟合和欠拟合】那些你不知道的事

硬核!深度学习中的Normalization必知必会

再谈 L2:与 Weight Decay 还有 Batch Norm 不说其实也可以的故事

关于AINLP

AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLP君微信(id:ainlper),备注工作/研究方向+加群目的。

ainlp-archive's People

Contributors

panyang avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.