hangzhang10 / ai_offer Goto Github PK

This project forked from code-wd/ai_offer

0.0 1.0 0.0 7.52 MB

这个项目主要用来总结算法工程师面试中常见的问题

ai_offer's Introduction

AI_offer【算法面试经典】

这个项目主要用来总结算法工程师面试中常见的问题，期待能够帮助算法工程师们收获心仪的 offer

注意：GitHub 本身不支持 LaTeX 公式，如果要在线看的话可以安装插件 TeX All the Things，刷新之后就可以正常显示公式；推荐本地使用 Typora 阅读，体验更好

样本不平衡处理方法
- 样本不平衡怎样选择特征
数据增强的常用方案
特征工程【参考地址】
- 怎样选择特征
- 特征工程做的有哪些？非线性可分的情况怎么处理的？
- 标准化、归一化、异常特征清洗、不平衡数据
- 不平衡数据的处理方法
数据预处理
稀疏特征的处理
如何识别数据集中的噪声样本

word2vec和onehot的区别
- 讲讲word2vec原理，介绍一下tf-idf
- WORD2VEC的细节（CBOW+skop-gram huffman树+负采样算
- 介绍word2vec，word2vec假设，负采样，参数数目
RNN 与 LSTM，Bi-LSTM，GRU 原理
- lstm原理三个门作用
- LSTM结构画图，为什么能解决梯度消失和梯度爆炸
transformer 与 BERT
- self-attention 原理
- transformer 原理与优缺点
- BERT 原理【参考地址】
- 位置信息，bert 与 transformer 的位置信息来源不同之处【为什么 transformer 用 positional encodding 而 bert 自己学习 positional embedding】
- bert 的变种模型
- bert的embedding是相加还是concat？
- bert的根号dk作用【dot production 为什么要除以维度的开根号】
- 多头注意力原理与作用
- 描述下多头自注意力机制，自注意力公式，说说为什么用LN，为什么用残差结构
LSTM+attention这个模型为什么要在加attention