Fine_tuning_LLMs

介紹

在 OpenAI 領導下，自然語言處理的大型語言模型（Large Language Models, LLMs）已經取得了令人矚目的進展。然而，這些模型也存在一些限制。首先，人們對於隱私問題感到擔憂，因為這些模型需要在一定程度上遵守固定的規則，並受限於它們最後一次訓練的日期。另外，像 PaLM / PaLM 2 和 GPT-3.5 / GPT-4 這樣的預訓練 LLM 並不是開源的，這也意味著開發者和研究人員無法深入了解模型的內部運作，進而限制了他們針對特定應用場景進行微調和客製化的能力。

Llama 2.0

Llama 2.0 的出現標誌著一個嶄新的時代，這是由 Meta 推出的開源 LLM，讓您能夠在您自己的數據集上進行微調。這一特性不僅有助於減少對隱私的擔憂，還能夠提供更加個性化的人工智慧體驗。此外，Quantized Low-Rank Adaptation（QLora）方法為微調 LLMs 提供了一種高效的方式，通過降低內存使用，僅需一個 GPU，便能夠依據個人需求來定制模型，實現更加方便和經濟高效的應用。

介紹 Llama 2.0

Meta 最新 (2023/07) 的 LLM 模型，Llama 2.0 展示了一系列預訓練和微調的模型，從 70 億個參數到 700 億個參數。

與 Llama 1.0 相較之處有：

Llama 2：它的前身 Llama 1 的重新設計版本，來自各種公開可用資源的更新訓練數據。提供三種版本：7B、13B 和 70B 參數。
Llama 2-Chat：是 Llama 2 的優化版本，特別針對對話為基礎的用例進行微調。和 Llama 2 一樣，提供三種版本：7B、13B 和 70B 參數。

Llama 2.0 有哪些更新

將上下文窗口從 2048 token 擴大到 4096 token，使模型能夠處理更大量的資訊。
為了解決注意力與 token 數量二次成本的問題，作者引入了 Grouped-Query Attention，在多個頭部之間 sharing key and value projections。
利用更多數據進行訓練，結合從網路上抓取的數據和基於人類標註者反饋資訊。模型選擇使用公開數據，確保與開源的兼容性，減少可能發生的法律問題。

Llama 2.0 在各種測試中都優於開源模型。儘管它在與 GPT-4 和 PaLM 這樣的封閉源模型競爭時略顯不足，但考慮到它們明顯更大的參數大小和使用私有數據進行訓練，這是預期之內的。Llama 2 模型系列是一個開源的寶庫，可供研究和有限的商業使用。

Parameter-Efficient Fine Tuning (PEFT)

在自己的數據集上微調語言模型是有潛力的。然而，這個過程經常需要大量的 GPU 記憶體( video RAM, vRAM)，且可能是一項資源密集型的工作。例如，微調一個有 650 億參數的模型需要 780 GB GPU 記憶體，相當於十個A100 80 GB GPUs。這種資源需求已經超出一般大眾的財力範圍。

EJ Hu 在2021年提出的 LoRA： Low-Rank Adaptation of Large Language Models。LoRA 的架構涉及凍結預訓練模型 Transformer 的權重，並在矩陣中訓練額外的權重變化，而不犧牲關鍵資訊。

justin2061 / fine_tuning_llms Goto Github PK

fine_tuning_llms's Introduction

Fine_tuning_LLMs

介紹

Llama 2.0

介紹 Llama 2.0

Llama 2.0 有哪些更新

Parameter-Efficient Fine Tuning (PEFT)

fine_tuning_llms's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent