Code Monkey home page Code Monkey logo

awesome-open-domain-dialogue-models's Introduction

Awesome Open-domain Dialogue Models

受益于人工智能的技术突破和产品落地,对话系统在⼯业界的应⽤呈爆炸式增⻓,本仓库主要收集目前网上公开的一些高质量开放域对话模型(感谢分享资源的个人、团队以及企业),并将持续更新......

: 😅 huggingface模型下载地址: 1. huggingface官方地址

Expand Table of Contents

中文开放域对话数据集

  • LCCC | 文本 |2020 | LCCC数据集分为base和large两个版本,主要用于预训练大规模对话生成模型,其base版本包括了12M个对话,32.9M个对话语句 | PDF | 数据链接
  • PchatbotW | 文本 | 2021 | PchatbotW主要从微博爬取得到,包括了139,448,339个对话、 278,896,678,并且提供了时间戳和用户ID两种个性信息,可以隐式地建模说话者的个性 | PDF | 数据集链接
  • WDC-Dialogue | 文本 | 2021 | WDC是一个超大规模的中文对话数据集,其平均轮次为2.1,包括了1.4B个对话,以及3.0B个语句 | PDF | 数据集链接
  • M3ED | 多模态 | 2022 | M3ED构建了一个大规模高质量的多模态、多场景、多标签情感对话数据集,从56部中文电视剧,大约500集中选取900多个对话片段,并对对话中的每句话进行多情感标签的标注,共标注24,449句话 | PDF | 数据链接
  • CPED | 多模态 | 2022 | CPED由与情感和个性相关的多源知识组成,包括性别、人格特征、13种情绪、19种对话行为和10个场景,包含超过12K段对话 | PDF | 数据链接
  • C3KG | 文本 | 2022 |C3KG是第一个结合了社会常识知识和对话流信息的中文常识对话知识图谱 | PDF | 数据链接
  • MMChat | 多模态 | 2022 | MMChat是一个大规模多模态多轮对话数据集,其中的每个对话都与一个或多个图片相关联 | PDF | 数据集链接
  • 千言中文对话数据集 | 文本 | 千言中文对话数据集包括DeLeMon、Diamante、LUGE-Dialogue、DuConv、DuRecDial、KdConv、PersonaDialog等,内容涵盖闲聊对话、情感对话、画像对话、知识对话、推荐对话等多个方面 | PDF | 数据集链接
  • GlobalWoZ | 文本 | 2022 | GlobalWoZ是利用机器翻译和目标语言的本地实体创建一个新的多语言大规模ToD数据集GlobalWoZ | PDF | 数据链接
  • TikTalk | 多模态 | 2023 | TikTalk数据集从抖音上采集,其抖音拥有超过25个大类的视频,包括38703个视频和相应367670个对话 | PDF | 数据链接

中文对话模型

CDial-GPT系列

模型 版本 PyTorch 作者 源地址 应用领域
CDial-GPTLCCC-base base huggingface thu-coai CDial-GPT 中文对话
CDial-GPT2LCCC-base base huggingface thu-coai CDial-GPT 中文对话
CDial-GPTLCCC-large large huggingface thu-coai CDial-GPT 中文对话
GPT2-dialogue base

Google Drive
百度网盘-osi6

yangjianxin1 GPT2-chitchat 闲聊对话
GPT2-mmi base

Google Drive
百度网盘-1j88

yangjianxin1 GPT2-chitchat 闲聊对话

EVA系列

  • 2021 | EVA: An Open-Domain Chinese Dialogue System with Large-Scale Generative Pre-Training | Hao Zhou, et al. | arXiv | PDF
  • 2022 | EVA2.0: Investigating Open-Domain Chinese Dialogue Systems with Large-Scale Pre-Training | Yuxian Gu, et al. | arXiv | PDF
模型 版本 介绍 模型下载 作者 源地址 应用领域
EVA 28亿参数 项目首页 模型下载 thu-coai github 中文开放域对话
EVA2.0-xLarge xlarge 项目首页 huggingface thu-coai github 中文开放域对话
EVA2.0-large large 项目首页 huggingface thu-coai github 中文开放域对话
EVA2.0-base base 项目首页 huggingface thu-coai github 中文开放域对话

ChatLLM系列

模型 版本 介绍 模型下载 作者 源地址 应用领域
ChatGLM 6B 项目首页 huggingface THUDM github 中英开放域对话
BELLE 7B 项目首页 huggingface 贝壳 github 中英开放域对话

PLATO系列

🤔 体验地址: 手机微信搜索百度PLATO即可体验 (目前已失效)

🤔 体验地址: ERNIE Bot

  • 2020 | PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable | Siqi Bao, et al. | arxiv | PDF

  • 2021 | PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning | Siqi Bao, et al. | arxiv | PDF

  • 2021 | PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation | Siqi Bao, et al. | arxiv | PDF

  • 2022 | PLATO-KAG: Unsupervised Knowledge-Grounded Conversation via Joint Modeling | Xinxian Huang, et al. | aclanthology | PDF

  • 2022 | Long Time No See! Open-Domain Conversation with Long-Term Persona Memory | Xinchao Xu, et al. | arxiv | PDF

  • 2022 | PLATO-K: Internal and External Knowledge Enhanced Dialogue Generation | Siqi Bao, et al. | arxiv | PDF

模型 版本 介绍 模型下载 作者 源地址 应用领域
PLATO base 项目地址 PaddlePaddle github 中文开放域对话
PLATO-2 93M 项目地址 PaddlePaddle github 中文开放域对话
PLATO-2 314M 项目地址 PaddlePaddle github 中文开放域对话
PLATO-2 1.6B 项目地址 PaddlePaddle github 中文开放域对话
PLATO-XL 11B 项目地址 PaddlePaddle github 中文开放域对话
PLATO-KAG 1.6B 项目地址 PaddlePaddle github 中文知识型对话
PLATO-LTM 1.6B 项目地址 PaddlePaddle github 中文开放域对话
PLATO-K 22B PaddlePaddle 中文开放域对话
ERNIE Bot 中英开放域对话

PanGu系列

  • 2022 | PANGU-BOT: Efficient Generative Dialogue Pre-training from Pre-trained Language Model | Fei Mi, et al | arxiv | PDF
  • 2023 | PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing | Xiaozhe Ren, et al | arxiv | PDF
模型 版本 介绍 模型下载 作者 源地址 应用领域
PanGu-bot 350M 项目首页 huawei-noah github 中文开放域对话
PanGu-bot 2.6B 项目首页 模型下载 huawei-noah github 中文开放域对话
PANGU-$\sum$ 1.085T huawei-noah 中文开放域对话

OPD

模型 版本 介绍 模型下载 作者 源地址 应用领域
OPD 6.3B 项目首页 模型下载 thu-coai github 中文开放域对话

Sky系列

模型 版本 介绍 模型下载 作者 源地址 应用领域
SkyText 2.6B 项目首页 模型下载 SkyWork github 中文GPT3支持对话
SkyText 13B 项目首页 模型下载 SkyWork github 中文GPT3支持对话
SkyChat - 项目首页 - SkyWork github 中文GPT3对话

MOSS

🤔体验地址:moss

模型 版本 介绍 模型下载 作者 源地址 应用领域
MOSS 百亿级别 项目首页 模型下载 复旦大学自然语言处理实验室 github 中文ChatGPT

ChatYuan

🤔体验地址:ChatYuan

模型 版本 模型大小 介绍 模型下载 作者 源地址 应用领域
ChatYuan large-v1 770M 项目首页 模型下载 ClueAI github 元语功能型对话大模型

英文对话模型

Blender系列

🤔 体验地址(目前仅支持US用户): BlenderBot

  • 2021 | BlenderBot 2.0: An open source chatbot that builds long-term memory and searches the internet | Moya Chen, et al. | parl.ai | PDF

  • 2022 | BlenderBot 3: a deployed conversational agent that continually learns to responsibly engage | Kurt Shuster | arxiv | PDF

模型 版本 介绍 模型下载 作者 源地址 应用领域
BlenderBot 2.0 400M 项目地址 模型下载 ParIAI blenderbot2 英文开放域对话
BlenderBot 2.0 2.7B 项目地址 模型下载 ParIAI blenderbot2 英文开放域对话
BlenderBot 3.0 3B 项目地址 模型下载 ParIAI blenderbot3 英文开放域对话
BlenderBot 3.0 30B 项目地址 模型下载 ParIAI blenderbot3 英文开放域对话
BlenderBot 3.0 175B 项目地址 模型下载 ParIAI blenderbot3 英文开放域对话

LaMDA

🤔 体验地址(支持中英等多种语言): Character.AI

  • 2022 | LaMDA: Language Models for Dialog Applications | Romal Thoppilan, et al. | arxiv | PDF
模型 版本 介绍 模型下载 作者 源地址 应用领域
LaMDA 2B 项目地址 - - LaMDA-pytorch 英文开放域对话
LaMDA 8B 项目地址 - - LaMDA-pytorch 英文开放域对话
LaMDA 137B 项目地址 - - LaMDA-pytorch 英文开放域对话

ChatGPT

🤔体验地址(支持中英等多种语言)参考网站:参考

  • 2022 | Training language models to follow instructions with human feedback | Long Ouyang, et al. | arxiv | PDF
  • 2023 | GPT-4 Technical Report | OpenAI* | PDF
模型 版本 介绍 模型下载 作者 源地址 应用领域
ChatGPT - 项目地址 - OpenAI ChatGPT 通用生成模型
InstructGPT - 项目地址 - OpenAI InstructGPT 通用生成模型
GPT4 - 项目地址 - OpenAI GPT4 通用生成模型

Reference

[1] 常见对话生成数据集整理

[2] Awesome Pretrained Chinese NLP Models

[3] 千言中文对话

更新

  • 2023.03.21 增加PANGU-$\sum$,PANGU-$\sum$是一个在Ascend 910 AI处理器和MindSpore框架的集群上训练的一个万亿参数的语言模型
  • 2023.03.21 增加BELLE,BELLE是一个开源的中文对话大模型,基于Stanford Alpaca,并对中文做了优化
  • 2023.03.20 增加ERNIE Bot,ERNIE Bot是百度团队发布的一个人工智能语言模型,中文名是文心一言,可以回答用户的问题,为用户提供有用的信息,并帮助用户完成创作
  • 2023.03.15 增加GPT4,GPT-4是OpenAI最先进的模型,能够产生更安全、更有用的回复
  • 2023.03.14 增加ChatGLM, ChatGLM是一个开源的、支持中英双语的对话语言模型,是一个初具问答和对话功能的千亿中英语言模型
  • 2023.03.06 增加ChatYuan,ChatYuan是业内首个功能型对话开源中文大模型,可以用于回答问题、可以结合上下文做对话、做各种生成任务,包括创意性写作,也能回答法律、新冠等领域类问题
  • 2023.02.21 增加MOSS,MOSS是复旦大学自然语言处理实验室发布的一个具备 ChatGPT 能力的语言模型
  • 2023.01.31 增加TikTalk,TikTalk是一个真实闲聊中文多模态数据集,共包括38703个视频和相应367670个对话
  • 2022.12.27 增加SkyChat, SkyChat是一款基于中文GPT-3 API研发的聊天机器人项目,它除了基本的聊天、对话、你问我答外,还能支持中英文互译、内容续写、对对联、写古诗、生成菜谱、第三人称转述、创建采访问题等多种功能
  • 2022.12.19 增加SkyText,SkyText是由奇点智源发布的中文GPT3预训练大模型,可以进行聊天、问答、中英互译等不同的任务
  • 2022.12.13 增加InstructGPT,InstructGPT和ChatGPT在模型结构,训练方式上都完全一致,都采用了指示学习和人工反馈的强化学习来指导模型的训练
  • 2022.12.04 增加ChatGPT,ChatGPT是一个由 OpenAI 训练的大型语言模型,ChatGPT 支持和用户通过对话的形式“回答问题”,并且赋予了一些简单的智能化行为
  • 2022.11.23 增加PLATO-K,PLATO-K提出了同时结合知识内化和知识外用的全面知识增强策略,参数规模达到了220亿,是当前最大规模的中文对话模型
  • 2022.11.17 增加GlobalWoZ,GlobalWoZ是面向全球通用的人机对话系统多语言任务型对话数据
  • 2022.11.16 增加PLATO-XLLaMDAa和Blender体验地址,可以与闲聊机器人面对面聊天
  • 2022.11.09 增加OPD,OPD是一个中文开放域对话预训练模型,拥有63亿参数,在70GB高质量对话数据上进行训练而成
  • 2022.11.04 增加LaMDA,LaMDA 通过微调一系列专门用于对话的、基于 Transformer 的神经语言模型构建的,具有多达 137B 个参数,模型还可以利用外部知识源进行对话
  • 2022.10.25 增加Blender系列模型,Facebook下一系列对话模型
  • 2022.10.15 增加PanGu系列模型,PanGu-Dialog是以大数据和大模型为显著特征的大规模开放域对话生成模型,充分利用大规模预训练语言模型的知识和语言能力,构建可控、可靠可信、有智慧的自然人机对话模型
  • 2022.09.30 增加PLATO系列模型,百度自主研发的集闲聊、任务、知识于一身的对话机器人
  • 2022.09.25 增加EVA系列模型,EVA 是目前最大的开源中文预训练对话模型
  • 2022.09.17 初始化中文CDial-GPT系列模型,最早开源的中文对话模型,同时还开源了闲聊对话数据集LCCC
  • 2022.08.17 增加中文开放域对话数据集

awesome-open-domain-dialogue-models's People

Contributors

cingtiye avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.