Light

fly51fly / aicoco Goto Github PK

View Code? Open in Web Editor NEW

495.0 48.0 62.0 2 KB

“爱可可-爱生活”微博内容精选

aicoco's Introduction

“爱可可-爱生活”微博内容精选

aicoco's People

Contributors

Stargazers

Watchers

Forkers

digideskio ragebabydontcry baifanysu sharmer156 phexic winkywang bhanditz ooyuanyuan smilethensee leifengsoul zijuzhang cheng1112 maomaoyuchengzi lihj1024 think-jumper amo5 cuijianzhu whatneuron panda781022 zumbalamambo mazhou100 amberisy peacegui stoneyu3 zjpczfq fengjiufa wangyxxjtu albert2lyu hangzhang10 yuxinfang21 zhaoyan12345677 elaineln163 zy2014224157 lipanpanpanpan tobeeeelite bbackknight mengwangthu liyuglikz sebastinaa curios1ty wikipedia2008 ian688 flysj deepstem henriquepheak markruche fumingyu liuqinglong110 ronioncloud laotanling githubssj xusun98 idea15 meowcyber stephenzheng0315 pubfork peanutbutterxxx lucy9527 bthuntercn hualaohu991 darvin eternityi

aicoco's Issues

爱可可微博热门分享(1.27)

No 1. 免费书稿：《机器学习工程》，提供了一系列关于机器学习工程的深入内容，包括但不限于数据处理、模型训练、模型评估、模型部署等方面的知识，可以帮助读者更好地理解和掌握机器学习工程的各个方面，从而在实际工作中更有效地应用机器学习技术
No 2. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 3. 《「我在淘天做技术」智能对话新纪元：百万日活对话机器人的LLM落地实践》
No 4. 掌握Llama 2：Meta推出提示工程交互式指南
No 5. 你在用什么AI编程辅助工具？- Github Copilot：由Github官方推出的智能编程辅助插件，可以直接集成到VSCode等编辑器或IDE，提供智能代码建议与补全。 ......
No 6. StreamRAG: GPT驱动的视频检索和流媒体工具，可以用于以下用途：上传多个视频以创建库或集合，搜索这些视频并获得实时视频响应或编译，将可搜索的集合发布到ChatGPT商店，接收摘要文本答案(RAG)，从特定视频获得关键见解
No 7. [LG] DeepSeek-Coder: When the Large Language Model Meets Programming ......
No 8. Search with Lepton：使用Lepton构建自己的会话式搜索引擎，只需不到500行代码，具备内置的LLM(语言模型)支持、内置的搜索引擎支持和可定制的漂亮用户界面
No 9. Obsidian Latex Suite：Obsidian插件，旨在通过快捷方式和文本扩展使LaTeX数学排版与手写一样快速
No 10. makeMoE：从头开始实现的稀疏专家混合语言模型，基于PyTorch的自回归字符级语言模型，采用稀疏专家混合架构，与makemore相似
No 11. 非母语者英语科研写作的7个技巧
No 12. WhisperFusion：具有超低延迟无缝对话功能的AI系统，基于WhisperLive和WhisperSpeech的能力，集成了Mistral，一个大型语言模型(LLM)，在实时语音转文本管道上运行。LLM和Whisper都经过优化，以TensorRT引擎的形式高效运行，以实现高性能和实时处理能力
No 13. makeMoE：从零开始实现稀疏混合专家语言模型
No 14. Dendy：用Go编写的NES/Famicom游戏机模拟器
No 15. 故事生成/叙事生成相关论文列表，主题包括大型语言模型、情节发展、更好的叙事、可控性、角色、写作风格、故事规划、评估、应用和数据集
No 16. Safe LLM Leaderboard：LLM安全排行榜，旨在评估大型语言模型(LLM)的安全性，包括偏见和毒性、个人身份信息(PII)保护以及鲁棒性。排行榜提供了一个统一的评估框架，帮助研究人员和实践者更好地理解和比较不同LLM的安全性能
No 17. Lumos：基于RAG(Retrieval-Augmented Generation)的大型语言模型(LLM)协作工具，用于浏览网络，由本地LLM驱动
No 18. [CL]《Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts》
No 19. Unitxt：用于快速准备数据以供训练和评估的Python库，通过一行代码将数据集或数据混合准备成适用于训练和评估的输入输出格式。该库的设计理念包括简单性、适应性和透明度，使其易于使用并能够添加新的数据集、加载指令和格式
No 20. Pluto：合成数据生成库，旨在帮助细调LLMs的用户解决数据不足的问题，可以通过主题树来增加数据的多样性，克服数据的重复性，并支持并行采样请求以加速数据生成，用户可以使用任何模型提供者生成数据
No 21. '闯关式 SQL 自学网 - 免费的闯关式 SQL 自学教程网站，从 0 到 1 带大家掌握常用 SQL 语法，纯前端实现，简单易学' ......
No 22. [CV]《Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities》
No 23. Bene: 用于阅读EPUB文件格式的阅读系统，支持网页和桌面应用
No 24. Pipelight：自托管的轻量级CLI工具，用于创建微小的自动化流水线，可将CI/CD引入最小的项目，基于Rust，占用空间小(13Mb)并使用TypeScript、Toml和Yaml定义流水线
No 25. [CV]《Deconstructing Denoising Diffusion Models for Self-Supervised Learning》
No 26. Kimi Commits：利用Kimi AI技术，为IntelliJ、PyCharm、WebStorm和GoLand等开发工具提供智能的提交消息生成功能，支持在列表的名称和描述中添加表情符号
No 27. Lightning Studio：一体化云平台，用于大规模构建和部署人工智能产品
No 28. 几篇论文实现代码
No 29. Mamba状态空间模型相关文献列表
No 30. 通过分析和分类不同的结构增强型LLM推理方案，提供了对提示工程的深入理解，为未来的提示技术发展指明了方向。//[CL]《Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts》
No 31. Luna AI：全自动的 AI 直播系统，由Cha...
No 32. [LG]《MoE-Infinity: Activation-Aware Expert Offloading for Efficient MoE Serving》
No 33. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 34. Applio：经过精心优化的终极语音克隆工具，旨在提供卓越的性能、模块化和用户友好的体验，增强功能包括代码模块化、跳长实现、支持30多种语言的翻译、跨平台兼容性、优化的要求、简化的安装流程等
No 35. 状态空间模型(SSM)相关资源代码列表
No 36. Synthetic Data Generator：专注于快速生成高质量结构化表格数据的框架，支持许多单表和多表数据合成算法，可实现高达120倍的性能提升，并支持差分隐私和其他方法以增强合成数据的安全性
No 37. [CL] MM-LLMs: Recent Advances in MultiModal Large Language ......
No 38. [CV] Diffuse to Choose: Enriching Image Conditioned Inpainting ......
No 39. 早！[太阳]
No 40. 关于使用RAG模式(Retrieval-Augmented Generation)的应用和资源的信息，包括关于RAG技术的综述，以及一些GitHub库和企业级应用的链接，这些应用使用RAG模型来增强自然语言处理和信息检索能力
No 41. 物料成本700+元的FOC双轮腿机器人，提供了一种新型结构的轮腿机器人的开源资料，包括机械设计、电子设计、算法仿真和软件开发等材料
No 42. Adept Fuyu-Heavy：新的大规模多模态模型
No 43. [CL] WebVoyager: Building an End-to-End Web Agent with Large ......
No 44. [LG]《Task structure and nonlinearity jointly determine learned representational geometry》
No 45. 提出一种称为meta-prompting的技术，通过将单个语言模型转变为一个多面手的指挥者，并引导其将复杂任务分解为更小的子任务，从而提高语言模型在各种任务中的性能。//[CL]《Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding》
No 46. 机器学习/深度学习推荐书单，包括作者自己的一本书《...
No 47. 提出一种利用无关数据改进特定模态transformers的方法，通过构建路径连接两个模态组件，利用通用序列建模能力实现了在图像、点云、视频和音频识别任务中的显著性能提升。//[CV]《Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities》
No 48. WhisperBot：整合了Mistral大型语言模型的实时语音转文本系统，基于WhisperLive和WhisperSpeech，WhisperLive使用OpenAI Whisper作为强大的自动语音识别系统，Mistral和Whisper都经过TensorRT引擎优化，以实现高性能和低延迟处理
No 49. Ollama发布Python和JavaScript库：简化应用集成
No 50. 今日推介(第1297期)：解构面向自监督学习的去噪扩散模型、思维链思维树和思维图的LLM推理拓扑学、任务结构和非线性性质共同决定了学到的表征性几何、用其他模态的非相关数据改善Transformer、基于激活感知专家卸载的高效MoE服务 ......

爱可可微博热门分享(1.20)

No 1. Docker超级速查清单
No 2. 汇总了一下这学期Python编程课从同学们那里收集来的建设性意见，夸的就不贴了，大多数意见很中肯，值得在以后的教学中进一步改进，谢谢2023学期的同学们，发博留念～ ......
No 3. 用500行SQL代码实现GPT：介绍了如何使用SQL实现一个大型语言模型，解释了SQL不适合实现大型语言模型的原因，介绍了生成式大型语言模型所需的逻辑和算法。文章还提到了生成预训练Transformer(GPT)的原理和实现细节
No 4. 来来来，看看你更喜欢什么样的聊天机器人提示～爱可可-爱生活的微博...
No 5. LLM的偏好微调和对齐
No 6. [CV] DiffusionGPT: LLM-Driven Text-to-Image Generation System ......
No 7. 2024进度：░░░░░░░░░░░░░░░ 5%
No 8. 免费书稿：《向量检索基础》
No 9. Meta全力以赴：年底前购35万块H100，加速开源AGI研发
No 10. Vision Pro制造过程，感概现代工业设计和制造技术！[666]
No 11. 视觉Mamba：高效的视觉建模技术，提升速度，节省内存
No 12. 用一句话让ChatGPT“泄密”
No 13. WhisperBot：整合了Mistral大型语言模型的实时语音转文本系统，基于WhisperLive和WhisperSpeech，WhisperLive使用OpenAI Whisper作为强大的自动语音识别系统，Mistral和Whisper都经过TensorRT引擎优化，以实现高性能和低延迟处理
No 14. [CV] VMamba: Visual State Space Model 介绍了一种名为VMamba的新型视觉基础模型，通过引入全局感受野和动态权重，实现了线性复杂度的计算效率。为了解决方向敏感问题，引入了交叉扫描模块(CSM)，在不增加计算复杂度的情况下，实现了全局感受野。实验结果表明，VMamba在各 ......
No 15. #抽奖# #赠书# 携手@图灵新知 @图灵文化送出5本《智能文本处理实战》
No 16. 如果Windows XP活到现在……“小芳”一样的存在啊～
No 17. Fish Audio Preprocessor：一些用于音频处理的脚本，包括：将视频/音频转换为wav格式、音频声音分离、自动音频切片、音频音量匹配、音频数据统计、音频重采样
No 18. 免费书稿：《概率和统计学导论：随机性的计算框架》，...
No 19. 晚安～ [月亮]
No 20. Apple开源AIM(Autoregressive Image Models), 一组用自回归目标预训练的视觉模型
No 21. 今日推介(第1290期)：构建GPT-4级会话QA模型、基于深强化学习和真实轨迹数据的自主车辆交通平滑控制器、自适应动态剪枝神经元符号回归、自我奖励语言模型、神经收缩动力学系统 ......
No 22. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 23. [CL]《Self-Rewarding Language Models》
No 24. MeetingSummarizer：轻松记录、转录和总结会议，由OpenAI的Whisper和GPT-3.5-turbo驱动，CLI和GUI两种界面提供了不同的使用方式，用户可以使用命令行或图形界面来录制、转录和总结会议内容
No 25. DeepCausality：超几何计算因果性库，可在复杂的多阶段因果模型上实现快速和确定性的上下文感知因果推理
No 26. [CL]《ChatQA: Building GPT-4 Level Conversational QA Models》
No 27. 几篇论文实现代码
No 28. 早！[太阳]
No 29. [CV] Improving fine-grained understanding in image-text pre-training ......
No 30. 2024机器学习书单
No 31. 通过深度强化学习和真实世界轨迹数据，设计了交通平滑控制器，实现了在无人驾驶车辆中的燃油节省和交通流量的改善。//[LG]《Traffic Smoothing Controllers for Autonomous Vehicles Using Deep Reinforcement Learning and Real-World Trajectory Data》
No 32. Chinese-Mixtral-8x7B：中文Mixtral-8x7B，基于Mistral发布的模型Mixtral-8x7B进行了中文扩词表增量预训练
No 33. [CV] Rethinking FID: Towards a Better Evaluation Metric for ......
No 34. [RO]《Neural Contractive Dynamical Systems》
No 35. 开源语音合成(TTS)项目汇总：XTTS - 网页链接YourTTS - 网页链接FastSpeech2 - 网页链接VITS ......
No 36. 来来来，说说你最常用的是哪几个？为什么？爱可可-爱生活的微博...
No 37. 大型语言模型基础知识可视化学习指南
No 38. '中文对话0.2B小模型 ChatLM-Chinese-0.2B - 开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调' ......
No 39. [CV] Remote Sensing ChatGPT: Solving Remote Sensing Tasks with ......
No 40. 提出一种自我奖励的语言模型方法，通过自我生成奖励信号来提高模型的训练效果，避免了传统方法的人类表现水平限制，实现了模型的持续改进。//[CL]《Self-Rewarding Language Models》
No 41. 《AI 研发提效研究：自己动手训练 LoRA》
No 42. 'Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型，支持加载本地知识库做检索增强生成RAG。Training ......
No 43. Interconnects Tools for Multimodal Blogging!：将博客内容轻松转化为播客和YouTube内容，使用了两个先进的生成AI工具，分别是Elevenlabs.io的多语言模型用于音频生成以及OpenAI的DALLE3用于生成图像
No 44. Perfect Roadmap To Learn Data Science In 2024：关于学习数据科学的新版路线图，包括深入学习Python编程语言，统计学，数据库，机器学习，深度学习，自然语言处理以及MLOPS(机器学习运维)，提供了广泛的学习资源和实际项目实践，是学习数据科学的理想指南
No 45. Large Language Models Play StarCraft II: 支持大型语言模型(LLM)玩StarCraft II的纯语言环境，开发了TextStarCraft II文本环境，提出一种多级摘要方法，用于处理原始观察数据、分析游戏信息、提供命令建议和生成战略决策，实验证明LLM智能体能在Harder(Lv5)难度级别下击败内置AI
No 46. HuixiangDou：“茴香豆”，基于LLM的领域知识助手，特点包括应对群聊复杂场景、解答用户问题避免消息泛滥、提供一套解答技术问题的算法流程以及低成本部署
No 47. VectorHub：免费的、开源的学习网站，面向有意将向量检索加入到机器学习栈的开发人员
No 48. 提出一个两阶段的指令微调方法和增强的检索器，构建了能达到GPT-4水平准确度的对话问答模型，并在多个数据集上取得了优于GPT-4的结果。//[CL]《ChatQA: Building GPT-4 Level Conversational QA Models》
No 49. 在实现人工智能与人类价值观对齐之前，必须先实现概念对齐，即人工智能系统和人类在概念上的共享理解，以提高交流和互动的效果。//[LG]《Concept Alignment》
No 50. SmartExcel.cc：使用人工智能生成所需Excel公式的工具，利用ChatGPT API和Vercel AI SDK进行实时交互，通过Vercel Edge Function将其发送到ChatGPT API，然后将响应流式传输回应用界面

爱可可微博热门分享(1.19)

No 1. 来来来，看看你更喜欢什么样的聊天机器人提示～爱可可-爱生活的微博...
No 2. 免费书稿：《向量检索基础》
No 3. 免费书稿：《概率和统计学导论：随机性的计算框架》，...
No 4. LLM的偏好微调和对齐
No 5. Chinese-Mixtral-8x7B：中文Mixtral-8x7B，基于Mistral发布的模型Mixtral-8x7B进行了中文扩词表增量预训练
No 6. 汇总了一下这学期Python编程课从同学们那里收集来的建设性意见，夸的就不贴了，大多数意见很中肯，值得在以后的教学中进一步改进，谢谢2023学期的同学们，发博留念～ ......
No 7. Docker超级速查清单
No 8. #抽奖# #赠书# 携手@图灵新知 @图灵文化送出5本《智能文本处理实战》
No 9. RunwayML最新推出Multi Motion Brush：允许用户用AI单独控制一幅图像中最多五个不同对象的运动。这一功能增强了在AI视频创作和编辑中的创意控制能力，适用于Runway的Gen-2视频模型
No 10. 2024机器学习书单
No 11. DeepCausality：超几何计算因果性库，可在复杂的多阶段因果模型上实现快速和确定性的上下文感知因果推理
No 12. Fish Audio Preprocessor：一些用于音频处理的脚本，包括：将视频/音频转换为wav格式、音频声音分离、自动音频切片、音频音量匹配、音频数据统计、音频重采样
No 13. WhisperBot：整合了Mistral大型语言模型的实时语音转文本系统，基于WhisperLive和WhisperSpeech，WhisperLive使用OpenAI Whisper作为强大的自动语音识别系统，Mistral和Whisper都经过TensorRT引擎优化，以实现高性能和低延迟处理
No 14. Jute：用于交互式计算的本地笔记本，通过双击打开...
No 15. Cubzh：一个在线平台，用C/C++和Lua编写，允许用户使用与Lua脚本配对的立方体创建物品、环境和游戏。它受到Roblox和Minecraft的启发，具有易于使用的脚本环境和免费的服务器，可进行即时多人游戏，旨在释放类似Roblox中所见的创造力
No 16. MeetingSummarizer：轻松记录、转录和总结会议，由OpenAI的Whisper和GPT-3.5-turbo驱动，CLI和GUI两种界面提供了不同的使用方式，用户可以使用命令行或图形界面来录制、转录和总结会议内容
No 17. 如果Windows XP活到现在……“小芳”一样的存在啊～
No 18. HuixiangDou：“茴香豆”，基于LLM的领域知识助手，特点包括应对群聊复杂场景、解答用户问题避免消息泛滥、提供一套解答技术问题的算法流程以及低成本部署
No 19. [CL] ReFT: Reasoning with Reinforced Fine-Tuning 介绍了一种名为Reinforced ......
No 20. gptstore-prompts：GPTStore上的100个热门GPTs提示，可以利用这些提示来学习和改进提示工程，学习如何构建最好、最受欢迎的 GPTS
No 21. 含噪数据的平滑
No 22. 几篇论文实现代码
No 23. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 24. 早！[太阳]
No 25. [LG] DeepSpeed-FastGen: High-throughput Text Generation ......
No 26. ComfyUI PhotoMaker：对'PhotoMaker for ComfyUI'的非官方实现，支持本地模型、自定义尺寸、提速3倍、多图直接输入等
No 27. [LG]《Concept Alignment》
No 28. LLMPlus：允许Python开发者使用不同的大型语言模型(LLM)并通过简单的界面进行提示工程，提供了加载LLM模型、嵌入模型和向量数据库的类，以创建带有自己的提示工程和RAG技术的LLM应用
No 29. 'WechatAnnualReport - 微信聊天记录导出、微信年度报告生成' GitHub: github.com/chenyifanthu/WechatAnnualReport ......
No 30. Byzer-LLM：基于 Ray 的 LLM 全生命周期解决方案，包括预训练、微调、部署和服务，支持 Python/SQL API，基于 Ray，易于扩展
No 31. Interconnects Tools for Multimodal Blogging!：将博客内容轻松转化为播客和YouTube内容，使用了两个先进的生成AI工具，分别是Elevenlabs.io的多语言模型用于音频生成以及OpenAI的DALLE3用于生成图像
No 32. [CL]《Large Language Models Are Neurosymbolic Reasoners》
No 33. [CV]《Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model》
No 34. 晚安～ [月亮]
No 35. Large Language Models Play StarCraft II: 支持大型语言模型(LLM)玩StarCraft II的纯语言环境，开发了TextStarCraft II文本环境，提出一种多级摘要方法，用于处理原始观察数据、分析游戏信息、提供命令建议和生成战略决策，实验证明LLM智能体能在Harder(Lv5)难度级别下击败内置AI
No 36. 面向无人驾驶的视觉基础模型相关文献资源列表
No 37. 在实现人工智能与人类价值观对齐之前，必须先实现概念对齐，即人工智能系统和人类在概念上的共享理解，以提高交流和互动的效果。//[LG]《Concept Alignment》
No 38. 大型语言模型基础知识可视化学习指南
No 39. 开源语音合成(TTS)项目汇总：XTTS - 网页链接YourTTS - 网页链接FastSpeech2 - 网页链接VITS ......
No 40. [LG]《Asynchronous Local-SGD Training for Language Modeling》
No 41. AI文本生成的采样技术：从温度到结构化输出的全面指南
No 42. Privy：注重隐私的编程助手，可在本地系统上运行候选平台的LLM(语言模型)，可以选择Mistral、CodeLLama等热门的LLM。安装Privy扩展可以从Visual Studio Code Marketplace或Open VSX Registry进行
No 43. SciDataFlow：科研数据流管理工具
No 44. [LG] A Survey on Statistical Theory of Deep Learning: Approximation, ......
No 45. 数字人对话系统 - Linly-Talker：将大...
No 46. Bluestone Markdown：所见即所得的...
No 47. [CV] Compose and Conquer: Diffusion-Based 3D Depth Aware Composable ......
No 48. 提出一种名为Vision Mamba(Vim)的通用视觉骨干网络，通过双向状态空间模型和位置嵌入实现数据依赖的全局视觉上下文建模和位置感知的视觉识别，具有更高的计算和内存效率，适用于处理高分辨率图像的密集预测任务。//[CV]《Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model》
No 49. Draw2Img：一个简单的Web用户界面，用于交互式文本引导的图像生成，适用于任何年龄和技能水平
No 50. 《AI 研发提效研究：自己动手训练 LoRA》

爱可可微博热门分享(1.10)

No 1. AI行业四大战场——数据之战、GPU贫富之战、多模态之战、RAG/运维之战
No 2. 免费书稿《深度学习数学导论：方法、实现和理论》
No 3. 免费书稿《数学分析(第二卷)》
No 4. Twinny：为VS Code设计的本地或API主机的AI代码补全插件，类似于GitHub Copilot，但完全免费和100%私密
No 5. '开源大模型食用指南 - 基于AutoDL快速部署开源大模型，提供完整指南，包括环境配置、部署和微调，助你轻松掌握各类大模型应用' ......
No 6. mergekit模型融合实战
No 7. LinguaCafe：免费的自托管软件，旨在帮助语言学习者通过阅读来学习词汇
No 8. [LG] Can Large Language Models Beat Wall Street? Unveiling the ......
No 9. [CV] A Survey on 3D Gaussian Splatting 网页链接 3D高斯Splatting(3D ......
No 10. 图解AI开放状况(数据来源：Coatue)：从模型代码、模型权重、训练数据、模型评估、架构决策和商业许可的开放性等方面，对比了主流的AI模型——GPT-2、GPT-3、GPT-4、LaMA(来自Meta)、LaMA-2和Mistral-7B的开放程度。 ......
No 11. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 12. [CL]《Mixtral of Experts》
No 13. [CL] From LLM to Conversational Agent: A Memory Enhanced Architecture ......
No 14. 15个最新的AI语音生成器
No 15. Nebula engine：C++游戏引擎，游戏引擎，特色包括完全基于数据驱动的设计、高性能数据结构套件、多线程支持、SSE加速的数学库、完整支持Python脚本、先进的渲染框架和着色器、性能测试工具和性能分析工具等
No 16. ToRA: ToRA(Tool-integrated Reasoning LLM Agents)系列工具，旨在通过与其他工具的交互来解决复杂的数学推理问题，使用自主Agent技术，能集成在工具中进行推理，并提供强大的数学推理能力
No 17. SmartExcel.cc：使用人工智能生成所需Excel公式的工具，利用ChatGPT API和Vercel AI SDK进行实时交互，通过Vercel Edge Function将其发送到ChatGPT API，然后将响应流式传输回应用界面
No 18. 通过无约束生成对中文大型语言模型的幻觉产生进行基准测试
No 19. 3D人工智能生成内容(AIGC)的论文和资源列表，旨在跟上未来几个月预期的研究潮流，内容包括文本生成、图像生成、音频生成、3D编辑、人物形象生成、城市/自动驾驶、SLAM、生物医学、4D AIGC等领域。此外，还包括开源实现、非官方实现、数据集、博客文章、教程视频等附加资源
No 20. [CL]《Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM》
No 21. AI Toolkit：用于构建游戏NPC智能控制系统的C++头文件库，提供有限状态机、行为树、实用AI和目标导向行动规划等功能
No 22. mistral-haystack collection：包含一系列笔记本和资源的集合，用于构建检索增强生成(RAG)流水线，其中使用了Mistral模型和Haystack LLM编排框架
No 23. AI Gateway：高性能的AI路由，具有极快速和友好的API，可以将请求路由到100+个LLM(Language Model Model)，提供了一个统一的接口，方便使用者与多个LLM进行交互，并支持生成式AI和语言链等功能
No 24. KAIST课程《3D数据机器学习》，内容涵盖了深度学习在处理和分析3D数据方面的最新进展，包括计算机视觉、计算机图形学和机器人领域的应用
No 25. 晚安～ [月亮]
No 26. 提示工程职业化的反思
No 27. Local AI Voice Chat：基于Zephyr 7B模型使用自定义语音进行本地AI对话，使用RealtimeSTT和faster_whisper进行转录，使用RealtimeTTS和Coqui XTTS进行语音合成，提供了一个实时的聊天机器人，可以进行语音交互
No 28. [LG]《TimeGraphs: Graph-based Temporal Reasoning》
No 29. [CL] A Mechanistic Understanding of Alignment Algorithms: ......
No 30. 几篇论文实现代码
No 31. FlagPerf：由智源研究院与AI硬件厂商合作建立的AI硬件评测引擎。其特色在于构建了多维度的评测指标体系，不仅关注耗时，还包括性能、资源使用和生态适配能力等指标
No 32. 今日推介(第1280期)：用多个百亿参数LLM模型Blending赶超万亿参数LLM、基于图的时间推理、面向基于模型机器人学习的离线预训练到在线微调、人工反馈强化学习的最小最大化方法、稀疏专家混合(SMoE)语言模型Mixtral ......
No 33. 《‌⁢‍⁡⁢⁤‍⁣⁢⁣‍⁡‍⁤‍⁣⁤⁣‌涓海录AIGC学习文档 - 飞书云文档》
No 34. 早！[太阳]
No 35. 近年来AI发展里程碑论文集锦： - Transformers: Attention is All You Need 提出了Transformer模型，完全基于注意力机制，摒弃了以往模型依赖的递归和卷积结构，为自然语言处理领域带来了革命性的影响，并极大地提高了机器翻译任务的效率和准确性。 ......
No 36. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 37. 提出一种简单而稳定的强化学习算法SPO，通过零和博弈的方式，避免了训练奖励模型的需求，并能处理非马尔可夫、不可传递和随机偏好，具有更高的学习效率。//[LG]《A Minimaximalist Approach to Reinforcement Learning from Human Feedback》
No 38. [LG]《MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning》
No 39. inquire：用于构建交互式提示的Rust库，通过使用inquire，可以轻松地创建命令行界面中的交互式提示，使用户能与进行交互，提供了丰富的功能和灵活的API，使开发者能够定制和控制提示的行为
No 40. [LG]《A Minimaximalist Approach to Reinforcement Learning from Human Feedback》
No 41. 'ChatGPT-Plus - AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 ChatGPT, ......
No 42. Transformer详解，通过简化的数学公式解释了Transformer模型的工作原理，以及注意力机制、残差连接和层归一化的解释
No 43. 人工智能可能会从自我对话中受益
No 44. 使用大型语言模型进行生成式信息抽取(IE)的论文集合，涵盖了命名实体识别、关系抽取、事件抽取等多个信息抽取任务，介绍了学习范式、特定领域、数据增强、评估分析等方面的内容
No 45. CivRealm: 基于开源游戏Freeciv-web的学习和推理环境，提供了基于强化学习和语言模型的决策智能体接口，以及训练和评估工具和基线模型，希望成为复杂环境中学习和推理代理的测试平台
No 46. [LG] Improving sample efficiency of high dimensional Bayesian ......
No 47. 过去50年来最重要的统计学**：反事实因果推断、bootstrapping和基于模拟的推断、过参数化模型和正则化、贝叶斯多层模型、通用计算算法、自适应决策分析、鲁棒推断和探索性数据分析。这些**在统计学和数据科学领域的研究中起到了重要的推动作用
No 48. TimeGraphs是一种新的图时间推理方法，通过构建层次结构的时间图，能高效地处理不均匀分布的动态，并在多个时间推理任务上取得了最先进的性能提升。//[LG]《TimeGraphs: Graph-based Temporal Reasoning》
No 49. [LG] CRUXEval: A Benchmark for Code Reasoning, Understanding ......
No 50. 介绍了一种名为Blending的方法，通过组合较小的对话人工智能模型，可以达到与单一大模型相媲美或更好的性能，为提高对话人工智能效能提供了一种可行的方法。//[CL]《Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM》

爱可可微博热门分享(12.28)

No 1. 26个提示(prompt)优化技巧，帮你更好地使用ChatGPT们： 1 - 不需要过多客套，直接表达即可，无需使用'请'、'如果你不介意'、'谢谢'、'我想要'等短语。 ......
No 2. 深度学习面试题库，涵盖了大模型、计算机视觉、感知算法、深度学习基础与框架等专题，提供详细的题目解析
No 3. 'KS的日语学习工具 v0.2 - 简易日语学习 / 视觉小说阅读辅助工具，特色包括句子分析、游戏文本提取和谷歌翻译等功能’ ......
No 4. [LG] Diffusion Models for Generative Artificial Intelligence: ......
No 5. Rust Rustcamp：学习Rust的逐步培训计划，通过严格的培训和实践项目，帮助参与者成为熟练的初级Rust开发者
No 6. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 7. Lit-GPT：基于nanoGPT的开源大型语言模型的可定制实现，支持Flash Attention 2、4-bit和80bit量化、LoRA和LLaMA-Adapter微调、预训练等特性，支持 Llama2、Mistral 和 Mixtral 等
No 8. 斯坦福《Transformers United》课程2023年秋季第3版，探讨Transformer的工作原理和在各个领域的应用，特别是在语言模型方面，采用讲座、嘉宾讲座和课堂讨论结合的方式授课
No 9. '独立开发者出海之路' GitHub: github.com/hua1995116/indiehackers-steps ......
No 10. GPT-InvestAR：通过使用大型语言模型分析年度报告来增强股票投资策略
No 11. Deita：旨在为大型语言模型(LLM)的指令微调提供自动数据选择工具和高质量的对齐数据集，Deita模型能通过比其他SOTA LLM少10倍的指令微调数据进行训练，达到与它们相媲美的性能
No 12. 2023最受欢迎的Chrome扩展，大多和AI相关
No 13. Google DeepMind的2023AI与计算进展总结
No 14. [CL]《Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4》
No 15. TokenCost：用于计算大型语言模型(LLM)API的Token使用成本，可以准确计算提示Token的数量，并提供使用提示和完成的估计成本，还可以跟踪LLM价格的变化
No 16. [CV] Gemini vs GPT-4V: A Preliminary Comparison and Combination ......
No 17. microchain：基于函数调用的LLM智能体的开源项目，特色是简洁高效
No 18. 用llama-index实现基于Gemini Pro Vision的半结构化检索
No 19. 在某头部闭源大模型输出中看到了「州际艺术」，愣了半秒后笑翻了 [笑cry]
No 20. CUDA MODE Resource Stream：CUDA相关新闻和资料链接的资源库
No 21. 精选AI热门工具列表，包括文本、图像、音频、视频等多个领域
No 22. [LG]《Learning Rich Rankings》
No 23. notux-8x7b-v1：从Mixtral-8x7B-Instruct-v0.1通过DPO微调而来的预训练的稀疏专家混合生成模型，，目前在Hugging Face Open LLM Leaderboard上排名第一
No 24. 今日推介(第1267期)：少样本设置下的分布外检测和分类、装配任务的关键几何特征长度学习、富排名学习、向LLaMA-1/2, ......
No 25. PrivateLoRA：面向大众的生成式AI私有化方案，通过将涉及隐私的计算从云上剥离到个人终端，提供隐私保护和深度个人化
No 26. [LG]《HyperMix: Out-of-Distribution Detection and Classification in Few-Shot Settings》
No 27. EricLLM：快速批处理API，用于提供LLM模型的服务
No 28. [LG] 《Genetic algorithms are strong baselines for molecule generation》
No 29. 2023年AI领域的重要事件和进展
No 30. 提示工程课程(中文)
No 31. 早！[太阳]
No 32. rem：在Apple Silicon上记录并能够搜索所浏览的所有内容的项目，可以自动截取屏幕截图，创建时间轴，可以回顾过去的浏览记录、搜索历史记录、复制文本以及获取最近浏览内容的提示，以便与其他应用交互
No 33. [LG] Towards Efficient Generative Large Language Model Serving: ......
No 34. 发现遗传算法在分子生成任务中表现优秀，超过许多复杂的深度学习方法，提出GA标准，呼吁研究人员重新评估分子生成领域的研究重点。
No 35. 把www.arxiv.org改成www.talk2arxiv.org可直接针对论文内容进行问答（需要自备OpenAI key）
No 36. Time to code [坏笑]
No 37. [CV] UniRef++: Segment Every Reference Object in Spatial and ......
No 38. 新手LLM训练详细指南
No 39. 提示工程速查(思维导图)
No 40. [CV]《Towards Learning Geometric Eigen-Lengths Crucial for Fitting Tasks》
No 41. [LG] Pangu-Agent: A Fine-Tunable Generalist Agent with Structured ......
No 42. 通过提出一系列指导原则，简化大型语言模型查询和提示的过程，以增强用户对不同规模的大型语言模型在不同提示下的行为的理解和能力。//[CL]《Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4》
No 43. 晚安～ [月亮]
No 44. DataTamer：时间序列日志记录的C++库，支持多通道记录和自定义类型注册，具有低延迟和低序列化开销等特点
No 45. AI Video Search Engine (AVSE)：使用最新的AI工具驱动的视频搜索引擎，利用视频转录和向量搜索技术，让用户能根据问题快速找到相关的视频片段，该项目使用了Supbase、Hasura、Fly、JigsawStack和Vercel等技术构建，具有高效、可扩展和易用的特点
No 46. 'YAYI 2 - 中科闻歌研发的新一代开源大语言模型，采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。(Repo ......
No 47. 大型语言模型(LLM)加速全面指南
No 48. 数据如何影响大语言模型的上下文规模扩展
No 49. 创建更好的对话界面
No 50. llamafile：单文件LLM

爱可可微博热门分享(1.8)

No 1. 近年来AI发展里程碑论文集锦： - Transformers: Attention is All You Need 提出了Transformer模型，完全基于注意力机制，摒弃了以往模型依赖的递归和卷积结构，为自然语言处理领域带来了革命性的影响，并极大地提高了机器翻译任务的效率和准确性。 ......
No 2. 自始至终就我一人儿 [笑cry] 评论少可能因为都是技术内容太严肃了，欢迎大家多提好建议～ //@非洲鸡亲爱精诚:爱可可背后是什么大佬在运营？才发现有八十多万关注，每天信息量大到惊人，但大部分内容都没评论没互动[笑cry]
No 3. Docker Crash Course：关于Docker的完整教程，包含了使用不同技术栈构建的各种应用的Docker化实例，涵盖了Docker的基础知识、镜像和容器的管理、最新的Docker特性等内容。通过这个项目，可以学习到如何将应用容器化，并掌握Docker在不同场景下的使用方法和最佳实践
No 4. 今天才看到 @拍火车的石头和 @之宇萌两位网友给我的”巨额'打赏，真是受宠若惊！[笑cry] 对这两位网友的鼓励，由衷地表示感谢！大家多多转发、评论、点赞就好了，也欢迎多给我提些关于内容方面的好建议。你们的支持，就是给我最大的鼓励！谢谢大家！ ......
No 5. 机器学习论文成果发布工具包(开源指南)
No 6. GPT-Analyst：专门用于GPT分析和逆向工程的项目，提供了一系列资源，包括保护GPT提示和防止指令泄露和盗版的综合指南，以及GPT-Analyst工具，用于详细分析系统提示和GPT指令，可以使用不同的命令进行安全分析、操作分析、越狱分析等
No 7. '语音识别转文字工具 - Voice Recognition to Text Tool / 一个离线运行的本地语音识别转文字服务，输出json、srt字幕带时间戳、纯文字格式' ......
No 8. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 9. KAIST课程《3D数据机器学习》，内容涵盖了深度学习在处理和分析3D数据方面的最新进展，包括计算机视觉、计算机图形学和机器人领域的应用
No 10. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 11. LiteLlama-460M-1T：4.6 亿参数的“小规模”LLaMa 2开源复现，使用RedPajama数据集的1T Token进行训练，旨在提供原始模型的更易用版本，有助于开发更高效、可扩展的语言模型
No 12. 过去50年来最重要的统计学**：反事实因果推断、bootstrapping和基于模拟的推断、过参数化模型和正则化、贝叶斯多层模型、通用计算算法、自适应决策分析、鲁棒推断和探索性数据分析。这些**在统计学和数据科学领域的研究中起到了重要的推动作用
No 13. [CV]《LLaVA-ϕ: Efficient Multi-Modal Assistant with Small Language Model》
No 14. 完全免费的脚本，根据简历和职位描述，用ChatGPT自动生成求职信，发给企业招聘主管们
No 15. ChatGPT Web Midjourney Proxy：具有中文界面的ChatGPT Web项目，支持midjourney、GPT Store、tts和whisper等功能，提供了自定义API key和base_url的选项
No 16. AI热门开源项目排行(51-60)51、StableLM简介：StableLM是Stability AI推出的语言模型，旨在提供高性能的自然语言处理功能。地址：github.com/Stability-AI/StableLM52、IF简介：开源的文本到图像模型，具有高度的照片真实感和语言理解能力。地址：github.com/deep-floyd/IF53、OpenFlamingo ......
No 17. 关于大型语言模型的实用课程，涵盖了技术、项目和企业解决方案，课程以实践为导向，通过使用OpenAI和Hugging Face库的模型进行实际操作来提供实践经验。课程分为三个主要部分：技术与库、项目和企业解决方案。课程提供了丰富的笔记本和文章，供学习者参考
No 18. 几篇论文实现代码
No 19. Foxtrot：全能的Bevy 3D游戏模板，提供了各种功能和工具，包括角色控制、物理引擎、音频、寻路、对话系统等，可用于快速开发3D游戏
No 20. Hugging Face工具合集，收集了很多关于Hugging Face工具的资源
No 21. 理解Mixtral-8x7b
No 22. 《‌⁢‍⁡⁢⁤‍⁣⁢⁣‍⁡‍⁤‍⁣⁤⁣‌涓海录AIGC学习文档 - 飞书云文档》
No 23. ‘国内用户 HuggingFace 高速下载 - 利用HuggingFace的官方下载工具从镜像网站进行高速下载' ......
No 24. autotranslate：用Faster Whisper和ChatGPT实现视频的转录和翻译，支持多平台和本地视频文件，可用于支持的网站(如YouTube、Twitter、Bilibili等)
No 25. 面向未来的AI技术生态系统：图1：AI中心化技术生态系统的总体架构，包括从底层的数据中心/硬件/电力资源到最终用户之间的各个层次。在该结构中，AI模型处于核心地位，由云平台支持，由AI开发者工具创建，并通过AI应用为最终用户提供服务。这反映了AI技术的渗透和其对整个技术栈的影响。 ......
No 26. [LG] Disentangled Continual Learning: Separating Memory Edits ......
No 27. 生成式AI的形象剽窃问题
No 28. 'ChatGPT-Plus - AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 ChatGPT, ......
No 29. 检索增强生成(RAG)进阶技巧速查
No 30. [LG]《How to guess a gradient》
No 31. 使用大型语言模型进行生成式信息抽取(IE)的论文集合，涵盖了命名实体识别、关系抽取、事件抽取等多个信息抽取任务，介绍了学习范式、特定领域、数据增强、评估分析等方面的内容
No 32. Augmentoolkit：用于生成多轮对话训练数据的开源工具包，通过配置提示和设置，轻松生成符合特定口味和兴趣的对话。不用OpenAI API，避免了高昂费用和API密钥被撤销的风险
No 33. figure.ai的Figure-01机器人，可通过观察人使用咖啡机的视频端到端学习如何冲咖啡，还会自我纠正操作中的错误 🤖
No 34. [CL]《LLaMA Beyond English: An Empirical Study on Language Capability Transfer》
No 35. calm：使用C语言加速的语言模型推理项目，旨在实现单个GPU单批次的硬件利用最大化，具有最小的实现和依赖
No 36. Talk2Arxiv：使用ChatGPT让您能与任何ArXiv论文进行对话，利用RAG(检索增强生成)系统，通过解析PDF、文本嵌入和上下文相关性等技术，提供了一个交互式的聊天界面，让您能与论文进行对话和交流
No 37. [CL] Understanding LLMs: A Comprehensive Overview from Training ......
No 38. 晚安～ [月亮]
No 39. 关于图少样本学习/图元学习算法相关论文资源列表
No 40. 早！[太阳]
No 41. 研究在不计算损失函数的情况下，如何通过推测梯度来优化神经网络，发现梯度具有可预测的低维结构，所提出的方法可以显著改进无梯度优化方法的性能。//[LG]《How to guess a gradient》
No 42. 图解AI开放状况(数据来源：Coatue)：从模型代码、模型权重、训练数据、模型评估、架构决策和商业许可的开放性等方面，对比了主流的AI模型——GPT-2、GPT-3、GPT-4、LaMA(来自Meta)、LaMA-2和Mistral-7B的开放程度。 ......
No 43. AI热门开源项目排行(41-50) 41、Open-Assistant 简介：聊天式助手项目，能理解任务，与第三方系统互动，并动态检索信息。 ......
No 44. llama-cpp-agent Framework：与大型语言模型(LLM)进行交互的工具，提供了一个简单而强大的界面，允许用户与LLM模型聊天、执行结构化函数调用并获得结构化输出
No 45. OpenSPG：基于SPG(Semantic-enhanced Programmable Graph)框架开发的知识图谱引擎，为领域图谱构建提供了明确的语义表示、逻辑规则定义、算子框架( 构建、推理)等能力，支持各厂商可插拔的适配基础引擎、算法服务，构建自定义的解决方案
No 46. [LG] Dataset Difficulty and the Role of Inductive Bias 网页链接研究了数据集困难度和归纳偏差的作用。通过比较不同得分公式在多次训练运行和模型架构上的排名一致性，发现得分具有噪声性质、与困难度相关，并揭示了对某些模型架构的归纳偏差非常敏感的例子。提出一种基于少数敏感 ......
No 47. [CV] Tracking with Human-Intent Reasoning 提出一种新的追踪任务——指令追踪，通过提供隐式的追踪指令，要求追踪器在视频帧中自动执行追踪。为了实现这一目标，使用了一个大型视觉-语言模型(LVLM)来理解追踪指令并将目标跟踪线索转化为嵌入向量。通过嵌入向量，感知组件生 ......
No 48. 介绍了一种利用小型语言模型Phi-2实现多模态对话的方法，通过高质量的训练数据和两阶段训练流程，实现了出色的性能表现，并在时间敏感的环境中展示了资源效率的优势。//[CV]《LLaVA-ϕ: Efficient Multi-Modal Assistant with Small Language Model》
No 49. [CV] One-dimensional Adapter to Rule Them All: Concepts, Diffusion ......
No 50. 肖像大师：肖像生成项目，提供了中文版的ComfyUI肖像生成器。可以通过选择不同的参数来生成符合要求的肖像

爱可可微博热门分享(1.1)

No 1. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 2. 2023年终大放送之 TOP50总榜：No. 1 “ChatGPT指令生成器” 微博正文No. 2 你一直想知道的关于数学的一切 ......
No 3. AI热门开源项目排行(1-10)1、Stanford Alpaca简介：提供了用于训练斯坦福大学Alpaca模型的代码和文档，以及生成相关数据。Alpaca模型是一种大型语言模型，专注于提供更高效的文本生成和处理能力。项目旨在促进语言模型的研究与开发。地址：github.com/tatsu-lab/stanford_alpaca2、llama.cpp简 ......
No 4. 2024年，用一句话跟拖延“断交”——Just do it! 三个理解的层次： - 清楚区分“必须做”的事和“可有可无”的事，越晚做“必须做”的事，损失往往越大； ......
No 5. 2023年终大放送之 TOP30论文榜：No. 1 [LG]《Graph Representation Learning via Aggregation Enhancement》
No 6. PyTorch的定制C++和CUDA 扩展
No 7. 2023年10篇值得关注的AI论文
No 8. 2023年大语言模型(LLM)各领域精彩提示语(prompt)合集
No 9. 2023回顾之TOP50开源榜
No 10. 大语言模型视觉理解相关论文资源列表
No 11. #免费##抽奖# 携手@博文视点Broadview 送出5本《马同学图解微积分（上）》
No 12. TinyLlama-1.1B-Chat-v1.0：基于1.1B参数的小型Llama聊天模型，可用于进行对话和交流，在UltraChat数据集上进行微调，该数据集包含由ChatGPT生成的各种对话
No 13. 2024爱老师送给大家的第一份礼物，独家梳理的开源项目排行，会持续更新，特色：项目新、更新快、覆盖广、排序不单纯取决于Star数，希望你喜欢，欢迎转发～//AI热门开源项目排行(1-10)1、Stanford ......
No 14. [CL]《Supervised Knowledge Makes Large Language Models Better In-context Learners》
No 15. 早！[太阳]
No 16. Examples for crewAI：使用crewAI框架自动化流程的示例，包括旅行规划、股票分析和页面生成等，旨在促进角色扮演AI智能体之间的协作，通过使用这些示例，可以了解如何在crewAI框架中实现自动化流程
No 17. 之前总看到有人说已经用Perplexity AI替代Google当作主力搜索引擎，一直心痒有点犹豫要不要冲，今天偶尔看到有个假日优惠马上截止了，折扣代码“HOLIDAYS23”，月付可以免费用一个月，年付可以免费用两个月，力度还是不错的，赶在活动截止前充了一年 ......
No 18. [LG]《Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback》
No 19. [CL] Dissecting the Runtime Performance of the Training, Fine-tuning, ......
No 20. Semantic Router：用于LLM(语言模型)和Agent的超快的决策层，利用语义向量空间的能力来做出决策，通过语义意义来路由请求，支持定义不同的决策对象，并使用相应的编码器模型进行语义决策
No 21. 'ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 chatGPT' yzfly GitHub: github.com/yzfly/awesome-chatgpt-zh ......
No 22. AI与自我认知测试
No 23. Fine-tune Phi-2：对Phi-2模型进行微调的代码实例，包括使用QLoRA进行微调、创建合成对话数据集和使用多个GPU进行训练等
No 24. 2023回顾之TOP30论文榜
No 25. #免费##抽奖# 携手@博文视点Broadview 送出5本《LangChain入门指南：构建高可复用、可扩展的LLM应用程序》
No 26. Convert any Corpus of Text into a Graph of Knowledge：将任意文本转换为知识图谱，可用于图增强生成或基于知识图谱的问答。特色：将文本转换为图表示，可视化并进行查询
No 27. Jan：ChatGPT开源替代，100%离线运行，支持多种硬件架构，包括Nvidia GPU、Apple M系列、Apple Intel、Linux Debian和Windows x64
No 28. 2023回顾之TOP50总榜
No 29. RAG进阶图解
No 30. 免费书稿：《深度学习数学工程》
No 31. Emacs Copilot：为Emacs提供大型语言模型代码补全的项目，使用本地运行的LLM生成代码补全，支持快速输入代码，具有优秀的质量和自由度，能根据文件扩展名确定编程语言，适用于各种编程语言
No 32. relplot: 用于测量校准和绘制可靠性图表的工具包，提供了可视化方法来评估模型的校准程度，并生成可靠性图表以帮助分析模型的可靠性
No 33. 因果机器学习综述
No 34. HF-Torrent：实验性的基于Torrent种子的Hugging Face上托管模型权重的下载方法
No 35. [CV] Prompt Expansion for Adaptive Text-to-Image Generation ......
No 36. 关于旨在替代Transformer/注意力机制的状态空间模型(SSM)的论文和研究列表
No 37. [CL] Reasons to Reject? Aligning Language Models with Judgments ......
No 38. [CL]《Exploiting Novel GPT-4 APIs》
No 39. [CV] LangSplat: 3D Language Gaussian Splatting 介绍了一种名为LangSplat的方法，用于构建支持在3D空间中进行开放式语言查询的3D语言场。与现有方法不同，LangSplat利用从CLIP中提取的语言特征，通过一种基于tile的splatting技术来渲染语言特征，从而避免了NeRF中固有的昂 ......
No 40. Leonardo.Ai最新推出的Realtime Gen实时图片生成，可实时调整画风
No 41. '独立开发者出海之路' GitHub: github.com/hua1995116/indiehackers-steps ......
No 42. [AR] Gemini: Mapping and Architecture Co-exploration for Large-scale ......
No 43. CNN Explainer：交互式卷积神经网络(CNN)可视化解释器
No 44. ollama-voice-mac：Mac上完全离线的语音助手，使用Mistral 7b和Whisper语音识别模型
No 45. fastui-chat：用纯Python编写的简洁易用轻量的聊天机器人界面，提供了基本的聊天处理器和聊天消息历史记录功能
No 46. 新书《机器学习面试指南》
No 47. 使用Langchain表达式语言和GPT4-Vision的多模态 RAG
No 48. 提出一种通过将任务特定微调语言模型的输出嵌入大语言模型的提示中，从而增强其上下文学习能力的方法，提高了模型的泛化性和准确性。//[CL]《Supervised Knowledge Makes Large Language Models Better In-context Learners》
No 49. '颈椎病腰突康复指南，为程序员群体提供简单可靠的康复指南' AnsonZnl GitHub: github.com/AnsonZnl/RehabilitationGuide ......
No 50. 'KS的日语学习工具 v0.2 - 简易日语学习 / 视觉小说阅读辅助工具，特色包括句子分析、游戏文本提取和谷歌翻译等功能’ ......

爱可可微博热门分享(1.22)

No 1. OpenGFW：Linux 上灵活、易用、开源的 GFW 实现，并且在许多方面比真正的 GFW 更强大，可以部署在家用路由器上的网络主权，使用场景包括广告拦截、家长控制、恶意软件防护、VPN/代理服务滥用防护、流量分析 (纯日志模式)等
No 2. 一键部署开源AI项目列表
No 3. 开源人工智能：挑战闭源巨头的新兴力量
No 4. RAGxplorer：一个交互式工具，用于在嵌入空间中可视化文档块，旨在诊断和探索Retriever-Answer Generator(RAG)模型的应用。该工具允许用户上传文档，将其转换为适用于RAG应用的块格式，并在嵌入空间中可视化这些块
No 5. 'TCM-Ancient-Books - 中医药古籍文本，近700项' GitHub: github.com/xiaopangxia/TCM-Ancient-Books ......
No 6. Orion-14B 系列模型，具有140亿参数的多语种大模型，在一个包含2.5万亿token的多样化数据集上进行了训练，涵盖中文、英语、日语、韩语等多种语言，包括一系列相关的衍生模型，包括对话模型，长文本模型，量化模型，RAG微调模型，Agent微调模型等
No 7. 科学领域预训练语言模型大列表，包括数学、物理、化学、生物学、医学、材料科学和地球科学等领域的模型，涵盖不同的参数规模，从小于100M到700B参数，以及不同的模态(如语言、视觉、分子、蛋白质、图表等)
No 8. #抽奖# #赠书# 携手@图灵新知 @图灵文化送出5本《智能文本处理实战》
No 9. “哄哄模拟器Web版 – 你的AI对象生气了，快哄哄TA - 哄哄模拟器基于AI技术，你需要使用语言技巧和沟通能力，在限定次数内让对方原谅你，这并不容易[笑而不语]” ......
No 10. 高效LLM和多模态基础模型相关论文资源列表，包括大型语言模型(LLM)、视觉Transformer(ViT)、扩散和LLM基础的多模态模型，它们如何在机器学习生命周期的各个阶段，从训练到部署
No 11. 关于ChatGPT的资源集合，包括了各种工具、文档、应用和使用案例
No 12. 向量数据库横向对比，包括Pinecone、Weaviate、Qdrant、Chroma、LanceDB、Milvus、Vespa、Vald、Postgres、Redis、ElasticSearch等
No 13. ’GenMedicalEval：医疗大语言模型综合评测框架，特点包括大规模综合性能评测、深入细分的多维度场景评估、创新性的开放式评估指标和自动化评估模型’ ......
No 14. OpenAI首席执行官Sam Altman筹集数十亿美元建立全球AI芯片工厂
No 15. 个人LLM智能体相关论文资源列表，个人LLM智能体的主要目的是协助终端用户，增强其能力，帮助他们更专注于有趣和重要的事务，这里列出了个人LLM智能体的关键能力、效率和安全性方面的主要内容，包括任务自动化、记忆功能、安全性和隐私等
No 16. 面向低级视觉的扩散模型相关论文资源列表，包括了各种扩散模型在低级别视觉任务中的应用，如自然图像恢复、超分辨率、修复、去雾、低光增强等。这些模型在不同领域，包括医学图像分析、遥感图像处理等方面都有应用
No 17. [CL] Large Language Models on Graphs: A Comprehensive Survey ......
No 18. LLM App Stack：LLM应用栈工具、项目和供应商列表，旨在更全面地覆盖每个类别中的所有可用选项，涵盖了数据管道、嵌入模型、向量数据库、沙盒、编排器、API / 插件、LLM缓存、日志/监视/评估、验证器、LLM API(专有)、LLM API(开源)、应用程序托管平台、云提供商、有见解的云项目列表等类别
No 19. Distributed Llama：旨在通过将工作负载分布和划分RAM使用来在弱设备上运行LLM(大型语言模型)或使强大设备更加强大，支持的LLM模型包括Llama 2 7B、Llama 2 13B和Llama 2 70B
No 20. 'ChatGPT Next Web LangChain - 一键拥有自己的 ChatGPT 网页服务(基于 langchain ......
No 21. GPT Core：用于创建和训练先进的大型语言模型(LLM)，着重强调了其快速性能，可以在仅20分钟消费级GeForce RTX™ 4090上将自定义的1.23亿参数LLM预训练到约3.5的验证损失
No 22. 《AI 研发提效研究：自己动手训练 LoRA》
No 23. [LG] Evolving Code with A Large Language Model 介绍了一种使用大型语言模型(LLM)演化代码的方法。与传统的遗传编程不同，LLM ......
No 24. LLM时代打击虚假信息相关论文资源列表，涵盖了LLM在虚假信息检测、干预、归因以及对抗LLM生成虚假信息等方面的研究
No 25. 今日推介(第1292期)：探索熵变化对学习系统的影响、将预训练基础模型组合成更大的多模态网络、基于AlphaCodium的程序代码生成、基于深度学习的快速生物成像时间超分辨率、深度神经网络中基本音乐检测器的自发涌现 ......
No 26. LLM的偏好微调和对齐
No 27. 资源高效LLM相关论文资源列表
No 28. [CL] Leveraging Large Language Models for NLG Evaluation: A ......
No 29. 早！[太阳]
No 30. 通过模拟大脑的音频信息处理方式，研究发现神经网络可以自发地产生对音乐的感知，揭示了音乐特征的起源和普遍性的可能机制。//[LG]《Spontaneous emergence of rudimentary music detectors in deep neural networks》
No 31. [LG]《NoisyNN: Exploring the Influence of Information Entropy Change in Learning Systems》
No 32. 'LunaTranslator - Galgame翻译工具，支持剪贴板、OCR、HOOK，支持40余种翻译引擎。Visual ......
No 33. 通过注入特定噪声，改变学习系统的信息熵，论文研究了噪声对深度学习模型的影响，提出了Noisy Neural Networks (NoisyNN)模型，并证明正噪声可以显著提升模型性能。//[LG]《NoisyNN: Exploring the Influence of Information Entropy Change in Learning Systems》
No 34. [LG]《Spontaneous emergence of rudimentary music detectors in deep neural networks》
No 35. 几篇论文实现代码
No 36. [LG]《GATS: Gather-Attend-Scatter》
No 37. 免费书稿：《向量检索基础》
No 38. GATS是一种新模块，通过无缝整合预训练的基础模型，可以实现多模态信息处理和生成，并避免微调过程中的知识丢失。//[LG]《GATS: Gather-Attend-Scatter》
No 39. [CV] DiffusionGPT: LLM-Driven Text-to-Image Generation System ......
No 40. 免费书稿：《概率和统计学导论：随机性的计算框架》，...
No 41. [CL] The What, Why, and How of Context Length Extension Techniques ......
No 42. [LG]《Code Generation with AlphaCodium: From Prompt Engineering to Flow Engineering》
No 43. Even Flow: 旨在创建自组织Python函数的框架，允许程序员定义一系列具有清晰定义的输入和单一输出的函数，然后'Evenflow'会自动将这些函数组合成另一个flowable函数
No 44. 理解和编写LLM中的自注意力、多头注意力、交叉注意力和因果注意力
No 45. WhisperBot：整合了Mistral大型语言模型的实时语音转文本系统，基于WhisperLive和WhisperSpeech，WhisperLive使用OpenAI Whisper作为强大的自动语音识别系统，Mistral和Whisper都经过TensorRT引擎优化，以实现高性能和低延迟处理
No 46. Draw2Img：一个简单的Web用户界面，用于交互式文本引导的图像生成，适用于任何年龄和技能水平
No 47. datatrove：平台无关的数据处理开源工具
No 48. Docker超级速查清单
No 49. 提出一种名为AlphaCodium的测试驱动、多阶段、面向程序代码的迭代流程，通过迭代运行和修复生成的代码来提高语言模型在代码问题上的性能，显著改进了传统自然语言生成技术在代码生成问题上的表现。
No 50. Chinese-Mixtral-8x7B：中文Mixtral-8x7B，基于Mistral发布的模型Mixtral-8x7B进行了中文扩词表增量预训练

爱可可微博热门分享(1.6)

No 1. 过去50年来最重要的统计学**：反事实因果推断、bootstrapping和基于模拟的推断、过参数化模型和正则化、贝叶斯多层模型、通用计算算法、自适应决策分析、鲁棒推断和探索性数据分析。这些**在统计学和数据科学领域的研究中起到了重要的推动作用
No 2. 'ChatGPT-Plus - AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 ChatGPT, ......
No 3. 这个系列到今天也发布超过1000期了，这个朴实无华的系列，是每天刷GitHub的副产品，没什么特别的爬虫技术，纯粹靠个人兴趣和休息时间堆出来的，前两天账号被GitHub封了两轮，感觉有点累了，打算就此打住，是朋友们热情的询问和鼓励，让我“重燃斗志”——有价值的工作，我会继续坚持，也请大家多多支持
No 4. ‘国内用户 HuggingFace 高速下载 - 利用HuggingFace的官方下载工具从镜像网站进行高速下载' ......
No 5. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 6. 理解Mixtral-8x7b
No 7. 肖像大师：肖像生成项目，提供了中文版的ComfyUI肖像生成器。可以通过选择不同的参数来生成符合要求的肖像
No 8. 使用大型语言模型进行生成式信息抽取(IE)的论文集合，涵盖了命名实体识别、关系抽取、事件抽取等多个信息抽取任务，介绍了学习范式、特定领域、数据增强、评估分析等方面的内容
No 9. AI热门开源项目排行(41-50) 41、Open-Assistant 简介：聊天式助手项目，能理解任务，与第三方系统互动，并动态检索信息。 ......
No 10. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 11. Talk2Arxiv：使用ChatGPT让您能与任何ArXiv论文进行对话，利用RAG(检索增强生成)系统，通过解析PDF、文本嵌入和上下文相关性等技术，提供了一个交互式的聊天界面，让您能与论文进行对话和交流
No 12. [CL] TinyLlama: An Open-Source Small Language Model TinyLlama是一个开源的小型语言模型，尽管其规模相对较小，但在各种下游任务中表现出色。它使用约1万亿Token的大型数据集进行了约3个epoch的预训练。TinyLlama利用了开源社区的先进技术，实现了更好的计算效率。模型的 ......
No 13. [CL] Understanding LLMs: A Comprehensive Overview from Training ......
No 14. Transformer详解，通过简化的数学公式解释了Transformer模型的工作原理，以及注意力机制、残差连接和层归一化的解释
No 15. (Slides)面向编程和数学的基础模型
No 16. 被封两次的教训就是：该follow follow，没事少star [笑cry] //@爱可可-爱生活:这个系列到今天也发布超过1000期了，这个朴实无华的系列，是每天刷GitHub的副产品……本打算就此打住，是朋友们热情的询问和鼓励，让我“重燃斗志”——有价值的工作，我会继续坚持，也请大家多多支持～
No 17. QAnything (Question and Answer based on Anything)：致力于支持任意格式文件或数据库的本地知识库问答系统，可断网安装使用，使用两阶段检索进行问答，具有跨语种能力，支持多篇英文论文问答、信息抽取、网页问答等，可以通过安装和使用它来实现自己的问答系统
No 18. AI热门开源项目排行(51-60)51、StableLM简介：StableLM是Stability AI推出的语言模型，旨在提供高性能的自然语言处理功能。地址：github.com/Stability-AI/StableLM52、IF简介：开源的文本到图像模型，具有高度的照片真实感和语言理解能力。地址：github.com/deep-floyd/IF53、OpenFlamingo ......
No 19. 机器学习可解释性详解
No 20. 几篇论文实现代码
No 21. copilot-gpt4-service：将Github Copilot请求转换为ChatGPT请求，免费使用GPT-4模型
No 22. LZAV - Fast Data Compression Algorithm (in C/C++)：快速内存数据压缩算法，具有高压缩速度(460+MB/s)和高解压速度(2500+MB/s)，压缩比优于LZ4、Snappy和LZF
No 23. AI热门开源项目排行(1-10)1、Stanford Alpaca简介：提供了用于训练斯坦福大学Alpaca模型的代码和文档，以及生成相关数据。Alpaca模型是一种大型语言模型，专注于提供更高效的文本生成和处理能力。项目旨在促进语言模型的研究与开发。地址：github.com/tatsu-lab/stanford_alpaca2、llama.cpp简 ......
No 24. AI热门开源项目排行(31-40)31、labml.ai Deep Learning Paper Implementations简介：提供了60多个深度学习论文的实现和教程，每篇论文都有详细的注释。涵盖内容包括原始Transformer、XL、Switch、Feedback、VIT等各种变体，优化算法如Adam、AdaBelief、Sophia等，以及GANs（包括CycleGAN、StyleGAN2 ......
No 25. [CL]《LLaMA Pro: Progressive LLaMA with Block Expansion》
No 26. Mobile ALOHA的最新视频，“全能型”家庭助手离我们越来越近了(目前是远程操控实现的)，能执行各种家务和日常任务。从洗衣服、吸尘器，到更复杂的如自动充电、咖啡机操作，甚至能和宠物互动。预计Mobile ......
No 27. 晚安～ [月亮]
No 28. AI热门开源项目排行(21-30)21、segment-anything简介：名为SegmentAnything ......
No 29. Point2CAD：从点云重建机械CAD模型，将语义分割与新的神经分析表面表示相结合
No 30. Newspaper4k: 新闻文章提取工具，可以从新闻网站中提取文章、标题和元数据
No 31. #免费##抽奖# 携手@博文视点Broadview 送出5本《马同学图解微积分（上）》
No 32. oranda：生成漂亮开发工具页面的静态网站生成器，为开发者提供了一个快速构建网站的解决方案，无需从头开始构建
No 33. 《Science》将采用AI工具检测复制和篡改图像
No 34. Whisper Dictation：快速、离线、注重隐私的、无需动手的语音输入项目，支持双向AI语音聊天、图片、语音控制，并在不到4 GiB的VRAM内运行
No 35. [CV] Point2CAD: Reverse Engineering CAD Models from 3D Point ......
No 36. Clipper：命令行的HTML到Markdown转换器和网络爬虫工具，可以用来从网页剪辑内容并将其转换为Markdown格式，非常适合个人归档或笔记记录
No 37. [CL] A Comprehensive Survey of Hallucination Mitigation Techniques ......
No 38. LLM AutoEval：在Google Colab上自动评估LLM的工具，可以简化LLM模型的评估过程，并提供自定义的评估参数和生成摘要的功能。该项目还包括了Nous和Open LLM两个基准套件，以及对GPU资源的选择和调整
No 39. [CL]《LLM Augmented LLMs: Expanding Capabilities through Composition》
No 40. PASD Magnify：基于像素感知Stable Diffusion的逼真图像超分辨率和个性化风格化
No 41. Banana-lyzer：开源AI智能体评估框架，用于Web任务
No 42. CursusDB：开源的内存分布式文档数据库，高实时性，支持并行搜索、高可用性、数据安全等特性
No 43. 关于鸟瞰视图感知的论文资源列表，包括3D目标检测、分割、在线地图和占据预测等
No 44. DiffSynth Studio：基于DiffSynth的Diffusion引擎，提供了一套重新构建的架构，包括文本编码器、UNet、VAE等，以提高计算性能，支持稳定扩散Stable Diffusion和Stable Diffusion XL架构，可以用于生成高分辨率图像、卡通渲染、文本到视频的转换和视频样式化等应用
No 45. pykoi: 用于改进大型语言模型(LLM)性能的Python库，提供了统一的界面，包括RLHF/RLAIF数据和反馈收集、强化学习和奖励模型的微调，以及LLM比较等功能，支持可共享的用户界面、模型比较和RLHF等
No 46. [CV]《FMGS: Foundation Model Embedded 3D Gaussian Splatting for Holistic 3D Scene Understanding》
No 47. 机器距离能“思考”还有多远？
No 48. 'Awesome-gptlike-shellsite - 深入探索精选的套壳站和必备API资源，为初学者和经验丰富的运营者提供一站式指南，涵盖常见问题解答和基础攻略' ......
No 49. 2023年终大放送之 TOP50总榜：No. 1 “ChatGPT指令生成器” 微博正文No. 2 你一直想知道的关于数学的一切 ......
No 50. 提出一种后预训练方法叫做'Block Expansion'，通过扩展Transformer块来注入领域特定的知识，提高大型语言模型在通用和特定任务上的综合性能。//[CL]《LLaMA Pro: Progressive LLaMA with Block Expansion》

爱可可微博热门分享(12.24)

No 1. 大型语言模型(LLM)加速全面指南
No 2. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 3. Roadmap To Learn Generative AI In 2024：学习生成式AI学习路线图，包括学习Python编程、基本机器学习和自然语言处理、深度学习、高级NLP概念以及生成式AI入门等内容，还提供了相关的向量数据库和存储以及LLM项目的部署方法
No 4. ReByte：AI应用全流程开发平台，通过绘制和描述来创建Web应用和聊天应用
No 5. Infinity：AI原生数据库，为LLM应用提供了极快的向量和全文搜索能力，具有高性能、灵活性和易用性等特点，能满足下一代AI应用的挑战
No 6. [CV] TinySAM: Pushing the Envelope for Efficient Segment Anything ......
No 7. RAG-Survey：大型语言模型检索增强生成(RAG)相关文献资源列表
No 8. 把www.arxiv.org改成www.talk2arxiv.org可直接针对论文内容进行问答（需要自备OpenAI key）
No 9. [LG]《Bayesian Transfer Learning》
No 10. AI-Employe：基于GPT-4 Vision的可靠浏览器自动化工具，以教授人类的方式进行操作，是目前最可靠的AI首选自动化工具
No 11. [CV] DREAM-Talk: Diffusion-based Realistic Emotional Audio-driven ......
No 12. LLM Distillation Playbook：关于如何有效蒸馏大型语言模型的最佳实践实用指南，提供了一系列的最佳实践，帮助工程师和机器学习从业者在生产应用中更高效地蒸馏和使用语言模型
No 13. 大型语言模型(LLM)可解释性相关资源列表
No 14. AI Video Search Engine (AVSE)：使用最新的AI工具驱动的视频搜索引擎，利用视频转录和向量搜索技术，让用户能根据问题快速找到相关的视频片段，该项目使用了Supbase、Hasura、Fly、JigsawStack和Vercel等技术构建，具有高效、可扩展和易用的特点
No 15. [CV] PolyDiff: Generating 3D Polygonal Meshes with Diffusion ......
No 16. 晚安～ [月亮]
No 17. RQABench: 开源检索问答基准工具，用于评估检索增强生成(RAG)系统，具有灵活性、可复现性和可追溯性等特点
No 18. 今日推介(第1263期)：贝叶斯迁移学习、面向实时交互式生成的管线级方案、手上操作的视-触觉感知、深度强化学习agent的时间编码、基于大语言模型的自主化学研究 ......
No 19. 新手LLM训练详细指南
No 20. TorchCP：基于PyTorch的深度学习模型的保形预测研究的Python工具箱，实现了一些代表性的分类和回归方法，基于AdverTorch构建
No 21. [CV] InstructVideo: Instructing Video Diffusion Models with ......
No 22. 早！[太阳]
No 23. [LG]《Temporal encoding in deep reinforcement learning agents》
No 24. [RO]《Neural feels with neural fields: Visuo-tactile perception for in-hand manipulation》
No 25. [LG]《Autonomous Chemical Research With Large Language Models》
No 26. Heynote：专为开发者设计的分块记事本，作为一个大型持久性文本缓冲区，可以用来随意书写任何内容。适用于不希望意外发送的Slack消息、API的JSON响应、会议记录、每日待办事项等等
No 27. Skylar Email Client：开源电子邮件客户端，旨在提供快速、安全和高度可定制的邮件体验，专注于简化邮件处理过程，解决常见问题，如配置GitHub邮件过滤器和查找退订按钮
No 28. 提出StreamDiffusion，一种用于实时交互式图像生成的流水线级解决方案，通过批处理去噪、残差无分类器引导和随机相似性过滤等方法，实现了高吞吐量和节能的图像生成。//[CV]《StreamDiffusion: A Pipeline-level Solution for Real-time Interactive Generation》
No 29. 通过结合视觉和触觉感知，在手操作过程中利用神经场模型准确估计物体的姿态和形状，并在视觉遮挡情况下取得了显著的改进。//[RO]《Neural feels with neural fields: Visuo-tactile perception for in-hand manipulation》
No 30. [CV]《StreamDiffusion: A Pipeline-level Solution for Real-time Interactive Generation》
No 31. 新书：《机器学习训练数据》
No 32. Otter：基于S3-FIFO算法的超快的内存缓存库，用Go语言实现，比Ristretto等其他库快几倍，具有简单的API、自动配置、泛型支持、TTL过期、基于成本的驱逐和出色的性能等特点
No 33. hf-mirror.com - Huggingface 镜像站
No 34. [LG] Inverse folding of protein complexes with a structure-informed ......
No 35. Whisper Turbo：跨平台GPU加速版Whisper，完全在客户端浏览器/electron应用里运行
No 36. 《Python Cookbook》(第三版) 中文版 (在线)
No 37. 展示了基于大型语言模型的智能化agent系统Coscientist，通过自主设计、规划和执行科学实验的能力，加速了化学研究。
No 38. 《大规模语言模型：从理论到实践》
No 39. JoyTag：开源图像标注模型，专注于积极性和包容性，使用了Danbooru标注方案，适用于从手绘到摄影等各种类型的图像。模型基于ViT-B/16架构，训练了660M个样本，具有5000+个标签。通过输入图像，可以输出对5000多个不同标签的预测结果
No 40. 突出强调了贝叶斯迁移学习方法在解决信息迁移问题上的潜力，提供了广泛的贝叶斯迁移学习视角，并提出一些能克服负迁移问题的方法。//[LG]《Bayesian Transfer Learning》
No 41. 创建通用AI爬虫
No 42. AgentSearch [ΨΦ]: 面向Agent的功能强大的搜索引擎，可以在本地运行或通过远程API连接，适用于大型语言模型(LLM)和人类用户，提供超过十亿个来自Creative Commons、Arxiv、维基百科和Project Gutenberg等多样化来源的高质量嵌入
No 43. Akuma.ai：画画手残党的福音(内测中)
No 44. LLM架构的未来
No 45. Texify：将数学公式图片转换为markdown/LaTeX格式，具有OCR功能，可以处理内联和块级数学公式
No 46. Google的2023年终总结
No 47. 新书：《用Python和JAX构建推荐系统：产品化系统大规模实战》
No 48. [CV] UniSDF: Unifying Neural Representations for High-Fidelity ......
No 49. [LG] A mathematical perspective on Transformers 提出一个分析Transformer的数学框架，并将其解释为相互作用的粒子系统。研究发现，在长时间内会出现聚类现象，这对于理解Transformer在学习任务中的机制具有重要意义。本文为数学家和计算机科学家提供了新的视角，将Transfo ......
No 50. 新书：《(从头开始)构建大型语言模型》

爱可可微博热门分享(1.29)

No 1. 向量数据库将走向哪里
No 2. Graphy：数据可视化工具，提供了一种简单的方式...
No 3. 《Paul Graham 2006-2023 精选文集（中英对照）》
No 4. MoE-LLaVA：多模态混合专家模型，在多模态学习中表现出卓越性能，具有相对较少的参数，但在各种视觉理解数据集中表现出与LLaVA-1.5-7B相媲美的性能，甚至在对象幻觉基准测试中超越了LLaVA-1.5-13B
No 5. C++ Standard Library and Qt, Python etc Implementation in C：旨在使用C编程语言重新实现C++标准库的功能，为C开发人员提供了常见于C++的工具和库，从而在保持C语言生态系统的同时，更好地管理数据结构、实现算法和使用功能
No 6. 用好ChatGPT的几个要点
No 7. AI工具集市
No 8. GPUPixel：使用C++11编写的高性能图像和视频AI美颜效果库
No 9. Noi：集成OpenAI等AI服务、工具、插件的智能前端
No 10. PolyMind：多模态、函数调用驱动的LLM w...
No 11. [CV] InstructDoc: A Dataset for Zero-Shot Generalization of ......
No 12. 社交媒体、人工智能与大脑争夺战
No 13. [LG] Zero Bubble Pipeline Parallelism 介绍了一种有效减少流水线并发训练中的流水线空闲时间(pipeline ......
No 14. ProChat：快速搭建大语言模型 Chat 对话的前端组件库，旨在赋予开发人员轻松打造丰富、动态和直观的聊天界面的能力
No 15. 用RAGatouille探索ColBERT
No 16. 几篇论文实现代码
No 17. TaskingAI：旨在将Firebase的简单性...
No 18. 科学传播的新时代：科学家应该成为“网红”
No 19. Splatapult：用于渲染3D gaussian splatting文件的程序
No 20. [CV] OMG-Seg: Is One Model Good Enough For All Segmentation? ......
No 21. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 22. 掌握Llama 2：Meta推出提示工程交互式指南
No 23. 晚安～ [月亮]
No 24. 'AAAMLP-CN - Approaching (Almost) Any Machine Learning Problem中译版' ......
No 25. ChatGPT Source Watch：ChatGPT的历史和演变追踪，目标是通过精选的存档和脚本分析ChatGPT代码库随时间的演变
No 26. text_blind_watermark：文本隐水印/盲水印：把信息隐匿到文本中
No 27. Easy-to-Use Apple Vision wrapper for text extraction and clustering：使用苹果提供的Vision框架等多种技术来实现光学字符识别(OCR)和文本提取
No 28. Search with Lepton：使用Lepton构建自己的会话式搜索引擎，只需不到500行代码，具备内置的LLM(语言模型)支持、内置的搜索引擎支持和可定制的漂亮用户界面
No 29. OpenAI的转折点：ChatGPT的成功与未来的不确定性
No 30. 故事生成/叙事生成相关论文列表，主题包括大型语言模型、情节发展、更好的叙事、可控性、角色、写作风格、故事规划、评估、应用和数据集
No 31. 通过研究两层神经网络中的双降现象，探索了L1正则化和表示维度对模型性能的影响，提出了稀疏双降的概念，并揭示了神经网络训练和优化中的反直觉现象。//[LG]《Manipulating Sparse Double Descent》
No 32. makeMoE：从零开始实现稀疏混合专家语言模型
No 33. [CV]《Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild》
No 34. 免费书稿：《机器学习工程》，提供了一系列关于机器学习工程的深入内容，包括但不限于数据处理、模型训练、模型评估、模型部署等方面的知识，可以帮助读者更好地理解和掌握机器学习工程的各个方面，从而在实际工作中更有效地应用机器学习技术
No 35. Lumos：基于RAG(Retrieval-Augmented Generation)的大型语言模型(LLM)协作工具，用于浏览网络，由本地LLM驱动
No 36. Dendy：用Go编写的NES/Famicom游戏机模拟器
No 37. [LG]《Prompting Diverse Ideas: Increasing AI Idea Variance》
No 38. 《「我在淘天做技术」智能对话新纪元：百万日活对话机器人的LLM落地实践》
No 39. 今日推介(第1299期)：提升LLM生成创意的多样性、面向大型语言模型的局部性增强Serverless推理、稀疏双降探索、重新审视掩码自编码器块依赖、面向现实场景照片级逼真影像复原的模型扩展 ......
No 40. imp：旨在提供一系列强大的多模态小型语言模型(M...
No 41. 通过研究不同提示方法对AI生成创意多样性的影响，发现CoT提示方法能够显著增加创意多样性，突破了AI生成创意过于相似的问题，为提升创新和创意质量提供了新的思路。//[LG]《Prompting Diverse Ideas: Increasing AI Idea Variance》
No 42. [CV]《Rethinking Patch Dependence for Masked Autoencoders》
No 43. Obsidian Latex Suite：Obsidian插件，旨在通过快捷方式和文本扩展使LaTeX数学排版与手写一样快速
No 44. HIPIFY：一组工具，可以将CUDA源代码自动翻译成可移植的HIP C++
No 45. [LG]《Manipulating Sparse Double Descent》
No 46. 提出ServerlessLLM，一种增强局部性的Serverless推理系统，通过快速的LLM检查点加载和局部驱动的服务器分配，显著提高了推理性能。//[CL]《ServerlessLLM: Locality-Enhanced Serverless Inference for Large Language Models》
No 47. [CL]《ServerlessLLM: Locality-Enhanced Serverless Inference for Large Language Models》
No 48. 早！[太阳]
No 49. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 50. [RO] Adaptive Mobile Manipulation for Articulated Objects ......

爱可可微博热门分享(1.31)

No 1. Hugging Face Datasets(huggingface.co/datasets)上共享数据集规模突破十万，涵盖了艺术、医学、生物学、法律、金融、音乐、化学、气候等多个领域，可以通过简单的搜索和过滤功能找到所需的数据集，可以按任务、大小、子任务、语言、许可证等进行分类和过滤 ......
No 2. 用Langchain, ColBERT, Ragatouille 和 ChromaDB构建高级 RAG 系统，有效地提取 Mixtral 8x7B 生成高质量答案所需的所有相关上下文
No 3. 高质量的GPU编程/架构资源
No 4. 史料RAG：用向量数据库基于RAG(检索增强生成)方式搭建一个**历史问答应用，接受用户的询问，从历史语料库中检索相关的历史资料片段，利用大语言模型给出较为可靠的回答
No 5. Phantom：通用且自动化的图像增强和超分辨率框架，可用于各种场景和质量的图像，用户只需上传一张低质量的图片，即可一键生成一张经过增强的图片，无需选择 SR 模型或调整参数
No 6. Code Llama 70B在线体验，Code Llama 70B由Meta推出的最新AI编程模型，标志着AI辅助代码生成领域的重大升级，用于处理更复杂的编程任务，具有更高的准确性和效率
No 7. 自主Agent(LLM)相关论文列表
No 8. 用Proxy-Tuning改进语言模型
No 9. PyrateLimiter：使用漏桶算法的请求限速器
No 10. AI-视频裁剪器是一个功能强大的工具，旨在通过对视频进行智能分析，提取最吸引人的片段并裁剪它们来帮助内容创作者、播客爱好者和视频爱好者轻松地从视频中提取引人入胜的部分，该工具利用先进的语言模型 GPT-4，能够智能地分析视频文字记录，识别最受欢迎和最激动人心的时刻
No 11. Inference-Time Training: 用于长文本生成任务的推理时训练方法，与传统方法不同，它不再依赖 KV 缓存来存储所有上下文信息，而是将这些信息直接嵌入到模型参数中
No 12. LLMs in Five Formulas：关于LLM的直觉教程
No 13. [CV]《MoE-LLaVA: Mixture of Experts for Large Vision-Language Models》
No 14. FinSight：专为投资组合经理、投资者和金融爱好者设计的尖端 AI 助手，利用 GPT-4 和财务数据，FinSight 提供关于公司的深入见解和可操作的总结，帮助做出更明智的投资决策。FinSight 可以帮助用户深入了解从损益表、资产负债表和现金流量表中提取的核心财务指标
No 15. 《⁡⁣⁢⁣⁡‍‌⁡⁣⁤⁢‌⁢⁤‍⁢⁣‌⁤⁣⁣⁣‌‌‍‌⁤⁣⁣⁢⁢互联网知识地图最全合集（2024 新版） - 飞书云文档》
No 16. [CL]《Scaling Sparse Fine-Tuning to Large Language Models》
No 17. 图归约(包括图粗化、图浓缩、图稀疏化、图摘要等)相关论文资源列表
No 18. WhisperKit：一个Swift开发包，它、将 OpenAI流行的Whisper语音识别模型与Apple的CoreML框架集成在一起，可在 Apple 设备上进行高效的本地推理，可通过Swift软件包管理器集成到 Swift 项目中
No 19. 早！[太阳]
No 20. 几篇论文实现代码
No 21. OpenAOE：基于 OpenAI 的聊天开源框架...
No 22. 今日推介(第1301期)：视觉专家混合路由器实证研究、大型视觉-语言模型的专家混合模型、计算和数据高效的语言建模方法、用迭代数据平滑减轻RLHF中的奖励过拟合和过度优化、将稀疏微调扩展到大型语言模型 ......
No 23. fabric：开放的AI生态系统，用人工智能增强人类能力
No 24. [CV] Divide and Conquer: Language Models can Plan and Self-Correct ......
No 25. Meta发布Code Llama 70B，用于代码生成的LLM的新的、性能更高的版本，与之前的 Code Llama ......
No 26. 机器学习/深度学习推荐书单，包括作者自己的一本书《...
No 27. 非母语者英语科研写作的7个技巧
No 28. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 29. [LG]《Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF》
No 30. [CV] Object-Driven One-Shot Fine-tuning of Text-to-Image ......
No 31. AutoMLOps：生成、配置和部署 CI/CD 集成 MLOps 管道的服务，它弥合了数据科学与 DevOps 之间的鸿沟。AutoMLOps 提供了一个可重复的过程，极大地减少了构建 MLOps 管道所需的时间
No 32. [CV] InternLM-XComposer2: Mastering Free-form Text-Image ......
No 33. [CV] Overcoming the Pitfalls of Vision-Language Model Finetuning ......
No 34. Gemini-OpenAI-Proxy：将 OpenAI API 协议转换成谷歌 Gemini Pro 协议，可以将 OpenAI 的功能无缝集成到使用 Gemini Pro 协议的应用中
No 35. Martian发布大模型推理成本排行榜：不同供应商的大模型服务成本存在5倍以上的差异，吞吐量差异超过6倍，API的选择对最终性能至关重要
No 36. 晚安～ [月亮]
No 37. SoniTranslate：视频同步翻译工具
No 38. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 39. 数据驱动无人驾驶相关资源大列表
No 40. 从零开始实现LoRA
No 41. ChaCha(儿童情感意识的聊天机器人)：一个利用大语言模型帮助儿童增强情感意识的聊天机器人。由韩国 Naver 人工智能实验室研发，旨在帮助儿童分享他们关于个人事件的情感，ChaCha 使用 GPT-3.5 和 GPT-4 模型来处理儿童的语言输入，并生成相关的提示和反馈
No 42. 免费书稿：《机器学习工程》，提供了一系列关于机器学习工程的深入内容，包括但不限于数据处理、模型训练、模型评估、模型部署等方面的知识，可以帮助读者更好地理解和掌握机器学习工程的各个方面，从而在实际工作中更有效地应用机器学习技术
No 43. [LG]《Learning Universal Predictors》
No 44. [LG] The Case for Co-Designing Model Architectures with Hardware ......
No 45. WhisperFusion：具有超低延迟无缝对话功能的AI系统，基于WhisperLive和WhisperSpeech的能力，集成了Mistral，一个大型语言模型(LLM)，在实时语音转文本管道上运行。LLM和Whisper都经过优化，以TensorRT引擎的形式高效运行，以实现高性能和实时处理能力
No 46. 《Paul Graham 2006-2023 精选文集（中英对照）》
No 47. [CV]《Routers in Vision Mixture of Experts: An Empirical Study》
No 48. 提出一种改进的奖励学习算法IDS，通过迭代数据平滑的方式解决了强化学习中的奖励过拟合和过度优化问题，取得了优异的性能。//[LG]《Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF》
No 49. Pipelight：自托管的轻量级CLI工具，用于创建微小的自动化流水线，可将CI/CD引入最小的项目，基于Rust，占用空间小(13Mb)并使用TypeScript、Toml和Yaml定义流水线
No 50. ProChat：快速搭建大语言模型 Chat 对话的前端组件库，旨在赋予开发人员轻松打造丰富、动态和直观的聊天界面的能力

爱可可微博热门分享(1.5)

No 1. Transformer详解，通过简化的数学公式解释了Transformer模型的工作原理，以及注意力机制、残差连接和层归一化的解释
No 2. 这个系列到今天也发布超过1000期了，这个朴实无华的系列，是每天刷GitHub的副产品，没什么特别的爬虫技术，纯粹靠个人兴趣和休息时间堆出来的，前两天账号被GitHub封了两轮，感觉有点累了，打算就此打住，是朋友们热情的询问和鼓励，让我“重燃斗志”——有价值的工作，我会继续坚持，也请大家多多支持
No 3. ‘国内用户 HuggingFace 高速下载 - 利用HuggingFace的官方下载工具从镜像网站进行高速下载' ......
No 4. 机器学习可解释性详解
No 5. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 6. AI热门开源项目排行(31-40)31、labml.ai Deep Learning Paper Implementations简介：提供了60多个深度学习论文的实现和教程，每篇论文都有详细的注释。涵盖内容包括原始Transformer、XL、Switch、Feedback、VIT等各种变体，优化算法如Adam、AdaBelief、Sophia等，以及GANs（包括CycleGAN、StyleGAN2 ......
No 7. Hook：图形化的C/C++运行时编辑器，可以用于快速实验，可以连接到正在运行的程序，并允许实时更改变量，避免了繁琐的编辑-编译-运行-编辑的循环，使用C++、CMake和Shell等语言开发
No 8. 被封两次的教训就是：该follow follow，没事少star [笑cry] //@爱可可-爱生活:这个系列到今天也发布超过1000期了，这个朴实无华的系列，是每天刷GitHub的副产品……本打算就此打住，是朋友们热情的询问和鼓励，让我“重燃斗志”——有价值的工作，我会继续坚持，也请大家多多支持～
No 9. 2024进度：░░░░░░░░░░░░░░░ 1%
No 10. vue0：根据提示自动生成Vue组件
No 11. Time-series machine learning at scale：在大规模数据集上进行时间序列机器学习的强大Python库
No 12. 用PyTorch实现Stable Diffusion XL (SDXL)三倍加速，介绍了使用纯粹的PyTorch进行加速的方法，使用了一系列优化技术，包括bfloat16精度、scaled_dot_product_attention（SDPA）、torch.compile等，以提高生成模型的速度
No 13. #免费##抽奖# 携手@博文视点Broadview 送出5本《LangChain入门指南：构建高可复用、可扩展的LLM应用程序》
No 14. 用PyTorch从头创建扩散模型的项目，旨在准确了解其工作原理，支持DDPM、DDIM和无分类器引导模型，以提高图像质量
No 15. AI热门开源项目排行(1-10)1、Stanford Alpaca简介：提供了用于训练斯坦福大学Alpaca模型的代码和文档，以及生成相关数据。Alpaca模型是一种大型语言模型，专注于提供更高效的文本生成和处理能力。项目旨在促进语言模型的研究与开发。地址：github.com/tatsu-lab/stanford_alpaca2、llama.cpp简 ......
No 16. AI热门开源项目排行(21-30)21、segment-anything简介：名为SegmentAnything ......
No 17. 几篇论文实现代码
No 18. Mobile ALOHA：低成本、开源、移动操纵机器人项目，支持快速移动、稳定操作重物、全身自由度远程遥控等，使用Tracer ......
No 19. 打造先进机器人的未来
No 20. QAnything (Question and Answer based on Anything)：致力于支持任意格式文件或数据库的本地知识库问答系统，可断网安装使用，使用两阶段检索进行问答，具有跨语种能力，支持多篇英文论文问答、信息抽取、网页问答等，可以通过安装和使用它来实现自己的问答系统
No 21. AI热门开源项目排行(41-50) 41、Open-Assistant 简介：聊天式助手项目，能理解任务，与第三方系统互动，并动态检索信息。 ......
No 22. #免费##抽奖# 携手@博文视点Broadview 送出5本《马同学图解微积分（上）》
No 23. 早！[太阳]
No 24. 'Panda中文开源大语言模型 - 开源的海外中文大语言模型项目，致力于探索大模型时代的技术栈，推动中文自然语言处理领域的创新和合作' ......
No 25. Ocrs：用Rust编写的现代OCR引擎，可以作为一个命令行工具和库来使用，目标是创建一个在各种图像上都能良好运行的OCR引擎，包括扫描文档、包含文本的照片和屏幕截图等，相比之前的引擎如Tesseract，需要更少的预处理工作
No 26. [LG]《Can AI Be as Creative as Humans?》
No 27. [CL] A Comprehensive Survey of Hallucination Mitigation Techniques ......
No 28. 故事生成相关论文列表，特别关注LLM时代的论文
No 29. fusilli：包含了一系列深度学习多模态数据融合方法管线的Python包，从数据加载、训练到评估，提供了一种有效地结合不同数据类型的平台，支持各种预测任务，如回归、二分类和多类分类，基于PyTorch Lightning和PyTorch Geometric构建
No 30. 使用peft库对chatGLM-6B/chatGLM2-6B模型实现4bit的QLoRA高效微调，并进行模型的合并和量化，提供了完整的训练流程、推理流程和推理性能测试
No 31. 2024 AI将如何发展？——来自七位斯坦福大学研究人员的预测
No 32. 用GPT Builder创建GPTs指南
No 33. 全栈深度学习课程，旨在让学员掌握最先进的技术，构建和部署大型语言模型(LLM)应用，课程内容包括提示(Prompt)工程、LLMOps、语言用户界面的用户体验设计、增强语言模型、一小时内快速启动LLM应用等
No 34. GPT-Migrate：帮助轻松地将代码从一个框架或语言迁移到另一个框架或语言，使用了GPT(生成式预训练模型)来辅助迁移和调试代码
No 35. Maestro：用Rust编写的类Unix内核，目标是提供一个轻量的操作系统，利用Rust语言的安全特性来保证可靠性。具有VGA文本模式终端、PS/2键盘支持、内存分配、进程调度、PCI设备枚举、文件系统等特性
No 36. LLM for food ordering：用于简化忙碌人群食品配送体验的应用，使用自主Agent来实现网站导航、信息获取和用户行为跟踪等功能，用户可以通过语音指令自主完成食品订单，并且能够通过语音回答用户的问题
No 37. 多伦多大学2024新课：AI对齐
No 38. BCEmbedding: 有道开发的双语和跨语种语义表征算法模型库，其中包含EmbeddingModel和RerankerModel两类基础模型——EmbeddingModel专门用于生成语义向量，在语义搜索和问答中起着关键作用，而RerankerModel擅长优化语义搜索结果和语义相关顺序精排
No 39. RAGatouille：简化使用最先进检索方法的库，将复杂的研究方法转化为易于使用的组件，让用户能够轻松地在RAG流程中集成ColBERT模型，提供了训练和微调ColBERT模型、嵌入和索引文档、检索文档等核心功能
No 40. LLMClient：用于构建RAG + 推理 + 函数调用代理 + LLM智能体 + 追踪 + 日志记录的简单库
No 41. 2023年终大放送之 TOP50总榜：No. 1 “ChatGPT指令生成器” 微博正文No. 2 你一直想知道的关于数学的一切 ......
No 42. 多模态LLM相关论文资源列表
No 43. aMUSEd：高效的文本-图片生成
No 44. [LG]《Theoretical guarantees on the best-of-n alignment policy》
No 45. 晚安～ [月亮]
No 46. autocaption：为视频增加漂亮的动态字幕
No 47. Gradio Box：扩展了官方Gradio的高级版本，支持在图像上绘制框，是为了在ROI上调整大型语言模型的指令而开发的
No 48. pykoi: 用于改进大型语言模型(LLM)性能的Python库，提供了统一的界面，包括RLHF/RLAIF数据和反馈收集、强化学习和奖励模型的微调，以及LLM比较等功能，支持可共享的用户界面、模型比较和RLHF等
No 49. 机器距离能“思考”还有多远？
No 50. LLM角色扮演/人物化相关论文列表

爱可可微博热门分享(12.27)

No 1. 'KS的日语学习工具 v0.2 - 简易日语学习 / 视觉小说阅读辅助工具，特色包括句子分析、游戏文本提取和谷歌翻译等功能’ ......
No 2. Time to code [坏笑]
No 3. 斯坦福《Transformers United》课程2023年秋季第3版，探讨Transformer的工作原理和在各个领域的应用，特别是在语言模型方面，采用讲座、嘉宾讲座和课堂讨论结合的方式授课
No 4. 在某头部闭源大模型输出中看到了「州际艺术」，愣了半秒后笑翻了 [笑cry]
No 5. PromptBench：用于评估和理解大型语言模型的统一评估框架，提供了用户友好的API，方便研究人员进行模型性能评估、提示工程和对抗提示攻击评估等
No 6. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 7. 用PEFT对Mistral 7B进行指令微调的方案指南
No 8. '独立开发者出海之路' GitHub: github.com/hua1995116/indiehackers-steps ......
No 9. GPT-InvestAR：通过使用大型语言模型分析年度报告来增强股票投资策略
No 10. 2023年AI领域的重要事件和进展
No 11. 精选AI热门工具列表，包括文本、图像、音频、视频等多个领域
No 12. Comflowy - ComfyUI 社区：致力于打造更优质的生产工具和构建开发者与用户内容社区，提供系统化的Stable Diffusion和ComfyUI教程，以及互动讨论的Discord社群
No 13. 对大模型来说，规模就是一切吗？
No 14. Aurora：中文版MoE模型，具有强大的自然语言处理能力，基于Mixtral-8x7B的进一步工作，激活了该模型在中文开放域的聊天能力
No 15. 数据如何影响大语言模型的上下文规模扩展
No 16. PrivateLoRA：面向大众的生成式AI私有化方案，通过将涉及隐私的计算从云上剥离到个人终端，提供隐私保护和深度个人化
No 17. 提示工程课程(中文)
No 18. 提示工程速查(思维导图)
No 19. microchain：基于函数调用的LLM智能体的开源项目，特色是简洁高效
No 20. [LG] Pangu-Agent: A Fine-Tunable Generalist Agent with Structured ......
No 21. 创建更好的对话界面
No 22. [LG]《Manifold Diffusion Fields》
No 23. [LG] Generative AI Beyond LLMs: System Implications of Multi-Modal ......
No 24. DataTamer：时间序列日志记录的C++库，支持多通道记录和自定义类型注册，具有低延迟和低序列化开销等特点
No 25. SillyTavern MultiPlayer (STMP)：多用户LLM聊天界面，允许多个用户之间以及与AI一起聊天
No 26. muse：用Google的Gemini Pro API创建合成教科书，可以生成大量的教科书数据，为开源模型的发展铺平道路
No 27. 'YAYI 2 - 中科闻歌研发的新一代开源大语言模型，采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。(Repo ......
No 28. [AS]《Multi-Source Diffusion Models for Simultaneous Music Generation and Separation》
No 29. llamafile：单文件LLM
No 30. 晚安～ [月亮]
No 31. 今日推介(第1266期)：大型语言模型是噪声鲁棒语音识别高效学习器、流形扩散场、面向音乐生成和音源分离的多源扩散模型、广泛且通用的增强指令微调与精细化数据生成、面向多模态大型语言模型的多功能视觉编码器 ......
No 32. AI自我意识：科学家迫切需要答案
No 33. 早！[太阳]
No 34. 提出一种基于大型语言模型的噪声鲁棒语音识别方法，通过引入噪声嵌入和知识蒸馏，实现了在噪声环境下的语音识别性能显著提升。//[AS]《Large Language Models are Efficient Learners of Noise-Robust Speech Recognition》
No 35. 新手LLM训练详细指南
No 36. Manifold Diffusion Fields (MDF)是一种用于在Riemannian流形上学习连续函数的生成模型，通过利用流形的几何特性和内在坐标系的定义，能更好地捕捉函数的分布。//[LG]《Manifold Diffusion Fields》
No 37. [AS]《Large Language Models are Efficient Learners of Noise-Robust Speech Recognition》
No 38. 大型语言模型(LLM)加速全面指南
No 39. [CL] YAYI 2: Multilingual Open-Source Large Language Models ......
No 40. 把www.arxiv.org改成www.talk2arxiv.org可直接针对论文内容进行问答（需要自备OpenAI key）
No 41. ReByte：AI应用全流程开发平台，通过绘制和描述来创建Web应用和聊天应用
No 42. [CV] InternVL: Scaling up Vision Foundation Models and Aligning ......
No 43. RAG-Survey：大型语言模型检索增强生成(RAG)相关文献资源列表
No 44. [LG] A Mathematical Guide to Operator Learning 算子学习旨在从数据中发现底层动力学系统或偏微分方程的属性。本文提供了一份关于算子学习的逐步指南。解释了适合运算符学习的问题和偏微分方程类型，讨论了各种神经网络架构，并解释了如何有效地使用数值偏微分方程求解器。 ......
No 45. dbeel：分布式的thread-per-core式文档数据库，采用Rust语言编写
No 46. [CV] PlatoNeRF: 3D Reconstruction in Plato's Cave via Single-View ......
No 47. 《Python Cookbook》(第三版) 中文版 (在线)
No 48. [CV]《VCoder: Versatile Vision Encoders for Multimodal Large Language Models》
No 49. AI Video Search Engine (AVSE)：使用最新的AI工具驱动的视频搜索引擎，利用视频转录和向量搜索技术，让用户能根据问题快速找到相关的视频片段，该项目使用了Supbase、Hasura、Fly、JigsawStack和Vercel等技术构建，具有高效、可扩展和易用的特点
No 50. [CL]《WaveCoder: Widespread And Versatile Enhanced Instruction Tuning with Refined Data Generation》

爱可可老师今日视野

AI - 人工智能；AR - 增强现实；CV - 机器视觉；DL - 深度学习；DM - 数据挖掘；DS - 数据科学；DV - 数据可视化；IOT - 物联网；ML - 机器学习；NLP - 自然语言处理

爱可可微博热门分享(12.23)

No 1. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 2. 新手LLM训练详细指南
No 3. RAG-Survey：大型语言模型检索增强生成(RAG)相关文献资源列表
No 4. Texify：将数学公式图片转换为markdown/LaTeX格式，具有OCR功能，可以处理内联和块级数学公式
No 5. LLM Distillation Playbook：关于如何有效蒸馏大型语言模型的最佳实践实用指南，提供了一系列的最佳实践，帮助工程师和机器学习从业者在生产应用中更高效地蒸馏和使用语言模型
No 6. 把www.arxiv.org改成www.talk2arxiv.org可直接针对论文内容进行问答（需要自备OpenAI key）
No 7. Akuma.ai：画画手残党的福音(内测中)
No 8. Google的2023年终总结
No 9. hf-mirror.com - Huggingface 镜像站
No 10. JoyTag：开源图像标注模型，专注于积极性和包容性，使用了Danbooru标注方案，适用于从手绘到摄影等各种类型的图像。模型基于ViT-B/16架构，训练了660M个样本，具有5000+个标签。通过输入图像，可以输出对5000多个不同标签的预测结果
No 11. AgentSearch [ΨΦ]: 面向Agent的功能强大的搜索引擎，可以在本地运行或通过远程API连接，适用于大型语言模型(LLM)和人类用户，提供超过十亿个来自Creative Commons、Arxiv、维基百科和Project Gutenberg等多样化来源的高质量嵌入
No 12. Roadmap To Learn Generative AI In 2024：学习生成式AI学习路线图，包括学习Python编程、基本机器学习和自然语言处理、深度学习、高级NLP概念以及生成式AI入门等内容，还提供了相关的向量数据库和存储以及LLM项目的部署方法
No 13. AppAgent：开源Agent框架，用于操作智能手机应用，具有学习能力，可以通过自主探索或观察人工演示来学习操作新的应用，并生成知识库以执行复杂任务，该框架通过简化的动作空间模拟人类交互，无需后端访问，适用于各种应用
No 14. Infinity：AI原生数据库，为LLM应用提供了极快的向量和全文搜索能力，具有高性能、灵活性和易用性等特点，能满足下一代AI应用的挑战
No 15. PenX：结构化的个人笔记应用，着重于保护隐私，采用端到端加密来同步数据，代码开源可信
No 16. 早！[太阳]
No 17. [CV]《AppAgent: Multimodal Agents as Smartphone Users》
No 18. 新书：《机器学习训练数据》
No 19. 《Python Cookbook》(第三版) 中文版 (在线)
No 20. [CV] Fairy: Fast Parallelized Instruction-Guided Video-to-Video ......
No 21. Whisper Turbo：跨平台GPU加速版Whisper，完全在客户端浏览器/electron应用里运行
No 22. AI Video Search Engine (AVSE)：使用最新的AI工具驱动的视频搜索引擎，利用视频转录和向量搜索技术，让用户能根据问题快速找到相关的视频片段，该项目使用了Supbase、Hasura、Fly、JigsawStack和Vercel等技术构建，具有高效、可扩展和易用的特点
No 23. Moddio Game Engine 2：HTML5多人游戏引擎，具有内置的服务器端授权网络代码，支持快照插值和客户端协调，可以同时支持50+个玩家或300+个移动实体
No 24. 傅立叶变换交互指南
No 25. [CL]《Time is Encoded in the Weights of Finetuned Language Models》
No 26. Sam Altman关于创业的教训和建议
No 27. [CV] HeadCraft: Modeling High-Detail Shape Variations for ......
No 28. 《大规模语言模型：从理论到实践》
No 29. Heynote：专为开发者设计的分块记事本，作为一个大型持久性文本缓冲区，可以用来随意书写任何内容。适用于不希望意外发送的Slack消息、API的JSON响应、会议记录、每日待办事项等等
No 30. LLM架构的未来
No 31. '程序员应该访问的最佳网站(中文版)，提供了丰富的资源和知识，适合程序员学习和提升技能’ Guangning ......
No 32. [LG]《The Truth is in There: Improving Reasoning in Language Models with Layer-Selective Rank Reduction》
No 33. LlamaTerm：与llama.cpp库进行交互的Python应用程序，通过命令行提供虚拟助手功能，允许提问并获得智能回答，还可以根据提示生成Linux命令
No 34. pychatml：使用Chat Markup Language(聊天标记语言)的对话库，可以方便地在不同的聊天格式和模型之间进行转换
No 35. 介绍了一个基于大型语言模型和多模态技术的多模态Agent框架，通过模拟人类的操作方式来操作智能手机应用，具有通用性、适应性和高效性。
No 36. [CV] HD-Painter: High-Resolution and Prompt-Faithful Text-Guided ......
No 37. [CV] DreamTuner: Single Image is Enough for Subject-Driven ......
No 38. GitHub最近抽的什么疯？不过就是几天的事：- 先是强制要求双重验证，可手机区号国家列表里没**🇨🇳却有**，让人非常气愤，用passkey勉强解决了；- ......
No 39. FLAIR - 遥感图像分割数据集，包括超过200亿个高分辨率航空影像的像素级标注，以及对应的19个语义类别。此外，还提供了10个光谱波段的高分辨率Sentinel-2卫星图像，共计50000多个图像。该数据集覆盖了50个地理区域，对于地表覆盖制图技术的进展提供了坚实的基础
No 40. Autonomous GIS: 自动地理信息系统(GIS)，利用大型语言模型(LLM)进行空间问题的自动数据收集、分析和可视化，采用GPT-4 API，在Python环境中实现了自动生成、自组织、自验证、自执行和自增长的自主GIS
No 41. 使用LLMPerf工具对LLM推理提供商进行基准测试，通过关键指标评估它们的性能、可靠性和效率，展示结果的透明度和可视化
No 42. [CV]《VideoPoet: A Large Language Model for Zero-Shot Video Generation》
No 43. [CV] PIA: Your Personalized Image Animator via Plug-and-Play ......
No 44. LangChain的2023AI发展状况总结
No 45. 创建通用AI爬虫
No 46. CartoonSegmentation：针对卡通/动漫角色的实例分割以及一些周边视觉技术的构建，提供了多种功能，如3D Ken Burns效果、Stable Diffusion补全、风格编辑等
No 47. PyTorch Frame：为PyTorch设计的深度学习框架，专门用于处理异构表格数据，支持各种列类型，包括数值、分类、时间、文本和图像，框架提供了模块化的架构，实现了多种先进的深度表格模型，并提供了用户友好的小批量加载器、基准数据集和自定义数据集集成接口
No 48. WhisperPlus：专注于提升语音转文本处理的能力，支持将YouTube视频转换为文本、文本摘要和说话人分离，提供了预训练模型和流程，方便使用
No 49. [CL]《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》
No 50. Lightning AI Studios ：持久的 GPU 云开发环境，支持在线代编程、本地 IDE编程、原型开发、训练、服务一站式体验，每人每个月6小时免费GPU算力

自荐一个AI相关的awesome系列集锦（含深度学习、机器学习和各大研究方向）

https://github.com/amusi/awesome-ai-awesomeness

爱可可微博热门分享(1.14)

No 1. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 2. 关于生成式AI，技术领导者需要面对的5个残酷事实
No 3. 总结了关于大模型发展的一些观点和思考，欢迎大家补充讨论： - 国内AI大模型已经达到上百个，但真正有前途、有实力的还只是少数。 ......
No 4. Surya：多语言文档OCR工具包，可进行准确的文本行检测，即将推出文本识别功能，以及表格和图表检测功能，可以处理各种类型的文档和多种语言
No 5. 最近试用了网易有道新推的Hi Echo，一款主打虚拟人的口语练习App，在目前的大模型落地应用中算是表现比较突出的，其设计理念体现了大模型个性化服务的精髓：用户可以根据自己的口语水平和学习阶段，选择不同难度的练习，确保了各种水平的学习者都能得到适合的训练。Hi ......
No 6. 算法交易回测教程
No 7. Embedded Systems Engineering Roadmap：嵌入式系统工程师成长路线图(学习指南)
No 8. Local-Code-Interpreter：OpenAI的ChatGPT代码解释器（Code Interpreter或Advanced Data Analysis）的本地版，支持自定义环境、无需担心文件大小限制和网络问题、支持GPT-3.5和GPT-4模型、增强的数据安全性、支持Jupyter等
No 9. 晚安～ [月亮]
No 10. GPT4V-Image-Captioner / GPT4V图像打标器：用Gradio构建的多功能图像处理工具箱，可以使用GPT-4-vision API或cogVLM模型对图像进行标记，支持一键安装和使用、单图像和多图像批量标记、在线GPT4V和本地CogVLM模型选择、视觉标记分析和处理、图像预压缩、关键词过滤和水印图像识别等功能
No 11. [LG] A Comprehensive Survey on Vector Database: Storage and ......
No 12. 拖延症患者既能用8小时搞定半小时的活，也能用半小时搞定8小时的活。
No 13. 给年轻人的一些建议
No 14. 大语言模型(LLM)相关资源列表
No 15. [LG]《Secrets of RLHF in Large Language Models Part II: Reward Modeling》
No 16. [CL] Seven Failure Points When Engineering a Retrieval Augmented ......
No 17. AI Town - 基于RWKV智能体的AI小镇
No 18. Anthropic：AI模型可被训练进行欺骗
No 19. 刚用 Replit Teams for Education 带了一学期的Python课，今天就收到 Teams for ......
No 20. Perfect Roadmap To Learn Data Science In 2024：关于学习数据科学的新版路线图，包括深入学习Python编程语言，统计学，数据库，机器学习，深度学习，自然语言处理以及MLOPS(机器学习运维)，提供了广泛的学习资源和实际项目实践，是学习数据科学的理想指南
No 21. 图解：API vs. SDK
No 22. [CV] LEGO:Language Enhanced Multi-modal Grounding Model 现有的多模态模型主要注重捕捉各模态中的全局信息，但忽视了跨模态的局部信息的重要性。为了解决这一问题，本文提出一种名为LEGO的语言增强的多模态定位模型。LEGO在捕捉全局信息的同时，突出了对输入中局部信息的 ......
No 23. [CV] GPT-4V(ision) is a Human-Aligned Evaluator for Text-to-3D ......
No 24. 早！[太阳]
No 25. AnimateAnyone复现，让给定人物动起来——将静态图像转换为生动、可控的视频序列，从而彻底改变角色动画
No 26. cutword：一个中文分词库，其字典文件根据最新数据统计得到，词频更加合理，分词速度是结巴分词的两倍
No 27. Text2X(文本到场景/3D/动作/4D/纹理等)相关资源大列表
No 28. [CL]《Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training》
No 29. KG-RAG：知识图谱检索增强生成框架，将知识图谱(KG)的显式知识与大型语言模型(LLM)的隐式知识结合起来
No 30. spin：在本地复制生产环境，用Docker轻松运行并配置，可以在不同操作系统上运行，包括MacOS、Windows和Linux，通过简单的配置文件实现基础设施的集中管理
No 31. 今日推介(第1284期)：大型语言模型欺骗行为研究、复杂系统低秩假设、大型语言模型的可信度、大型语言模型RLHF的奖励建模、基于概念聚类复杂度的网络数据集高效修剪 ......
No 32. Maybe: 开源个人财务管理应用，提供包括净值跟踪、金融账户同步、投资基准比较、投资组合分配、债务洞察、退休规划、投资回报模拟以及手动账户/投资跟踪等功能
No 33. Reverse Engineering Resources：关于逆向工程的资源集合，旨在帮助人们从零开始学习逆向工程，包含了高质量的学习资源，涵盖了汇编、操作系统内部、反混淆、反调试等多个领域，包括详细的学习路线、针对不同操作系统的指南、汇编项目示例以及关于逆向工程的博客推荐
No 34. 几篇论文实现代码
No 35. 开源AI的潜在风险
No 36. [LG] TOFU: A Task of Fictitious Unlearning for LLMs TOFU是一个虚构消除学习的任务，用于评估大型语言模型(LLM)的遗忘能力。提出一个包含200个虚构作者配置文件的数据集，并定义了一个子集作为遗忘集。提出一套综合评估遗忘效果的指标，并对现有的遗忘算法进行了基准测试 ......
No 37. 盲动态去模糊相关深度学习模型和基准数据集列表
No 38. Transformer详解，通过简化的数学公式解释了Transformer模型的工作原理，以及注意力机制、残差连接和层归一化的解释
No 39. 星辰语义大模型-TeleChat：由中电信人工智能科技有限公司研发训练的大语言模型，采用1.5万亿 Tokens中英文高质量语料进行训练
No 40. 'ChatGPT-Plus - AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 ChatGPT, ......
No 41. AMIE医疗诊断对话AI系统
No 42. Twinny：为VS Code设计的本地或API主机的AI代码补全插件，类似于GitHub Copilot，但完全免费和100%私密
No 43. ArchiveBox：强大的自托管网络存档解决方案
No 44. [LG]《The low-rank hypothesis of complex systems》
No 45. TrustLLM: LLM(大型语言模型)可信度研究，包括对LLM可信度不同维度的原则制定、建立了六个维度的基准评估，涵盖了真实性、安全性、公平性、鲁棒性、隐私性和机器伦理等方面
No 46. 通过数学分析和实证研究验证了复杂系统低秩假设的有效性，并揭示了复杂系统中高阶交互的产生机制。//[LG]《The low-rank hypothesis of complex systems》
No 47. [CV]《Distilling Vision-Language Models on Millions of Videos》
No 48. [CL]《Transformers are Multi-State RNNs》
No 49. 提出一种解决人工反馈强化学习训练语言模型的问题的方法，包括处理错误和模糊的偏好数据以及提升奖励模型的泛化能力，实现更稳定的对齐性能和迭代优化。//[LG]《Secrets of RLHF in Large Language Models Part II: Reward Modeling》
No 50. Replace Anything：一个简单的网络应用程序，允许用基于描述生成的图像替换图像的任意部分

国内提供计算机视觉(CV)算法岗位的公司名单：CV-Jobs

国内提供计算机视觉(CV)算法岗位的公司名单：CV-Jobs
github：https://github.com/amusi/CV-Jobs

爱可可微博热门分享(1.24)

No 1. 你在用什么AI编程辅助工具？- Github Copilot：由Github官方推出的智能编程辅助插件，可以直接集成到VSCode等编辑器或IDE，提供智能代码建议与补全。 ......
No 2. 机器学习/深度学习推荐书单，包括作者自己的一本书《...
No 3. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 4. 'CUDA高频面试题汇总/C++笔记/CUDA笔记 - CUDA 笔记 / 高频面试题汇总 / C++笔记，个人笔记，更新随缘: ......
No 5. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 6. 从零开始实现LoRA
No 7. PDFToChat：PDF对话项目，使用了一系列技术栈，包括Next.js、Together AI、Pinecone、Bytescale、Vercel等
No 8. 关于使用RAG模式(Retrieval-Augmented Generation)的应用和资源的信息，包括关于RAG技术的综述，以及一些GitHub库和企业级应用的链接，这些应用使用RAG模型来增强自然语言处理和信息检索能力
No 9. GPT Newspaper：创新的自主agent项...
No 10. 聊天机器人：改善心理健康的新途径
No 11. 看了感觉真可怜。。定睛一看爸爸妈妈好像也是AI生成的图，更可怜了。
No 12. Luna AI：全自动的 AI 直播系统，由Cha...
No 13. moondream1：一个微型(1.6B参数)视觉语言模型，其性能与两倍大小的模型相当，使用LLaVa训练数据集进行训练，视觉基于SigLIP，文本基于Phi-1.5
No 14. CMU新课：神经代码生成，介绍了使用深度学习方法对...
No 15. AI Filesystem：本地语义搜索工具，可以在文件夹中进行语义搜索
No 16. 早！[太阳]
No 17. AI游戏开发工具集，包括LLM、Agent、Cod...
No 18. 试了几个，最后用回Github Copilot主要是综合考虑效果和安全性，免费的多少有点担心 [坏笑]//你在用什么AI编程辅助工具？- ......
No 19. 几篇论文实现代码
No 20. [CL] In-context Learning with Retrieved Demonstrations for ......
No 21. '每天一句**古诗词，生成 AI 图片 Powered by Bing DALL-E-3.' GitHub: github.com/liruifengv/daily-poetry-image ......
No 22. OpenGFW：Linux 上灵活、易用、开源的 GFW 实现，并且在许多方面比真正的 GFW 更强大，可以部署在家用路由器上的网络主权，使用场景包括广告拦截、家长控制、恶意软件防护、VPN/代理服务滥用防护、流量分析 (纯日志模式)等
No 23. 大家看得真细，可以作为AIGC反面案例了 //@真十内:放大看了看细节，好怪的图。。[汗]//@BkFs_:好像小女孩划的火柴//@Bruce_Segal:新中式恐怖是吧//@阿尔菲的花匠:看了感觉真可怜
No 24. 一键部署开源AI项目列表
No 25. [LG]《Gaussian Adaptive Attention is All You Need: Robust Contextual Representations Across Multiple Modalities》
No 26. 2023年终总结集
No 27. Segment Matting：旨在通过SAM(Segment Anything Model)模型来提高图像抠图质量和性能的项目，专注于优化抠图过程，以减少锯齿边缘并提高分割的整体准确性
No 28. OpenGPTs：旨在管理GPTs的浏览器扩展，解决了OpenAI网站上GPTs的管理问题，包括查看GPTs使用情况、一键分享给朋友、生成不同的微调版本等
No 29. Binoculars：用来准确检测AI生成文本还是人工撰写文本的新方法
No 30. rtp-llm 是阿里巴巴大模型预测团队开发的 LLM 推理加速引擎，提供高性能、低成本和用户友好的推理服务，帮助客户和开发人员定制适合其业务的推理服务，从而促进业务增长
No 31. phidata：使用LLM函数调用构建AI助手的框架，允许LLM通过运行函数并基于响应智能选择行动的强大方法，助手具有内置的记忆、知识、存储和工具，使其易于构建各种应用程序，如知识助手、数据助手、Python助手、客户助手、研究助手、营销助手、旅行助手和餐前准备助手
No 32. 机器人行走的新突破：模仿人类步态的高效率
No 33. AI编程助手应该怎么选？
No 34. Ragswift：可伸缩的中心化文本嵌入检索平台，可用于快速构建RAG应用，旨在轻松处理规模化的文档摄取、存储和检索任务，通过Ray充分利用分布式计算的强大能力，使用户能在多个CPU和GPU节点上并行处理大规模文档集，支持数十亿个向量的规模
No 35. 决策科学相关资源列表，涵盖了决策科学的各种资源，包...
No 36. MiniMalloc：专为机器学习模型静态内存分配而设计的先进算法，使用多种新的搜索技巧以高效解决此类问题
No 37. [CL]《West-of-N: Synthetic Preference Generation for Improved Reward Modeling》
No 38. 晚安～ [月亮]
No 39. vx.dev：v0.dev的开源替代，成本可控，高度可定制，无缝集成 GitHub。v0.dev是由Vercel发布的一款AI驱动的用户界面生成工具。它可以根据用户的文本提示即时生成UI组件，并支持实时修改和迭代
No 40. Scalable Vector Search：用于向量相似性搜索的性能库，通过使用本地自适应向量量化和高度优化的索引和搜索算法，使得在数十亿个高维向量上实现了高精度和最先进的速度的向量相似性搜索成为可能，同时使用的内存比其替代品少
No 41. 用AI辅助CS50课程教学
No 42. AgentBoard: 多轮LLM智能体的分析评估排行榜，用于评估大型语言模型的通用Agent能力
No 43. X-Force IDE：低代码、agent即服务的UI框架，通过拖放创建基于agent的工作团队(workforces)，可将创建的工作团队导出为Python脚本，并在本地计算机上运行它们
No 44. RAG - Maestro (Now Live!)：使用RAG管道构建的聊天机器人，用于阅读、总结和引用与用户查询相关论文
No 45. [CV] Mastering Text-to-Image Diffusion: Recaptioning, Planning, ......
No 46. MFTCoder: 高效准确的多任务大模型微调框架
No 47. FalkorDB：超快图数据库，在稀疏邻接矩阵图表示下使用了GraphBlas技术
No 48. Heat.js：轻量的JavaScript库，用于生成可自定义的热力图，用来可视化基于日期的活动和趋势
No 49. InternEvo：开源的轻量级训练框架，旨在支持无需大量依赖关系的模型预训练，支持在具有数千个GPU的大规模集群上进行预训练，同时在单个GPU上进行微调，并实现了显著的性能优化
No 50. Alphabet与AI数据公司Appen断约：AI训练的未来将何去何从？

爱可可微博热门分享(1.21)

No 1. OpenGFW：Linux 上灵活、易用、开源的 GFW 实现，并且在许多方面比真正的 GFW 更强大，可以部署在家用路由器上的网络主权，使用场景包括广告拦截、家长控制、恶意软件防护、VPN/代理服务滥用防护、流量分析 (纯日志模式)等
No 2. 向量数据库横向对比，包括Pinecone、Weaviate、Qdrant、Chroma、LanceDB、Milvus、Vespa、Vald、Postgres、Redis、ElasticSearch等
No 3. datatrove：平台无关的数据处理开源工具
No 4. 科学领域预训练语言模型大列表，包括数学、物理、化学、生物学、医学、材料科学和地球科学等领域的模型，涵盖不同的参数规模，从小于100M到700B参数，以及不同的模态(如语言、视觉、分子、蛋白质、图表等)
No 5. 'TCM-Ancient-Books - 中医药古籍文本，近700项' GitHub: github.com/xiaopangxia/TCM-Ancient-Books ......
No 6. [LG]《GraphGPT: Graph Learning with Generative Pre-trained Transformers》
No 7. 晚安～ [月亮]
No 8. “哄哄模拟器Web版 – 你的AI对象生气了，快哄哄TA - 哄哄模拟器基于AI技术，你需要使用语言技巧和沟通能力，在限定次数内让对方原谅你，这并不容易[笑而不语]” ......
No 9. #抽奖# #赠书# 携手@图灵新知 @图灵文化送出5本《智能文本处理实战》
No 10. 开源人工智能：挑战闭源巨头的新兴力量
No 11. 关于ChatGPT的资源集合，包括了各种工具、文档、应用和使用案例
No 12. OpenAI与ASU的创新合作：ChatGPT将改变教学方式
No 13. OpenAI首席执行官Sam Altman筹集数十亿美元建立全球AI芯片工厂
No 14. Meta全力以赴：年底前购35万块H100，加速开源AGI研发
No 15. LLM的偏好微调和对齐
No 16. nanotron：简化大型语言模型训练的开源工具，提供了一种简洁的大型语言模型3D并行训练方法
No 17. 'ChatGPT Next Web LangChain - 一键拥有自己的 ChatGPT 网页服务(基于 langchain ......
No 18. [CL] E^2-LLM: Efficient and Extreme Length Extension of Large ......
No 19. 关于Rust工具、库和框架的精选列表，用于处理LLMs、GPT和人工智能
No 20. 免费书稿：《向量检索基础》
No 21. ’GenMedicalEval：医疗大语言模型综合评测框架，特点包括大规模综合性能评测、深入细分的多维度场景评估、创新性的开放式评估指标和自动化评估模型’ ......
No 22. LLM App Stack：LLM应用栈工具、项目和供应商列表，旨在更全面地覆盖每个类别中的所有可用选项，涵盖了数据管道、嵌入模型、向量数据库、沙盒、编排器、API / 插件、LLM缓存、日志/监视/评估、验证器、LLM API(专有)、LLM API(开源)、应用程序托管平台、云提供商、有见解的云项目列表等类别
No 23. [CL]《Analyzing Feed-Forward Blocks in Transformers through the Lens of Attention Map》
No 24. 用500行SQL代码实现GPT：介绍了如何使用SQL实现一个大型语言模型，解释了SQL不适合实现大型语言模型的原因，介绍了生成式大型语言模型所需的逻辑和算法。文章还提到了生成预训练Transformer(GPT)的原理和实现细节
No 25. 早！[太阳]
No 26. GraphGPT是一种新的图学习模型，通过生成式预训练和微调，在图、边和节点级任务中取得优秀结果，突破了传统图神经网络和图Transformer模型的限制。
No 27. Distributed Llama：旨在通过将工作负载分布和划分RAM使用来在弱设备上运行LLM(大型语言模型)或使强大设备更加强大，支持的LLM模型包括Llama 2 7B、Llama 2 13B和Llama 2 70B
No 28. Percy Liang：构建AI的新路线
No 29. 视觉Mamba：高效的视觉建模技术，提升速度，节省内存
No 30. OpenAI的GPT商店已被AI'女友'机器人充斥
No 31. [CV] DiffusionGPT: LLM-Driven Text-to-Image Generation System ......
No 32. GPT Core：用于创建和训练先进的大型语言模型(LLM)，着重强调了其快速性能，可以在仅20分钟消费级GeForce RTX™ 4090上将自定义的1.23亿参数LLM预训练到约3.5的验证损失
No 33. 《AI 研发提效研究：自己动手训练 LoRA》
No 34. 用一句话让ChatGPT“泄密”
No 35. LLM时代打击虚假信息相关论文资源列表，涵盖了LLM在虚假信息检测、干预、归因以及对抗LLM生成虚假信息等方面的研究
No 36. 研究了记忆与预测和规划之间的关系，通过学习认知图和多尺度预测性表示，可以提高人工智能系统的记忆和规划能力。
No 37. AutoML Toolkit：用于构建AutoML系统的框架，目标是通过允许研究各种AutoML设计决策的简明研究成果，使简单的原型能够扩展到可用的计算资源，并提供了一个可扩展的框架来构建真实而强大的AutoML系统
No 38. 2024进度：░░░░░░░░░░░░░░░ 5%
No 39. 个人LLM智能体相关论文资源列表，个人LLM智能体的主要目的是协助终端用户，增强其能力，帮助他们更专注于有趣和重要的事务，这里列出了个人LLM智能体的关键能力、效率和安全性方面的主要内容，包括任务自动化、记忆功能、安全性和隐私等
No 40. [CV] InstantID: Zero-shot Identity-Preserving Generation ......
No 41. [LG]《Memory, Space, and Planning: Multiscale Predictive Representations》
No 42. 今日推介(第1291期)：通过Gaunt张量积在Fourier基上实现高效等变运算、记忆、空间和规划: ......
No 43. 含噪数据的平滑
No 44. [CL]《Self-Rewarding Language Models》
No 45. 理解和编写LLM中的自注意力、多头注意力、交叉注意力和因果注意力
No 46. WhisperBot：整合了Mistral大型语言模型的实时语音转文本系统，基于WhisperLive和WhisperSpeech，WhisperLive使用OpenAI Whisper作为强大的自动语音识别系统，Mistral和Whisper都经过TensorRT引擎优化，以实现高性能和低延迟处理
No 47. Draw2Img：一个简单的Web用户界面，用于交互式文本引导的图像生成，适用于任何年龄和技能水平
No 48. Neural Speed：旨在通过Intel Ne...
No 49. 几篇论文实现代码
No 50. Fish Audio Preprocessor：一些用于音频处理的脚本，包括：将视频/音频转换为wav格式、音频声音分离、自动音频切片、音频音量匹配、音频数据统计、音频重采样

爱可可微博热门分享(1.30)

No 1. 《⁡⁣⁢⁣⁡‍‌⁡⁣⁤⁢‌⁢⁤‍⁢⁣‌⁤⁣⁣⁣‌‌‍‌⁤⁣⁣⁢⁢互联网知识地图最全合集（2024 新版） - 飞书云文档》
No 2. 用好ChatGPT的几个要点
No 3. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 4. 用Langchain, ColBERT, Ragatouille 和 ChromaDB构建高级 RAG 系统，有效地提取 Mixtral 8x7B 生成高质量答案所需的所有相关上下文
No 5. Meta发布Code Llama 70B，用于代码生成的LLM的新的、性能更高的版本，与之前的 Code Llama ......
No 6. FinSight：专为投资组合经理、投资者和金融爱好者设计的尖端 AI 助手，利用 GPT-4 和财务数据，FinSight 提供关于公司的深入见解和可操作的总结，帮助做出更明智的投资决策。FinSight 可以帮助用户深入了解从损益表、资产负债表和现金流量表中提取的核心财务指标
No 7. GPUPixel：使用C++11编写的高性能图像和视频AI美颜效果库
No 8. Martian发布大模型推理成本排行榜：不同供应商的大模型服务成本存在5倍以上的差异，吞吐量差异超过6倍，API的选择对最终性能至关重要
No 9. GitHub Copilot对代码质量的负面影响
No 10. Qwen-VL全新升级：朝向人类认知的理解和感知
No 11. ProChat：快速搭建大语言模型 Chat 对话的前端组件库，旨在赋予开发人员轻松打造丰富、动态和直观的聊天界面的能力
No 12. AI Cover：AI红包封面生成，使用 AI 技术生成精美的微信红包封面
No 13. 数据驱动无人驾驶相关资源大列表
No 14. 晚安～ [月亮]
No 15. PyrateLimiter：使用漏桶算法的请求限速器
No 16. Neurochat：一款 100% 原生前端应用，旨在促进与各种 AI 服务的互动，包括神经引擎服务、OpenAI 的 ChatGPT API 和使用 Llama.cpp 库的本地 AI 模型，其主要功能是通过一个简单且方便的 GUI 管理这些不同的 AI 系统，同时提供一致的用户体验
No 17. [LG]《EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty》
No 18. Noi：集成OpenAI等AI服务、工具、插件的智能前端
No 19. Graphy：数据可视化工具，提供了一种简单的方式...
No 20. [CV] From GPT-4 to Gemini and Beyond: Assessing the Landscape ......
No 21. ChaCha(儿童情感意识的聊天机器人)：一个利用大语言模型帮助儿童增强情感意识的聊天机器人。由韩国 Naver 人工智能实验室研发，旨在帮助儿童分享他们关于个人事件的情感，ChaCha 使用 GPT-3.5 和 GPT-4 模型来处理儿童的语言输入，并生成相关的提示和反馈
No 22. PolyMind：多模态、函数调用驱动的LLM w...
No 23. [LG]《Learning Universal Predictors》
No 24. 免费书稿：《机器学习工程》，提供了一系列关于机器学习工程的深入内容，包括但不限于数据处理、模型训练、模型评估、模型部署等方面的知识，可以帮助读者更好地理解和掌握机器学习工程的各个方面，从而在实际工作中更有效地应用机器学习技术
No 25. Inference-Time Training: 用于长文本生成任务的推理时训练方法，与传统方法不同，它不再依赖 KV 缓存来存储所有上下文信息，而是将这些信息直接嵌入到模型参数中
No 26. Gemini-OpenAI-Proxy：将 OpenAI API 协议转换成谷歌 Gemini Pro 协议，可以将 OpenAI 的功能无缝集成到使用 Gemini Pro 协议的应用中
No 27. C++ Standard Library and Qt, Python etc Implementation in C：旨在使用C编程语言重新实现C++标准库的功能，为C开发人员提供了常见于C++的工具和库，从而在保持C语言生态系统的同时，更好地管理数据结构、实现算法和使用功能
No 28. 非母语者英语科研写作的7个技巧
No 29. 'AAAMLP-CN - Approaching (Almost) Any Machine Learning Problem中译版' ......
No 30. text_blind_watermark：文本隐水印/盲水印：把信息隐匿到文本中
No 31. 几篇论文实现代码
No 32. [CV] No Longer Trending on Artstation: Prompt Analysis of Generative ......
No 33. MoE-LLaVA：多模态混合专家模型，在多模态学习中表现出卓越性能，具有相对较少的参数，但在各种视觉理解数据集中表现出与LLaVA-1.5-7B相媲美的性能，甚至在对象幻觉基准测试中超越了LLaVA-1.5-13B
No 34. 今日推介(第1300期)：通过删除行和列压缩大型语言模型、通用预测器学习、基于大语言模型的机器人生成表达行为研究、黑盒访问不足以进行严格的人工智能审计、投机采样需要重新思考特征不确定性 ......
No 35. 《Paul Graham 2006-2023 精选文集（中英对照）》
No 36. [RO]《Generative Expressive Robot Behaviors using Large Language Models》
No 37. 掌握Llama 2：Meta推出提示工程交互式指南
No 38. Transcribe and summarize youtube video using mlx：MacOS上用 MLX来转录和总结YouTube视频
No 39. 早！[太阳]
No 40. [LG] Four Facets of Forecast Felicity: Calibration, Predictiveness, ......
No 41. //@爱可可-爱生活:今日开奖，欢迎参与～
No 42. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 43. [CL] Taiyi-Diffusion-XL: Advancing Bilingual Text-to-Image ......
No 44. [CV] InstructDoc: A Dataset for Zero-Shot Generalization of ......
No 45. GPT-4V Checkup：可以随着时间推移测试 GPT-4V 在图像提示方面表现的开源监视器
No 46. 科学传播的新时代：科学家应该成为“网红”
No 47. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 48. Figure最新发布的机器人视频 🤖
No 49. 向量数据库将走向哪里
No 50. 用RAGatouille探索ColBERT

爱可可微博热门分享(12.20)

No 1. 2023生成式AI发展回顾
No 2. 新手LLM训练详细指南
No 3. 比llama.cpp快12倍！PowerInfer: 在消费级GPU上进行高速大型语言模型服务，其目标是提供一种利用普通PC上的消费级GPU进行高效语言模型服务的解决方案
No 4. 复杂检索增强生成(RAG)的技术考量
No 5. 大语言模型(LLM)时代无需大量计算资源的NLP研究方向总结
No 6. Easy Translator：使用OpenAI API开发的命令行工具，支持多种文件格式的翻译，包括.txt、.pdf、.docx、.md、.mobi和.epub，可以轻松地翻译文本文件，消除语言障碍
No 7. 新书：《(从头开始)构建大型语言模型》
No 8. Google Gemini Pro免费试用：Google Gemini是DeepMind开发的一种多模态人工智能模型，可以处理文本、音频、图像等多种类型的数据
No 9. '程序员应该访问的最佳网站(中文版)，提供了丰富的资源和知识，适合程序员学习和提升技能’ Guangning ......
No 10. [LG] A mathematical perspective on Transformers 提出一个分析Transformer的数学框架，并将其解释为相互作用的粒子系统。研究发现，在长时间内会出现聚类现象，这对于理解Transformer在学习任务中的机制具有重要意义。本文为数学家和计算机科学家提供了新的视角，将Transfo ......
No 11. 《LLM 实战：使用 function calling 开发”成语接龙”小游戏》
No 12. JARVIS：个人AI语音助手，实现了语音转文字、语言模型生成回复、文字转语音，并在Web界面中展示
No 13. Llama-2微调指南
No 14. GitHub最近抽的什么疯？不过就是几天的事：- 先是强制要求双重验证，可手机区号国家列表里没**🇨🇳却有**，让人非常气愤，用passkey勉强解决了；- ......
No 15. 终于解封了……似乎是因为我标star过多导致？5k+确实多了点，不过都是纯手动选择性star绝非Spam好吧？吃一堑长一智，下次肯定不能再放一个篮子里了 ......
No 16. microagents: 具备自我编辑提示和Python编程能力的模块化agent库，探索了自进化agent的概念，无需用户提供特定的agent设计或提示，只需提出问题，系统就会创建并改进能提供答案的agent。agent之间通过向量相似性选择或创建，具有逐步改进的系统提示
No 17. SDXL Auto FaceSwap：从绘画和照片生成逼真的换脸图片，可以改变人物的属性，例如改变头发颜色和添加眼镜，或者混合多人的身份
No 18. 可视化生物进化树
No 19. API Dash：用Flutter构建的漂亮的开源跨平台API客户端，可轻松创建和自定义API请求，可视化检查响应并生成API集成代码，是Postman/Insomnia的轻量替代
No 20. 晚安～ [月亮]
No 21. 'ComfyUI Portrait Master 简体中文版 - 帮助AI图像创作者生成人像提示，可以根据不同的选项自定义生成的人像，包括性别、民族、眼睛颜色、发型等' ......
No 22. [LG] From Google Gemini to OpenAI Q* (Q-Star): A Survey of Reshaping ......
No 23. 警惕科研高产的不利影响
No 24. TuneNN：提供了基于Transformer的神经网络模型，用于音高检测。该模型可以应用于各种乐器的调音，通过提取音频特征和使用滑动邻窗进行处理，实现对音高的精确估计
No 25. AI筛查儿童视网膜照片诊断自闭症准确率100%
No 26. (部分)免费书稿《数据工程设计模式》
No 27. Autonomous GIS: 自动地理信息系统(GIS)，利用大型语言模型(LLM)进行空间问题的自动数据收集、分析和可视化，采用GPT-4 API，在Python环境中实现了自动生成、自组织、自验证、自执行和自增长的自主GIS
No 28. 2023：LLM元年
No 29. 从头开始构建Deep Q-Learning深度强化学习环境
No 30. GPT-4V Web Agent：GPT-4V浏览器机器人，能在浏览器上看、控制、导航和执行任务的AI智能体
No 31. PIXART-α：基于扩散+Transformer的文本-图像生成模型
No 32. 《大规模语言模型：从理论到实践》
No 33. 《‍⁡‌‍‌⁤‍⁢⁤⁢⁣⁢⁡⁡‍⁡⁣⁢⁤‌⁣⁤‍⁣‌⁤⁤‍⁡⁢⁢OpenAI：GPT 最佳实践中文大白话版本.pdf - 飞书云文档》
No 34. [RO]《Multi-level Reasoning for Robotic Assembly: From Sequence Inference to Contact Selection》
No 35. 今日推介(第1259期)：大型语言模型的社会化协作学习、机器人装配的多级推理、GPT模型可信度综合评估、Gemini语言能力的深入探索、用渐进式工具检索改进规划 ......
No 36. 大型多模态模型幻觉相关论文、方法和资源列表
No 37. Akuma.ai：画画手残党的福音(内测中)
No 38. [CL]《DecodingTrust: A Comprehensive Assessment of Trustworthiness in GPT Models》
No 39. AI Group Tabs：利用AI帮助用户组织和分组网页标签的Chrome扩展，可以通过自动分类将标签分组，提供更好的标签管理体验
No 40. [CL] G-LLaVA: Solving Geometric Problem with Multi-Modal Large ......
No 41. 用LLM为每个用户生成个性化视频
No 42. Calvin: 由LLM和Langchain驱动的聊天机器人，用于处理Google日历任务，使用Next.js、FastAPI和MongoDB构建，助手逻辑使用Langchain和OpenAI API开发
No 43. 早！[太阳]
No 44. Lightning AI Studios ：持久的 GPU 云开发环境，支持在线代编程、本地 IDE编程、原型开发、训练、服务一站式体验，每人每个月6小时免费GPU算力
No 45. 新书：《用Python和JAX构建推荐系统：产品化系统大规模实战》
No 46. Langchain+Gemini示例Notebooks
No 47. Mist：用于保护图像内容和风格的强大图像预处理工具，通过添加水印使图像难以被最先进的AI艺术应用模仿，Mist V2在效果上进行了增强，对更广泛的AI艺术应用具有更好的防御能力，特别是在Lora方面表现出色，支持GPU和CPU处理，仅需6GB显存即可高效运行
No 48. 通过对Gemini和GPT模型的比较分析，揭示了Gemini在不同语言任务上的优势和不足，包括对多位数数学推理的失败、对多项选择答案排序的敏感性等，突出了Gemini在生成非英语语言和处理复杂推理链方面的高性能。//[CL]《An In-depth Look at Gemini's Language Abilities》
No 49. WhisperS2T：针对Whisper模型的优化语音转文本流水线，支持多个推理引擎
No 50. xx为啥那么贵——全球高消费产品可视化分析

爱可可微博热门分享(1.7)

No 1. 'ChatGPT-Plus - AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 ChatGPT, ......
No 2. 自始至终就我一人儿 [笑cry] 评论少可能因为都是技术内容太严肃了，欢迎大家多提好建议～ //@非洲鸡亲爱精诚:爱可可背后是什么大佬在运营？才发现有八十多万关注，每天信息量大到惊人，但大部分内容都没评论没互动[笑cry]
No 3. AI热门开源项目排行(51-60)51、StableLM简介：StableLM是Stability AI推出的语言模型，旨在提供高性能的自然语言处理功能。地址：github.com/Stability-AI/StableLM52、IF简介：开源的文本到图像模型，具有高度的照片真实感和语言理解能力。地址：github.com/deep-floyd/IF53、OpenFlamingo ......
No 4. 过去50年来最重要的统计学**：反事实因果推断、bootstrapping和基于模拟的推断、过参数化模型和正则化、贝叶斯多层模型、通用计算算法、自适应决策分析、鲁棒推断和探索性数据分析。这些**在统计学和数据科学领域的研究中起到了重要的推动作用
No 5. 使用大型语言模型进行生成式信息抽取(IE)的论文集合，涵盖了命名实体识别、关系抽取、事件抽取等多个信息抽取任务，介绍了学习范式、特定领域、数据增强、评估分析等方面的内容
No 6. Docker Crash Course：关于Docker的完整教程，包含了使用不同技术栈构建的各种应用的Docker化实例，涵盖了Docker的基础知识、镜像和容器的管理、最新的Docker特性等内容。通过这个项目，可以学习到如何将应用容器化，并掌握Docker在不同场景下的使用方法和最佳实践
No 7. 今天才看到 @拍火车的石头和 @之宇萌两位网友给我的”巨额'打赏，真是受宠若惊！[笑cry] 对这两位网友的鼓励，由衷地表示感谢！大家多多转发、评论、点赞就好了，也欢迎多给我提些关于内容方面的好建议。你们的支持，就是给我最大的鼓励！谢谢大家！ ......
No 8. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 9. 理解Mixtral-8x7b
No 10. Foxtrot：全能的Bevy 3D游戏模板，提供了各种功能和工具，包括角色控制、物理引擎、音频、寻路、对话系统等，可用于快速开发3D游戏
No 11. 检索增强生成(RAG)进阶技巧速查
No 12. 《‌⁢‍⁡⁢⁤‍⁣⁢⁣‍⁡‍⁤‍⁣⁤⁣‌涓海录AIGC学习文档 - 飞书云文档》
No 13. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 14. 图解AI开放状况(数据来源：Coatue)：从模型代码、模型权重、训练数据、模型评估、架构决策和商业许可的开放性等方面，对比了主流的AI模型——GPT-2、GPT-3、GPT-4、LaMA(来自Meta)、LaMA-2和Mistral-7B的开放程度。 ......
No 15. 面向未来的AI技术生态系统：图1：AI中心化技术生态系统的总体架构，包括从底层的数据中心/硬件/电力资源到最终用户之间的各个层次。在该结构中，AI模型处于核心地位，由云平台支持，由AI开发者工具创建，并通过AI应用为最终用户提供服务。这反映了AI技术的渗透和其对整个技术栈的影响。 ......
No 16. 肖像大师：肖像生成项目，提供了中文版的ComfyUI肖像生成器。可以通过选择不同的参数来生成符合要求的肖像
No 17. 完全免费的脚本，根据简历和职位描述，用ChatGPT自动生成求职信，发给企业招聘主管们
No 18. Talk2Arxiv：使用ChatGPT让您能与任何ArXiv论文进行对话，利用RAG(检索增强生成)系统，通过解析PDF、文本嵌入和上下文相关性等技术，提供了一个交互式的聊天界面，让您能与论文进行对话和交流
No 19. 直观理解“数据是新货币”：这张图展示了2023年几家头部公司对数据访问采取限制措施的时间线，强调数据已经成为一种新的货币。在这一年中，多家公司采取了措施来限制对其数据的访问或使用，这些措施反映了公司对于其数据所有权的重视和保护。 ......
No 20. 关于大型语言模型的实用课程，涵盖了技术、项目和企业解决方案，课程以实践为导向，通过使用OpenAI和Hugging Face库的模型进行实际操作来提供实践经验。课程分为三个主要部分：技术与库、项目和企业解决方案。课程提供了丰富的笔记本和文章，供学习者参考
No 21. 遥感基础模型相关论文资源列表，包括遥感视觉、视觉-语言、生成式、位置和音频等多个方向的模型
No 22. '语音识别转文字工具 - Voice Recognition to Text Tool / 一个离线运行的本地语音识别转文字服务，输出json、srt字幕带时间戳、纯文字格式' ......
No 23. 早！[太阳]
No 24. [CL] TinyLlama: An Open-Source Small Language Model TinyLlama是一个开源的小型语言模型，尽管其规模相对较小，但在各种下游任务中表现出色。它使用约1万亿Token的大型数据集进行了约3个epoch的预训练。TinyLlama利用了开源社区的先进技术，实现了更好的计算效率。模型的 ......
No 25. autotranslate：用Faster Whisper和ChatGPT实现视频的转录和翻译，支持多平台和本地视频文件，可用于支持的网站(如YouTube、Twitter、Bilibili等)
No 26. Hugging Face工具合集，收集了很多关于Hugging Face工具的资源
No 27. [CL] Understanding LLMs: A Comprehensive Overview from Training ......
No 28. 几篇论文实现代码
No 29. AI热门开源项目排行(31-40)31、labml.ai Deep Learning Paper Implementations简介：提供了60多个深度学习论文的实现和教程，每篇论文都有详细的注释。涵盖内容包括原始Transformer、XL、Switch、Feedback、VIT等各种变体，优化算法如Adam、AdaBelief、Sophia等，以及GANs（包括CycleGAN、StyleGAN2 ......
No 30. 晚安～ [月亮]
No 31. oranda：生成漂亮开发工具页面的静态网站生成器，为开发者提供了一个快速构建网站的解决方案，无需从头开始构建
No 32. ‘国内用户 HuggingFace 高速下载 - 利用HuggingFace的官方下载工具从镜像网站进行高速下载' ......
No 33. (Slides)面向编程和数学的基础模型
No 34. LZAV - Fast Data Compression Algorithm (in C/C++)：快速内存数据压缩算法，具有高压缩速度(460+MB/s)和高解压速度(2500+MB/s)，压缩比优于LZ4、Snappy和LZF
No 35. [AS] OpenVoice: Versatile Instant Voice Cloning 网页链接介绍了一种名为OpenVoice的多功能即时语音克隆方法，只需一个参考说话者的短音频片段即可复制其声音并生成多种语言的语音。OpenVoice在解决该领域的以下难题方面取得了显著进展：1)灵活的语音风格控制；2)零样本t跨语言语音 ......
No 36. AI热门开源项目排行(1-10)1、Stanford Alpaca简介：提供了用于训练斯坦福大学Alpaca模型的代码和文档，以及生成相关数据。Alpaca模型是一种大型语言模型，专注于提供更高效的文本生成和处理能力。项目旨在促进语言模型的研究与开发。地址：github.com/tatsu-lab/stanford_alpaca2、llama.cpp简 ......
No 37. Whisper Dictation：快速、离线、注重隐私的、无需动手的语音输入项目，支持双向AI语音聊天、图片、语音控制，并在不到4 GiB的VRAM内运行
No 38. 提出一种能同时处理2D RGB图像和3D点云的模型ODIN，通过Transformer架构实现2D和3D信息的融合，取得了在多个基准测试上的最先进性能。//[CV]《ODIN: A Single Model for 2D and 3D Perception》
No 39. csvlens：命令行CSV文件查看器，类似于less命令，但专为CSV文件设计
No 40. copilot-gpt4-service：将Github Copilot请求转换为ChatGPT请求，免费使用GPT-4模型
No 41. AI热门开源项目排行(41-50) 41、Open-Assistant 简介：聊天式助手项目，能理解任务，与第三方系统互动，并动态检索信息。 ......
No 42. [LG] Optimizing Distributed Training on Frontier for Large ......
No 43. 今日推介(第1277期)：用3D GAN渲染高保真几何的每个像素、MUSE的开源复现、2D和3D感知的统一模型、无需微调的自扩展LLM上下文窗口、大型语言模型重新学习已删除概念 ......
No 44. LLM AutoEval：在Google Colab上自动评估LLM的工具，可以简化LLM模型的评估过程，并提供自定义的评估参数和生成摘要的功能。该项目还包括了Nous和Open LLM两个基准套件，以及对GPU资源的选择和调整
No 45. Newspaper4k: 新闻文章提取工具，可以从新闻网站中提取文章、标题和元数据
No 46. [CV]《What You See is What You GAN: Rendering Every Pixel for High-Fidelity Geometry in 3D GANs》
No 47. QAnything (Question and Answer based on Anything)：致力于支持任意格式文件或数据库的本地知识库问答系统，可断网安装使用，使用两阶段检索进行问答，具有跨语种能力，支持多篇英文论文问答、信息抽取、网页问答等，可以通过安装和使用它来实现自己的问答系统
No 48. ”人工智能”这个叫法可以用
No 49. Clipper：命令行的HTML到Markdown转换器和网络爬虫工具，可以用来从网页剪辑内容并将其转换为Markdown格式，非常适合个人归档或笔记记录
No 50. [CV] DiffusionLight: Light Probes for Free by Painting a Chrome ......

爱可可微博热门分享(12.21)

No 1. 创建通用AI爬虫
No 2. 《Python Cookbook》(第三版) 中文版 (在线)
No 3. 2023生成式AI发展回顾
No 4. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 5. 新手LLM训练详细指南
No 6. Autonomous GIS: 自动地理信息系统(GIS)，利用大型语言模型(LLM)进行空间问题的自动数据收集、分析和可视化，采用GPT-4 API，在Python环境中实现了自动生成、自组织、自验证、自执行和自增长的自主GIS
No 7. '程序员应该访问的最佳网站(中文版)，提供了丰富的资源和知识，适合程序员学习和提升技能’ Guangning ......
No 8. 比llama.cpp快12倍！PowerInfer: 在消费级GPU上进行高速大型语言模型服务，其目标是提供一种利用普通PC上的消费级GPU进行高效语言模型服务的解决方案
No 9. 新书《公平与机器学习：局限与机会》：一本介绍公平和机器学习领域最新工作的教材，从多个学科视角探讨了自动化决策的机会和风险，并提供了一套新的解决方案。本书涵盖了评估机器学习模型公平性的统计和因果度量，以及与公平性相关的决策制定过程和实质性方面，包括对歧视的法律和哲学观点的回顾
No 10. XL Textual Inversion for Stable Diffusion XL 1.0 SDXL on a 24 GB GPU：实现文本逆向的项目，特色是能将输入的图像转化为可用于生成艺术品的概念(Embedding)，适用于Stable Diffusion XL 1.0
No 11. 用Speculative Decoding加速Whisper模型推理
No 12. TorchExplorer：用于交互式检查神经网络模块输入、输出、参数和梯度的工具，可以与weights and biases集成，也可以作为独立的解决方案运行
No 13. 新书：《(从头开始)构建大型语言模型》
No 14. 大语言模型(LLM)时代无需大量计算资源的NLP研究方向总结
No 15. FLAIR - 遥感图像分割数据集，包括超过200亿个高分辨率航空影像的像素级标注，以及对应的19个语义类别。此外，还提供了10个光谱波段的高分辨率Sentinel-2卫星图像，共计50000多个图像。该数据集覆盖了50个地理区域，对于地表覆盖制图技术的进展提供了坚实的基础
No 16. JARVIS：个人AI语音助手，实现了语音转文字、语言模型生成回复、文字转语音，并在Web界面中展示
No 17. [CL] Retrieval-Augmented Generation for Large Language Models: ......
No 18. 晚安～ [月亮]
No 19. 早！[太阳]
No 20. AI领域论文精选列表
No 21. [LG] A mathematical perspective on Transformers 提出一个分析Transformer的数学框架，并将其解释为相互作用的粒子系统。研究发现，在长时间内会出现聚类现象，这对于理解Transformer在学习任务中的机制具有重要意义。本文为数学家和计算机科学家提供了新的视角，将Transfo ......
No 22. Intel® Neural Compressor：Intel开源的神经压缩器，提供统一API，支持主流深度学习框架(如 TensorFlow、PyTorch、ONNX Runtime 和 MXNet)上的模型压缩技术，包括量化、剪枝、蒸馏和神经架构搜索
No 23. Suno AI：根据文本提示生成音乐
No 24. Oculante：用Rust编写的简约跨平台图片查看器，具有硬件加速和广泛的图片格式支持，旨在快速打开和加载图片，提供基本的编辑工具，并支持像素选择、位置和颜色值显示等功能，Oculante还支持图片序列的快速播放和像素信息的检查
No 25. 复杂检索增强生成(RAG)的技术考量
No 26. microagents: 具备自我编辑提示和Python编程能力的模块化agent库，探索了自进化agent的概念，无需用户提供特定的agent设计或提示，只需提出问题，系统就会创建并改进能提供答案的agent。agent之间通过向量相似性选择或创建，具有逐步改进的系统提示
No 27. 'ComfyUI Portrait Master 简体中文版 - 帮助AI图像创作者生成人像提示，可以根据不同的选项自定义生成的人像，包括性别、民族、眼睛颜色、发型等' ......
No 28. Calvin: 由LLM和Langchain驱动的聊天机器人，用于处理Google日历任务，使用Next.js、FastAPI和MongoDB构建，助手逻辑使用Langchain和OpenAI API开发
No 29. [CV]《StarVector: Generating Scalable Vector Graphics Code from Images》
No 30. [CL]《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》
No 31. tinyzero：轻松训练类似AlphaZero的智能体，适用于任意环境，该项目使用Python编写，提供了训练和评估智能体的功能
No 32. GPT-RAG：在Azure上运行的GPT-RAG核，利用Azure Cognitive Search进行检索，用Azure OpenAI大型语言模型来提供ChatGPT风格和问答体验
No 33. Llama-2微调指南
No 34. 英特尔平台上的7B大型语言模型——NeuralChat的演进
No 35. 《大规模语言模型：从理论到实践》
No 36. WhisperS2T：针对Whisper模型的优化语音转文本流水线，支持多个推理引擎
No 37. 大型多模态模型幻觉相关论文、方法和资源列表
No 38. GitHub最近抽的什么疯？不过就是几天的事：- 先是强制要求双重验证，可手机区号国家列表里没**🇨🇳却有**，让人非常气愤，用passkey勉强解决了；- ......
No 39. Mist：用于保护图像内容和风格的强大图像预处理工具，通过添加水印使图像难以被最先进的AI艺术应用模仿，Mist V2在效果上进行了增强，对更广泛的AI艺术应用具有更好的防御能力，特别是在Lora方面表现出色，支持GPU和CPU处理，仅需6GB显存即可高效运行
No 40. 终于解封了……似乎是因为我标star过多导致？5k+确实多了点，不过都是纯手动选择性star绝非Spam好吧？吃一堑长一智，下次肯定不能再放一个篮子里了 ......
No 41. [CV] Jack of All Tasks, Master of Many: Designing General-purpose ......
No 42. VLFeedback：用于大规模视觉语言模型的GPT-4V标注偏好数据集的标注框架，提供了多模态指令源，构建了包含12个大规模视觉语言模型的模型池
No 43. 2023：LLM元年
No 44. [CL]《Gemini: A Family of Highly Capable Multimodal Models》
No 45. 警惕科研高产的不利影响
No 46. whisper-standalone-win：Whisper和Faster-Whisper独立可执行文件(Windows)
No 47. 土堆 Pytorch
No 48. 今日推介(第1260期)：有限内存下的高效大语言模型推理、优化扩散噪声可以作为通用运动先验、面向几何推理的大模型系统评价、从图像生成SVG图形代码、Gemini高能多模态模型族 ......
No 49. [CV] Tracking Any Object Amodally 网页链接人们通常只关注可见的物体，忽视了对于部分遮挡物体的理解能力。本文提出一个大规模的模态跟踪基准数据集，用于评估物体的完整性和持续性的感知能力。通过引入模态扩展器模块，可以将标准的模态跟踪器转化为模态跟踪器。在人体跟踪任务中 ......
No 50. Akuma.ai：画画手残党的福音(内测中)

爱可可微博热门分享(1.15)

No 1. 来来来，说说你最常用的是哪几个？为什么？爱可可-爱生活的微博...
No 2. 开源语音合成(TTS)项目汇总：XTTS - 网页链接YourTTS - 网页链接FastSpeech2 - 网页链接VITS ......
No 3. 大型语言模型基础知识可视化学习指南
No 4. 每个AI/ML工程师都应该了解的Gen AI框架和工具
No 5. 理解和编写LLM中的自注意力、多头注意力、交叉注意力和因果注意力
No 6. 《AI 研发提效研究：自己动手训练 LoRA》
No 7. Surya：多语言文档OCR工具包，可进行准确的文本行检测，即将推出文本识别功能，以及表格和图表检测功能，可以处理各种类型的文档和多种语言
No 8. '中文对话0.2B小模型 ChatLM-Chinese-0.2B - 开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调' ......
No 9. 本地LLM运行指南
No 10. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 11. 'WechatAnnualReport - 微信聊天记录导出、微信年度报告生成' GitHub: github.com/chenyifanthu/WechatAnnualReport ......
No 12. Embedded Systems Engineering Roadmap：嵌入式系统工程师成长路线图(学习指南)
No 13. 算法交易回测教程
No 14. 最近试用了网易有道新推的Hi Echo，一款主打虚拟人的口语练习App，在目前的大模型落地应用中算是表现比较突出的，其设计理念体现了大模型个性化服务的精髓：用户可以根据自己的口语水平和学习阶段，选择不同难度的练习，确保了各种水平的学习者都能得到适合的训练。Hi ......
No 15. Local-Code-Interpreter：OpenAI的ChatGPT代码解释器（Code Interpreter或Advanced Data Analysis）的本地版，支持自定义环境、无需担心文件大小限制和网络问题、支持GPT-3.5和GPT-4模型、增强的数据安全性、支持Jupyter等
No 16. 我个人习惯用Poe，直读链接/PDF、引擎随心换、可定制Bot，结合非官方Python库还可以方便地自动化。引擎层面ChatGPT和Claude用最多，相比之下ChatGPT更“博学”，Claude更懂文字
No 17. TrustLLM: LLM(大型语言模型)可信度研究，包括对LLM可信度不同维度的原则制定、建立了六个维度的基准评估，涵盖了真实性、安全性、公平性、鲁棒性、隐私性和机器伦理等方面
No 18. metahuman-stream：基于ernerf模型的流式数字人，实现音视频同步对话。基本可以达到商用效果
No 19. AI Town - 基于RWKV智能体的AI小镇
No 20. 法学硕士应对此事件负责 😅
No 21. [LG]《Graph Q-Learning for Combinatorial Optimization》
No 22. 国内外新闻用机器翻译有很多陷阱要留个心眼不可尽信。比如英国科幻迷John在用Google Translation看超侠的成都世界科幻大会见闻录时就遇到了下面这个极端例子离了大谱的错误翻译。[笑cry]据说DeepL也不知道撸串的意思。
No 23. GPT4V-Image-Captioner / GPT4V图像打标器：用Gradio构建的多功能图像处理工具箱，可以使用GPT-4-vision API或cogVLM模型对图像进行标记，支持一键安装和使用、单图像和多图像批量标记、在线GPT4V和本地CogVLM模型选择、视觉标记分析和处理、图像预压缩、关键词过滤和水印图像识别等功能
No 24. 总结了关于大模型发展的一些观点和思考，欢迎大家补充讨论： - 国内AI大模型已经达到上百个，但真正有前途、有实力的还只是少数。 ......
No 25. 晚安～ [月亮]
No 26. [LG] A Comprehensive Survey on Vector Database: Storage and ......
No 27. 一不小心发现GitHub链接又能发了 [笑cry]//开源语音合成(TTS)项目汇总：XTTS - 网页链接YourTTS ......
No 28. KG-RAG：知识图谱检索增强生成框架，将知识图谱(KG)的显式知识与大型语言模型(LLM)的隐式知识结合起来
No 29. 几篇论文实现代码
No 30. [CV] Compressed 3D Gaussian Splatting for Accelerated Novel ......
No 31. 早！[太阳]
No 32. Citadel：电子书库管理工具，与Calibre向后兼容，其目标包括与Calibre兼容、提供良好的用户体验和高性能等
No 33. [CV]《U-Mamba: Enhancing Long-range Dependency for Biomedical Image Segmentation》
No 34. mamba.c：纯C语言推断Mamba模型，在CPU上的速度比pytorch更快
No 35. McAfee推出Mockingbird项目来阻止AI语音克隆诈骗
No 36. 关于生成式AI，技术领导者需要面对的5个残酷事实
No 37. 盲动态去模糊相关深度学习模型和基准数据集列表
No 38. [LG]《MoE-Mamba: Efficient Selective State Space Models with Mixture of Experts》
No 39. cutword：一个中文分词库，其字典文件根据最新数据统计得到，词频更加合理，分词速度是结巴分词的两倍
No 40. 企业如何使用生成式AI来防范ChatGPT泄露
No 41. [LG]《Secrets of RLHF in Large Language Models Part II: Reward Modeling》
No 42. pdf2md：将PDF转换成Markdown文件的JavaScript npm库
No 43. Text2X(文本到场景/3D/动作/4D/纹理等)相关资源大列表
No 45. [LG] Efficient LLM inference solution on Intel GPU 网页链接提出一种高效的基于Intel ......
No 46. Talk2Arxiv：使用ChatGPT让您能与任何ArXiv论文进行对话，利用RAG(检索增强生成)系统，通过解析PDF、文本嵌入和上下文相关性等技术，提供了一个交互式的聊天界面，让您能与论文进行对话和交流
No 47. 通过多智能体辩论的方式，改善语言模型对推理时对抗攻击的鲁棒性，减少模型生成的有毒响应，并通过嵌入聚类进行对抗提示内容分类，为实现模型的安全部署提供了新的方法和技术。//[CL]《Combating Adversarial Attacks with Multi-Agent Debate》
No 48. 探索了用图神经网络(GNN)通过强化学习(RL)训练来解决组合优化(CO)问题，通过学习逐步构建候选解的策略，取得了接近最先进方法的性能，同时减少了参数和训练时间。//[LG]《Graph Q-Learning for Combinatorial Optimization》
No 49. [CL]《Investigating Data Contamination for Pre-training Language Models》
No 50. [CL] A Philosophical Introduction to Language Models -- Part ......

爱可可微博热门分享(2.2)

No 1. ChatLLM.cpp：纯C++实现的库，提供了几...
No 2. '利用LLM构建应用实践笔记' GitHub: github.com/morsoli/llm-books
No 3. IntelliScraper：高级的Python网...
No 4. rtmlib：超轻量级的库，用于基于RTMPose模型进行姿态估计，无需mmcv、mmpose、mmdet等依赖，只需要numpy、opencv-python、opencv-contrib-python和onnxruntime
No 5. FONNX：一个 Flutter 库，用于运行 ONNX 模型，可以将 Pytorch、Tensorflow 等主流机器学习框架训练的模型轻松转换为 ONNX 格式，并可在 iOS、Android、Web、Linux、Windows 和 macOS 等平台上原生运行，无需进行任何修改
No 6. Constitutional AI：让LLM自我对齐
No 7. 'lzCloudSecurity - 《云安全攻防入门》
No 8. '天机 Tianji - SocialAI(来事儿AI)制作的一款免费使用、非商业用途的人工智能系统。您可以利用它进行涉及传统人情世故的任务，如如何敬酒、如何说好话、如何会来事儿等，以提升您的情商和'核心竞争能力'' ......
No 9. 中文CLIP模型
No 10. 2023年AI视频生成技术的飞速发展及2024年展望
No 11. Nomic Embed：最新的高性能全开源文本嵌入模型
No 12. MobileDiffusion是Google研究的...
No 13. 几篇论文实现代码
No 14. LLMs in Five Formulas：关于LLM的直觉教程
No 15. Hugging Face Datasets(huggingface.co/datasets)上共享数据集规模突破十万，涵盖了艺术、医学、生物学、法律、金融、音乐、化学、气候等多个领域，可以通过简单的搜索和过滤功能找到所需的数据集，可以按任务、大小、子任务、语言、许可证等进行分类和过滤 ......
No 16. MiniCPM: 面壁智能与清华大学自然语言处理实验室共同开源的系列端侧大模型，主体语言模型MiniCPM-2B仅有24亿(2.4B)的非词嵌入参数量
No 17. OLMo：AI2最新发布的开放语言模型新
No 18. 时间序列分割相关论文资源列表，时序分割作为一项关键的时间序列预处理技术，可以将难以理解的时间序列划分为若干离散且同质的片段，这种方法旨在揭示潜在的时间演化模式，检测意外的规律性和机制，从而使对海量时间序列数据的分析变得更加容易管理
No 19. [CV] Advances in 3D Generation: A Survey 3D生成方法取得了显著的进展，但要跟上最新的发展是具有挑战性的。在这项调查中，提供了对3D生成的综合概述，包括方法、数据集和应用。介绍了不同的3D表示方法，讨论了各种生成方法，并根据算法范式进行了分类。还强调了该领域面临 ......
No 20. 高质量的GPU编程/架构资源
No 21. 科学大语言模型(Sci-LLM)集锦
No 22. contrastors：对比学习工具包，让研究人员和工程师能够高效地训练和评估对比模型
No 23. 晚安～ [月亮]
No 24. 人形机器人学习相关资源列表
No 25. OmniLMM：面向图文理解的开源多模态大模型系列。该系列模型接受图像和文本输入，并提供高质量的文本输出。目前发布了OmniLMM-12B和OmniLMM-3B两个版本
No 26. Infini-gram在线Demo，Infini-gram引入了一个新的无限n-gram语言模型，并开发了一个名为infini-gram的引擎，该引擎使用后缀数组，可以在推理过程中快速计算n-gram计数，其在下一Token预测中具有相当高的准确率(47%)，并且可以补充神经大型语言模型，大大降低其语言建模困惑度
No 27. SUPIR是一个创新的图像修复工具，它利用AI的能力，可以实现高保真的通用图像修复。SUPIR的文本驱动智能修复和多样化应用场景使其成为一个有潜力的工具，能满足不同用户在图像修复方面的需求
No 28. 史料RAG：用向量数据库基于RAG(检索增强生成)方式搭建一个**历史问答应用，接受用户的询问，从历史语料库中检索相关的历史资料片段，利用大语言模型给出较为可靠的回答
No 29. Google Bard的Gemini Pro最新升级
No 30. 'VSET - Video SuperResolution Encode Tool - 基于Vapoursynth的图形化视频批量压制处理工具，超分辨率，补帧，vs滤镜一应俱全' ......
No 31. [CL]《Multipath parsing in the brain》
No 32. MiniSearch：极简网络搜索应用，具有始终可用的 AI 助手，可直接在浏览器中运行，使用 Web-LLM、Transformers.js 和 SearXNG构建
No 33. [CV] Semantic Anything in 3D Gaussians 介绍了一种基于3D高斯建模的目标分割方法，称为SA-GS。该方法通过交互式过程，在3D高斯表示中实现目标分割，无需任何训练过程和学习参数。通过点击输入视图中的点，SA-GS可以通过多视图蒙版生成和视图智能标签分配方法来实现3D一致的 ......
No 34. [CV] Anything in Any Scene: Photorealistic Video Object Insertion ......
No 35. [CV] YOLO-World: Real-Time Open-Vocabulary Object Detection ......
No 36. [LG]《Grounded language acquisition through the eyes and ears of a single child》
No 37. [CV] MobileDiffusion: Subsecond Text-to-Image Generation ......
No 38. [CL]《Infini-gram: Scaling Unbounded n-gram Language Models to a Trillion Tokens》
No 39. Lockbox：正向代理服务器(forward proxy)，用于执行第三方API调用
No 40. 主流AI模型上MLOps引擎、框架和语言的性能比较
No 41. OpenAOE：基于 OpenAI 的聊天开源框架...
No 42. 早！[太阳]
No 43. [CL]《Efficient Tool Use with Chain-of-Abstraction Reasoning》
No 44. 今日推介(第1303期)：将无限n-gram语言模型扩展到万亿级Tokens、大脑的(句法)多路解析、基于链式抽象推理的高效工具使用、通过单个儿童的眼睛和耳朵进行接地语言习得、四足机器人高速免碰撞运动学习 ......
No 45. [CV] ReplaceAnything3D:Text-Guided 3D Scene Editing with ......
No 46. 早！[太阳]
No 47. 提出一种学习型控制框架，名为'Agile But Safe (ABS)'，通过敏捷策略和恢复策略的协同工作，实现了高速和无碰撞导航，克服了现有方法中敏捷性和安全性之间的困境。//[RO]《Agile But Safe: Learning Collision-Free High-Speed Legged Locomotion》
No 48. [CL]《Scaling Sparse Fine-Tuning to Large Language Models》
No 49. Meta发布Code Llama 70B，用于代码生成的LLM的新的、性能更高的版本，与之前的 Code Llama ......
No 50. AI-视频裁剪器是一个功能强大的工具，旨在通过对视频进行智能分析，提取最吸引人的片段并裁剪它们来帮助内容创作者、播客爱好者和视频爱好者轻松地从视频中提取引人入胜的部分，该工具利用先进的语言模型 GPT-4，能够智能地分析视频文字记录，识别最受欢迎和最激动人心的时刻

爱可可微博热门分享(12.25)

No 1. '独立开发者出海之路' GitHub: github.com/hua1995116/indiehackers-steps ......
No 2. Matplotlib隐藏技巧：让Jupyter Notebook中绘制的plot图表在缩放时能保持高质量
No 3. [LG] Harmonics of Learning: Universal Fourier Features Emerge ......
No 4. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 5. AI-Employe：基于GPT-4 Vision的可靠浏览器自动化工具，以教授人类的方式进行操作，是目前最可靠的AI首选自动化工具
No 6. 2023进度：▓▓▓▓▓▓▓▓▓▓▓▓▓▓░ 98%
No 7. LLaMA-MoE: 基于LLaMA和SlimPajama的MoE模型
No 8. 大型语言模型(LLM)加速全面指南
No 9. 大型语言模型(LLM)可解释性相关资源列表
No 10. Amphion: 音频、音乐和语音生成的工具包，旨在支持可复现的研究，帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究和开发，提供经典模型或架构的可视化特性，有助于初级研究人员和工程师更好地理解模型
No 11. 生成式AI与游戏
No 12. LLM Distillation Playbook：关于如何有效蒸馏大型语言模型的最佳实践实用指南，提供了一系列的最佳实践，帮助工程师和机器学习从业者在生产应用中更高效地蒸馏和使用语言模型
No 13. Intel® Extension for Transformers：在Intel CPU上实现LLM快速推断
No 14. 苹果在2022年10月隐秘发布的开源多模态大语言模型Ferret
No 15. Marigold深度估计模型
No 16. 把www.arxiv.org改成www.talk2arxiv.org可直接针对论文内容进行问答（需要自备OpenAI key）
No 17. AnyDoor：零样本对象级图像定制
No 18. llamafile：单文件LLM
No 19. [LG]《Using Sequences of Life-events to Predict Human Lives》
No 20. RQABench: 开源检索问答基准工具，用于评估检索增强生成(RAG)系统，具有灵活性、可复现性和可追溯性等特点
No 21. Roadmap To Learn Generative AI In 2024：学习生成式AI学习路线图，包括学习Python编程、基本机器学习和自然语言处理、深度学习、高级NLP概念以及生成式AI入门等内容，还提供了相关的向量数据库和存储以及LLM项目的部署方法
No 22. Otter：基于S3-FIFO算法的超快的内存缓存库，用Go语言实现，比Ristretto等其他库快几倍，具有简单的API、自动配置、泛型支持、TTL过期、基于成本的驱逐和出色的性能等特点
No 23. [CL]《What does self-attention learn from Masked Language Modelling?》
No 24. TorchCP：基于PyTorch的深度学习模型的保形预测研究的Python工具箱，实现了一些代表性的分类和回归方法，基于AdverTorch构建
No 25. [LG]《Learning to Act without Actions》
No 26. ReByte：AI应用全流程开发平台，通过绘制和描述来创建Web应用和聊天应用
No 27. [CL]《LoRAMoE: Revolutionizing Mixture of Experts for Maintaining World Knowledge in Language Model Alignment》
No 28. Open Assistant Conversations Dataset Release 2 (OASST2)：开放助手对话数据集
No 29. Skylar Email Client：开源电子邮件客户端，旨在提供快速、安全和高度可定制的邮件体验，专注于简化邮件处理过程，解决常见问题，如配置GitHub邮件过滤器和查找退订按钮
No 30. 创建通用AI爬虫
No 31. LoRAMoE是一种插件化的混合专家(MoE)方法，通过冻结主干模型的参数并使用本地化平衡约束来保持世界知识的完整性，并在下游任务上提供额外的性能优势。//[CL]《LoRAMoE: Revolutionizing Mixture of Experts for Maintaining World Knowledge in Language Model Alignment》
No 32. 通过对人生事件序列的建模和预测，利用大规模数据和强大的机器学习算法实现了准确预测个体生命轨迹和个性特点的能力，揭示了生活事件之间的非平凡相互作用。//[LG]《Using Sequences of Life-events to Predict Human Lives》
No 33. 新手LLM训练详细指南
No 34. [CL] Learning adaptive planning representations with natural ......
No 35. 《Python Cookbook》(第三版) 中文版 (在线)
No 36. None
No 37. 晚安～ [月亮]
No 38. [AS] StyleSinger: Style Transfer for Out-Of-Domain Singing ......
No 39. [CV] Wired Perspectives: Multi-View Wire Art Embraces Generative ......
No 40. [CV] TinySAM: Pushing the Envelope for Efficient Segment Anything ......
No 41. JoyTag：开源图像标注模型，专注于积极性和包容性，使用了Danbooru标注方案，适用于从手绘到摄影等各种类型的图像。模型基于ViT-B/16架构，训练了660M个样本，具有5000+个标签。通过输入图像，可以输出对5000多个不同标签的预测结果
No 42. 比llama.cpp快12倍！PowerInfer: 在消费级GPU上进行高速大型语言模型服务，其目标是提供一种利用普通PC上的消费级GPU进行高效语言模型服务的解决方案
No 43. 今日推介(第1264期)：通过没有动作标记的视频学习潜在行为和策略、大型语言模型在代码转换时引入bug的研究、自注意力从掩码语言建模中学到了什么、在语言模型对齐中保持世界知识的新型混合专家、用日常事件序列预测人生轨迹 ......
No 44. 早！[太阳]
No 45. Texify：将数学公式图片转换为markdown/LaTeX格式，具有OCR功能，可以处理内联和块级数学公式
No 46. [LG]《Autonomous Chemical Research With Large Language Models》
No 47. 新书：《机器学习训练数据》
No 48. hf-mirror.com - Huggingface 镜像站
No 49. Enchanted：与手机上的Ollama对话的iOS应用程序，用于与私有自托管的语言模型(如Llama2、Mistral或Vicuna)进行聊天，使用的是Ollama，支持最新的Ollama Chat API，有黑暗/亮度模式、对话历史记录存储在设备上、支持Markdown格式、语音提示和图片附件等
No 50. [CV] DREAM-Talk: Diffusion-based Realistic Emotional Audio-driven ......

爱可可老师一周热门分享

爱可可微博热门分享(1.13)

No 1. 最近试用了网易有道新推的Hi Echo，一款主打虚拟人的口语练习App，在目前的大模型落地应用中算是表现比较突出的，其设计理念体现了大模型个性化服务的精髓：用户可以根据自己的口语水平和学习阶段，选择不同难度的练习，确保了各种水平的学习者都能得到适合的训练。Hi ......
No 2. 拖延症患者既能用8小时搞定半小时的活，也能用半小时搞定8小时的活。
No 3. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 4. Perfect Roadmap To Learn Data Science In 2024：关于学习数据科学的新版路线图，包括深入学习Python编程语言，统计学，数据库，机器学习，深度学习，自然语言处理以及MLOPS(机器学习运维)，提供了广泛的学习资源和实际项目实践，是学习数据科学的理想指南
No 5. AnimateAnyone复现，让给定人物动起来——将静态图像转换为生动、可控的视频序列，从而彻底改变角色动画
No 6. 给年轻人的一些建议
No 7. Maybe: 开源个人财务管理应用，提供包括净值跟踪、金融账户同步、投资基准比较、投资组合分配、债务洞察、退休规划、投资回报模拟以及手动账户/投资跟踪等功能
No 8. 大语言模型(LLM)相关资源列表
No 9. AMIE医疗诊断对话AI系统
No 10. SeamlessExpressive：高质量的语音到语音翻译，在翻译输出中保持原始说话者的声音风格、语气和独特的表达方式
No 11. Surya：多语言文档OCR工具包，可进行准确的文本行检测，即将推出文本识别功能，以及表格和图表检测功能，可以处理各种类型的文档和多种语言
No 12. '一劳永逸':自动化实验室利用AI和机器人改进蛋白质
No 13. KG-RAG：知识图谱检索增强生成框架，将知识图谱(KG)的显式知识与大型语言模型(LLM)的隐式知识结合起来
No 14. 图解：API vs. SDK
No 15. skfolio：用于投资组合优化的Python库，建立在Scikit-Learn之上
No 16. [CL]《Transformers are Multi-State RNNs》
No 17. CurlyQ：一个命令行工具，用于简化curl和网页抓取操作，提供了一个简单的界面，支持提取图像和链接、使用CSS选择器或XPath查找元素、获取详细的头信息等附加功能
No 18. Reverse Engineering Resources：关于逆向工程的资源集合，旨在帮助人们从零开始学习逆向工程，包含了高质量的学习资源，涵盖了汇编、操作系统内部、反混淆、反调试等多个领域，包括详细的学习路线、针对不同操作系统的指南、汇编项目示例以及关于逆向工程的博客推荐
No 19. TrustLLM: LLM(大型语言模型)可信度研究，包括对LLM可信度不同维度的原则制定、建立了六个维度的基准评估，涵盖了真实性、安全性、公平性、鲁棒性、隐私性和机器伦理等方面
No 20. 晚安～ [月亮]
No 21. None
No 22. VTable：高性能的多维数据分析表格，不仅能处理百万级数据的快速运算和渲染，还提供强大的图形能力，能自动分析和呈现多维数据
No 23. 星辰语义大模型-TeleChat：由中电信人工智能科技有限公司研发训练的大语言模型，采用1.5万亿 Tokens中英文高质量语料进行训练
No 24. Replace Anything：一个简单的网络应用程序，允许用基于描述生成的图像替换图像的任意部分
No 25. 关于GPT-3.5-turbo-instruct的国际象棋对战测试工具，可以让两个模型互相对战，无论是LLM对Stockfish，LLM对LLM，还是Stockfish对Stockfish，目标是测试和记录这些模型在不同配置下的性能，包括违规移动、认输以及游戏状态，并记录以供后续分析
No 26. 让AI模型“遗忘”训练数据以保护隐私
No 27. [CV] PALP: Prompt Aligned Personalization of Text-to-Image ......
No 28. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 29. Wordflow：社交化、可定制的AI写作助手，可以轻松创建和运行不同的大型语言模型(例如GPT 4和Gemini Pro)的AI提示。用户还可以在社区中发现和分享自己喜欢的提示。特点包括存储和运行喜爱的AI提示、支持多个AI模型、强大的定制化功能以及社区提示的发现和分享
No 30. spin：在本地复制生产环境，用Docker轻松运行并配置，可以在不同操作系统上运行，包括MacOS、Windows和Linux，通过简单的配置文件实现基础设施的集中管理
No 31. 几篇论文实现代码
No 32. 今日推介(第1283期)：Transformer是多状态RNN、混合专家语言模型专家终极专业化探索、洞悉语言模型隐藏表示的统一框架、从数百万视频中提炼视觉语言模型、会话诊断人工智能探索 ......
No 33. Babagaboosh：一个简单的应用，允许你与OpenAI的GPT 4进行口头对话
No 34. 提出DeepSeekMoE架构，通过细粒度专家分割和共享专家隔离，实现了更高水平的专家专业化和性能，突破了现有MoE架构的限制。
No 35. [CL]《Towards Conversational Diagnostic AI》
No 36. [CL] Spike No More: Stabilizing the Pre-training of Large Language ......
No 37. 介绍了一种基于大型语言模型的医学人工智能系统AMIE，通过模拟对话环境和自动化反馈机制，提高了医学诊断的准确性和效率，在与初级医疗提供者的对比中表现出色。//[CL]《Towards Conversational Diagnostic AI》
No 38. Anim-400K: 大规模的视频配音数据集，包含了英语和日语两种语言的音视频剪辑，由超过425,000个对齐的剪辑(763小时)组成，涵盖了190多种不同的作品，涵盖了数百个主题和流派
No 39. [CL]《Patchscope: A Unifying Framework for Inspecting Hidden Representations of Language Models》
No 40. JaxIRL：在JAX中实现反向强化学习(IRL)算法的，可以以极高的效率训练模型
No 41. Parrot: Pareto-optimal Multi-Reward Reinforcement Learning ......
No 42. cutword：一个中文分词库，其字典文件根据最新数据统计得到，词频更加合理，分词速度是结巴分词的两倍
No 43. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 44. [CL]《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》
No 45. [CV]《Distilling Vision-Language Models on Millions of Videos》
No 46. 通过微调图像-语言模型并使用自动生成的标注进行训练，在视频-语言任务上取得出色性能，实现了对之前未见视频的准确描述。//[CV]《Distilling Vision-Language Models on Millions of Videos》
No 47. Talk2Arxiv：使用ChatGPT让您能与任何ArXiv论文进行对话，利用RAG(检索增强生成)系统，通过解析PDF、文本嵌入和上下文相关性等技术，提供了一个交互式的聊天界面，让您能与论文进行对话和交流
No 48. ‘国内用户 HuggingFace 高速下载 - 利用HuggingFace的官方下载工具从镜像网站进行高速下载' ......
No 49. LLMClient：用于构建RAG + 推理 + 函数调用代理 + LLM智能体 + 追踪 + 日志记录的简单库
No 50. 'Panda中文开源大语言模型 - 开源的海外中文大语言模型项目，致力于探索大模型时代的技术栈，推动中文自然语言处理领域的创新和合作' ......

爱可可微博热门分享(12.26)

No 1. 提示工程课程(中文)
No 2. '独立开发者出海之路' GitHub: github.com/hua1995116/indiehackers-steps ......
No 3. llamafile：单文件LLM
No 4. 提示工程速查(思维导图)
No 5. 免费教材《图，算法与应用》
No 6. Time to code [坏笑]
No 7. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 8. Aurora：中文版MoE模型，具有强大的自然语言处理能力，基于Mixtral-8x7B的进一步工作，激活了该模型在中文开放域的聊天能力
No 9. 开源书：开源AI指南
No 10. 早！[太阳]
No 11. 股票市场新机器生态的崛起
No 12. 大型语言模型(LLM)加速全面指南
No 13. [CV] TinySAM: Pushing the Envelope for Efficient Segment Anything ......
No 14. PromptBench：用于评估和理解大型语言模型的统一评估框架，提供了用户友好的API，方便研究人员进行模型性能评估、提示工程和对抗提示攻击评估等
No 15. Comflowy - ComfyUI 社区：致力于打造更优质的生产工具和构建开发者与用户内容社区，提供系统化的Stable Diffusion和ComfyUI教程，以及互动讨论的Discord社群
No 16. LLaMA-MoE: 基于LLaMA和SlimPajama的MoE模型
No 17. Matplotlib隐藏技巧：让Jupyter Notebook中绘制的plot图表在缩放时能保持高质量
No 18. [LG] A Mathematical Guide to Operator Learning 算子学习旨在从数据中发现底层动力学系统或偏微分方程的属性。本文提供了一份关于算子学习的逐步指南。解释了适合运算符学习的问题和偏微分方程类型，讨论了各种神经网络架构，并解释了如何有效地使用数值偏微分方程求解器。 ......
No 19. [LG] Harmonics of Learning: Universal Fourier Features Emerge ......
No 20. 晚安～ [月亮]
No 21. 新手LLM训练详细指南
No 22. Mixtral-8x7B-Instruct的4-bit量化版模型
No 23. SillyTavern MultiPlayer (STMP)：多用户LLM聊天界面，允许多个用户之间以及与AI一起聊天
No 24. Marigold深度估计模型
No 25. [LG]《Using Sequences of Life-events to Predict Human Lives》
No 26. 2023进度：▓▓▓▓▓▓▓▓▓▓▓▓▓▓░ 98%
No 27. LLM Distillation Playbook：关于如何有效蒸馏大型语言模型的最佳实践实用指南，提供了一系列的最佳实践，帮助工程师和机器学习从业者在生产应用中更高效地蒸馏和使用语言模型
No 28. 今日推介(第1265期)：基于参数高效微调的LLM文本输入可扩展个性化、开放世界文本到动作生成探索、基于神经流图的流体仿真、结合AlphaFold和对称对接精确预测蛋白质组装结构、从高阶统计中高效学习 ......
No 29. [CV] Atlantis: Enabling Underwater Depth Estimation with Stable ......
No 30. 通过个性化大型语言模型(LLM)，提高缩写扩展的预测准确性和用户体验，其中提示微调方法表现最好，具有高效和可扩展性。
No 31. 把www.arxiv.org改成www.talk2arxiv.org可直接针对论文内容进行问答（需要自备OpenAI key）
No 32. [CL]《Parameter Efficient Tuning Allows Scalable Personalization of LLMs for Text Entry: A Case Study on Abbreviation Expansion》
No 33. [CV] PICTURE: PhotorealistIC virtual Try-on from UnconstRained ......
No 34. Roadmap To Learn Generative AI In 2024：学习生成式AI学习路线图，包括学习Python编程、基本机器学习和自然语言处理、深度学习、高级NLP概念以及生成式AI入门等内容，还提供了相关的向量数据库和存储以及LLM项目的部署方法
No 35. [LG]《Learning from higher-order statistics, efficiently: hypothesis tests, random features, and neural networks》
No 36. RAG-Survey：大型语言模型检索增强生成(RAG)相关文献资源列表
No 37. Amphion: 音频、音乐和语音生成的工具包，旨在支持可复现的研究，帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究和开发，提供经典模型或架构的可视化特性，有助于初级研究人员和工程师更好地理解模型
No 38. 研究了神经网络从高阶统计中提取特征的效率，并与随机特征进行比较，揭示了神经网络在学习高阶统计中的高效性。
No 39. [CV]《Plan, Posture and Go: Towards Open-World Text-to-Motion Generation》
No 40. [GR]《Fluid Simulation on Neural Flow Maps》
No 41. [LG] Diffusion Bridge Mixture Transports, Schrödinger Bridge ......
No 42. dbeel：分布式的thread-per-core式文档数据库，采用Rust语言编写
No 43. Enchanted：与手机上的Ollama对话的iOS应用程序，用于与私有自托管的语言模型(如Llama2、Mistral或Vicuna)进行聊天，使用的是Ollama，支持最新的Ollama Chat API，有黑暗/亮度模式、对话历史记录存储在设备上、支持Markdown格式、语音提示和图片附件等
No 44. Intel® Extension for Transformers：在Intel CPU上实现LLM快速推断
No 45. [LG]《Learning to Act without Actions》
No 46. LoRAMoE是一种插件化的混合专家(MoE)方法，通过冻结主干模型的参数并使用本地化平衡约束来保持世界知识的完整性，并在下游任务上提供额外的性能优势。//[CL]《LoRAMoE: Revolutionizing Mixture of Experts for Maintaining World Knowledge in Language Model Alignment》
No 47. 苹果在2022年10月隐秘发布的开源多模态大语言模型Ferret
No 48. 《大规模语言模型：从理论到实践》
No 49. 《Python Cookbook》(第三版) 中文版 (在线)
No 50. JoyTag：开源图像标注模型，专注于积极性和包容性，使用了Danbooru标注方案，适用于从手绘到摄影等各种类型的图像。模型基于ViT-B/16架构，训练了660M个样本，具有5000+个标签。通过输入图像，可以输出对5000多个不同标签的预测结果

爱可可微博热门分享(12.22)

No 1. #免费##抽奖# 携手@博文视点Broadview 送出5本《智能分析：ChatGPT+Excel+Python超强组合玩转数据分析》
No 2. 新书：《机器学习训练数据》
No 3. 把www.arxiv.org改成www.talk2arxiv.org可直接针对论文内容进行问答（需要自备OpenAI key）
No 4. 新手LLM训练详细指南
No 5. LangChain的2023AI发展状况总结
No 6. Sam Altman关于创业的教训和建议
No 7. LLM架构的未来
No 8. 《Python Cookbook》(第三版) 中文版 (在线)
No 9. 傅立叶变换交互指南
No 10. 创建通用AI爬虫
No 11. AgentSearch [ΨΦ]: 面向Agent的功能强大的搜索引擎，可以在本地运行或通过远程API连接，适用于大型语言模型(LLM)和人类用户，提供超过十亿个来自Creative Commons、Arxiv、维基百科和Project Gutenberg等多样化来源的高质量嵌入
No 12. 预防反社会机器人风险
No 13. 由GPT驱动的化学专业机器人可自行设计反应并制造药物
No 14. AppAgent：开源Agent框架，用于操作智能手机应用，具有学习能力，可以通过自主探索或观察人工演示来学习操作新的应用，并生成知识库以执行复杂任务，该框架通过简化的动作空间模拟人类交互，无需后端访问，适用于各种应用
No 15. '程序员应该访问的最佳网站(中文版)，提供了丰富的资源和知识，适合程序员学习和提升技能’ Guangning ......
No 16. JoyTag：开源图像标注模型，专注于积极性和包容性，使用了Danbooru标注方案，适用于从手绘到摄影等各种类型的图像。模型基于ViT-B/16架构，训练了660M个样本，具有5000+个标签。通过输入图像，可以输出对5000多个不同标签的预测结果
No 17. [CV]《Generative Multimodal Models are In-Context Learners》
No 18. Texify：将数学公式图片转换为markdown/LaTeX格式，具有OCR功能，可以处理内联和块级数学公式
No 19. 2023生成式AI发展回顾
No 20. 用LlamaIndex本地运行Mixtral 8x7模型
No 21. arXiv现提供HTML格式的论文，浏览更方便，更易于屏幕阅读器和其他辅助技术准确地阅读
No 22. 晚安～ [月亮]
No 23. 早！[太阳]
No 24. FLAIR - 遥感图像分割数据集，包括超过200亿个高分辨率航空影像的像素级标注，以及对应的19个语义类别。此外，还提供了10个光谱波段的高分辨率Sentinel-2卫星图像，共计50000多个图像。该数据集覆盖了50个地理区域，对于地表覆盖制图技术的进展提供了坚实的基础
No 25. 用“可解释”AI找到新型抗生素
No 26. hf-mirror.com - Huggingface 镜像站
No 27. LLM Distillation Playbook：关于如何有效蒸馏大型语言模型的最佳实践实用指南，提供了一系列的最佳实践，帮助工程师和机器学习从业者在生产应用中更高效地蒸馏和使用语言模型
No 28. Autonomous GIS: 自动地理信息系统(GIS)，利用大型语言模型(LLM)进行空间问题的自动数据收集、分析和可视化，采用GPT-4 API，在Python环境中实现了自动生成、自组织、自验证、自执行和自增长的自主GIS
No 29. [CV] Splatter Image: Ultra-Fast Single-View 3D Reconstruction ......
No 30. [CV] UniSDF: Unifying Neural Representations for High-Fidelity ......
No 31. 《大规模语言模型：从理论到实践》
No 32. [CL]《Learning and Forgetting Unsafe Examples in Large Language Models》
No 33. XL Textual Inversion for Stable Diffusion XL 1.0 SDXL on a 24 GB GPU：实现文本逆向的项目，特色是能将输入的图像转化为可用于生成艺术品的概念(Embedding)，适用于Stable Diffusion XL 1.0
No 34. 新书《公平与机器学习：局限与机会》：一本介绍公平和机器学习领域最新工作的教材，从多个学科视角探讨了自动化决策的机会和风险，并提供了一套新的解决方案。本书涵盖了评估机器学习模型公平性的统计和因果度量，以及与公平性相关的决策制定过程和实质性方面，包括对歧视的法律和哲学观点的回顾
No 35. PenX：结构化的个人笔记应用，着重于保护隐私，采用端到端加密来同步数据，代码开源可信
No 36. 比llama.cpp快12倍！PowerInfer: 在消费级GPU上进行高速大型语言模型服务，其目标是提供一种利用普通PC上的消费级GPU进行高效语言模型服务的解决方案
No 37. 英特尔平台上的7B大型语言模型——NeuralChat的演进
No 38. AI领域论文精选列表
No 39. DSFormer是一种用于压缩Transformer模型的替代分解方案，通过使用小的稠密矩阵和半结构稀疏矩阵的乘积来更有效地压缩模型，并通过新的STF算法实现了更好的准确性。
No 40. [CL] Retrieval-Augmented Generation for Large Language Models: ......
No 41. GitHub最近抽的什么疯？不过就是几天的事：- 先是强制要求双重验证，可手机区号国家列表里没**🇨🇳却有**，让人非常气愤，用passkey勉强解决了；- ......
No 42. [LG]《PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU》
No 43. 提出PowerInfer，一种在个人电脑上使用消费级GPU进行高速LLM推理的引擎，通过利用LLM推理中的高局部性特征和GPU-CPU混合推理引擎的设计，显著提高了推理速度并降低了资源需求。//[LG]《PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU》
No 44. 今日推介(第1261期)：基于稠密-稀疏权重分解的文本Transformer高效压缩、大型语言模型不安全示例的学习和遗忘、基于上下文修剪的高效大型语言模型、具有强大多模态上下文学习能力的大规模生成式多模态模型、使用消费级GPU的快速大型语言模型 ......
No 45. [CL]《Mini-GPTs: Efficient Large Language Models through Contextual Pruning》
No 46. tinyzero：轻松训练类似AlphaZero的智能体，适用于任意环境，该项目使用Python编写，提供了训练和评估智能体的功能
No 47. [LG] A mathematical perspective on Transformers 提出一个分析Transformer的数学框架，并将其解释为相互作用的粒子系统。研究发现，在长时间内会出现聚类现象，这对于理解Transformer在学习任务中的机制具有重要意义。本文为数学家和计算机科学家提供了新的视角，将Transfo ......
No 48. 复杂检索增强生成(RAG)的技术考量
No 49. PyTorch Frame：为PyTorch设计的深度学习框架，专门用于处理异构表格数据，支持各种列类型，包括数值、分类、时间、文本和图像，框架提供了模块化的架构，实现了多种先进的深度表格模型，并提供了用户友好的小批量加载器、基准数据集和自定义数据集集成接口
No 50. 《‍⁡‌‍‌⁤‍⁢⁤⁢⁣⁢⁡⁡‍⁡⁣⁢⁤‌⁣⁤‍⁣‌⁤⁤‍⁡⁢⁢OpenAI：GPT 最佳实践中文大白话版本.pdf - 飞书云文档》

爱可可微博热门分享(1.18)

No 1. Chinese-Mixtral-8x7B：中文Mixtral-8x7B，基于Mistral发布的模型Mixtral-8x7B进行了中文扩词表增量预训练
No 2. #抽奖# #赠书# 携手@图灵新知 @图灵文化送出5本《智能文本处理实战》
No 3. Draw2Img：一个简单的Web用户界面，用于交互式文本引导的图像生成，适用于任何年龄和技能水平
No 4. 2024机器学习书单
No 5. AI文本生成的采样技术：从温度到结构化输出的全面指南
No 6. [LG] A Survey on Statistical Theory of Deep Learning: Approximation, ......
No 7. Gigastep：每秒可进行10亿步的多智能体强化学习框架
No 8. 最近试用了网易有道新推的Hi Echo，一款主打虚拟人的口语练习App，在目前的大模型落地应用中算是表现比较突出的，其设计理念体现了大模型个性化服务的精髓：用户可以根据自己的口语水平和学习阶段，选择不同难度的练习，确保了各种水平的学习者都能得到适合的训练。Hi ......
No 9. 数字人对话系统 - Linly-Talker：将大...
No 10. [LG]《Solving olympiad geometry without human demonstrations》
No 11. Cubzh：一个在线平台，用C/C++和Lua编写，允许用户使用与Lua脚本配对的立方体创建物品、环境和游戏。它受到Roblox和Minecraft的启发，具有易于使用的脚本环境和免费的服务器，可进行即时多人游戏，旨在释放类似Roblox中所见的创造力
No 12. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 13. Jute：用于交互式计算的本地笔记本，通过双击打开...
No 14. 面向无人驾驶的视觉基础模型相关文献资源列表
No 15. gptstore-prompts：GPTStore上的100个热门GPTs提示，可以利用这些提示来学习和改进提示工程，学习如何构建最好、最受欢迎的 GPTS
No 16. HuixiangDou：“茴香豆”，基于LLM的领域知识助手，特点包括应对群聊复杂场景、解答用户问题避免消息泛滥、提供一套解答技术问题的算法流程以及低成本部署
No 17. 图/几何机器学习2024回顾与展望之理论与架构
No 18. 来来来，说说你最常用的是哪几个？为什么？爱可可-爱生活的微博...
No 19. Daily Newsletter for 🤗 Daily Papers：每天都会发送一封新闻简报，内容来自🤗 Daily Papers，发送时间是每天的0点20分
No 20. Marlin：混合自回归线性核(Mixed Auto-Regressive Linear kernel)，一个经过高度优化的FP16xINT4矩阵乘法核，用于LLM推理，可以在批量大小为16-32个token的情况下实现接近理想的约4倍加速
No 21. [CV] Scalable Pre-training of Large Autoregressive Image Models ......
No 22. 《AlphaGeometry: An Olympiad-level AI system for geometry - Google DeepMind》
No 23. VectorHub：免费的、开源的学习网站，面向有意将向量检索加入到机器学习栈的开发人员
No 24. [CL] Unlocking Efficiency in Large Language Model Inference: ......
No 25. 含噪数据的平滑
No 26. [CL]《Extending LLMs' Context Window with 100 Samples》
No 27. Large Language Models Play StarCraft II: 支持大型语言模型(LLM)玩StarCraft II的纯语言环境，开发了TextStarCraft II文本环境，提出一种多级摘要方法，用于处理原始观察数据、分析游戏信息、提供命令建议和生成战略决策，实验证明LLM智能体能在Harder(Lv5)难度级别下击败内置AI
No 28. [CL]《PRewrite: Prompt Rewriting with Reinforcement Learning》
No 29. Privy：注重隐私的编程助手，可在本地系统上运行候选平台的LLM(语言模型)，可以选择Mistral、CodeLLama等热门的LLM。安装Privy扩展可以从Visual Studio Code Marketplace或Open VSX Registry进行
No 30. 几篇论文实现代码
No 31. Inferflow：高效且高度可配置的大型语言模型(LLM)推理引擎。可以通过简单修改配置文件中的几行内容，而无需编写源代码，来为大多数常见的Transformer模型提供服务
No 32. SciDataFlow：科研数据流管理工具
No 33. [CL]《Fine-grained Hallucination Detection and Editing for Language Models》
No 34. Open TTS Tracker：开放TTS语音合成引擎大列表
No 35. Byzer-LLM：基于 Ray 的 LLM 全生命周期解决方案，包括预训练、微调、部署和服务，支持 Python/SQL API，基于 Ray，易于扩展
No 36. 'WechatAnnualReport - 微信聊天记录导出、微信年度报告生成' GitHub: github.com/chenyifanthu/WechatAnnualReport ......
No 37. 晚安～ [月亮]
No 38. TPOT2 ALPHA：用遗传编程来优化机器学习流水线的Python自动化机器学习工具，TPOT(Tree-based Pipeline Optimization Tool)的重写版本，增加了对基于图的流水线和其他参数的支持，以更好地指定所需的搜索空间
No 39. Towards Understanding the Correlation between LLM Benchmarks：探索LLM评估与人工标注之间的相关性，以期能兼得廉价和与人工评估的高相关性
No 40. GitChat：搜索和回答关于GitHub存储库问题的聊天机器人
No 41. LLMPlus：允许Python开发者使用不同的大型语言模型(LLM)并通过简单的界面进行提示工程，提供了加载LLM模型、嵌入模型和向量数据库的类，以创建带有自己的提示工程和RAG技术的LLM应用
No 42. AlphaGeometry通过大规模合成数据和神经符号系统，成功地在奥林匹克几何定理证明领域超越了人类平均水平，展示了无需人工示范的自动推理能力。//[LG]《Solving olympiad geometry without human demonstrations》
No 43. Fluid Database：可以根据摄取的数据更新其架构的“流体”自适应数据库，支持以自然语言以及半结构化格式输入数据，既支持传统查询语言，也支持直观的自然语言查询
No 44. SGLang：为大型语言模型(LLM)设计的结构化...
No 45. 近年来AI发展里程碑论文集锦： - Transformers: Attention is All You Need 提出了Transformer模型，完全基于注意力机制，摒弃了以往模型依赖的递归和卷积结构，为自然语言处理领域带来了革命性的影响，并极大地提高了机器翻译任务的效率和准确性。 ......
No 46. 提出自动化提示工程方法PRewrite，通过强化学习框架重新编写初始提示，生成更优的人类可读提示，优于传统手动试错方式和其他方法。//[CL]《PRewrite: Prompt Rewriting with Reinforcement Learning》
No 47. 大型语言模型基础知识可视化学习指南
No 48. 'Ant 开源游戏引擎' GitHub: github.com/ejoy/ant
No 49. 早！[太阳]
No 50. Datadrift：开源的监控和事件管理平台，旨在帮助数据团队交付可信赖的指标。该平台提供了指标的可观测性和故障排除功能，与静态测试和元数据监控不同，侧重于行级监控和故障排除，使数据团队能够更快地检测和解决数据问题

爱可可微博热门分享(1.26)

No 1. 《「我在淘天做技术」智能对话新纪元：百万日活对话机器人的LLM落地实践》
No 2. 非母语者英语科研写作的7个技巧
No 3. makeMoE：从零开始实现稀疏混合专家语言模型
No 4. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 5. 你在用什么AI编程辅助工具？- Github Copilot：由Github官方推出的智能编程辅助插件，可以直接集成到VSCode等编辑器或IDE，提供智能代码建议与补全。 ......
No 6. '闯关式 SQL 自学网 - 免费的闯关式 SQL 自学教程网站，从 0 到 1 带大家掌握常用 SQL 语法，纯前端实现，简单易学' ......
No 7. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 8. 基于Transformers.js的Depth Anything网页版Demo，Depth Anything是一种鲁棒的单目深度估计解决方案，其充分利用各种未标记的图像和预训练模型中丰富的语义先验，具有优异的零样本深度估计能力
No 9. Synthetic Data Generator：专注于快速生成高质量结构化表格数据的框架，支持许多单表和多表数据合成算法，可实现高达120倍的性能提升，并支持差分隐私和其他方法以增强合成数据的安全性
No 10. [CL] MM-LLMs: Recent Advances in MultiModal Large Language ......
No 11. Open-LX01：小爱音箱mini定制固件，让小爱音箱mini成为一个完全自主控制的音箱
No 12. Lightning Studio：一体化云平台，用于大规模构建和部署人工智能产品
No 13. [CL]《Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding》
No 14. SuperNOVA：一个交互式工具，旨在帮助研究人员探索现有的notebook可视化分析工具，并寻找设计灵感和实施参考，收集了160多个notebook视觉分析工具，用户可以在浏览器中探索这些工具
No 15. Luna AI：全自动的 AI 直播系统，由Cha...
No 16. 机器学习/深度学习推荐书单，包括作者自己的一本书《...
No 17. Hugging Face发布《深度强化学习课程 v2.0》中文版，涵盖深度强化学习主题
No 18. Google-Gemini-Crash-Course：Google Gemini快速开发教程
No 19. 提出一种称为meta-prompting的技术，通过将单个语言模型转变为一个多面手的指挥者，并引导其将复杂任务分解为更小的子任务，从而提高语言模型在各种任务中的性能。//[CL]《Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding》
No 20. Hugging Face与Google Cloud的战略合作：加速生成式AI和ML的开发
No 21. [CV] UNIMO-G: Unified Image Generation through Multimodal ......
No 22. Applio：经过精心优化的终极语音克隆工具，旨在提供卓越的性能、模块化和用户友好的体验，增强功能包括代码模块化、跳长实现、支持30多种语言的翻译、跨平台兼容性、优化的要求、简化的安装流程等
No 23. [CL] BiTA: Bi-Directional Tuning for Lossless Acceleration ......
No 24. 物料成本700+元的FOC双轮腿机器人，提供了一种新型结构的轮腿机器人的开源资料，包括机械设计、电子设计、算法仿真和软件开发等材料
No 25. 用AI辅助CS50课程教学
No 26. [CV]《Common-Sense Bias Discovery and Mitigation for Classification Tasks》
No 27. PDFToChat：PDF对话项目，使用了一系列技术栈，包括Next.js、Together AI、Pinecone、Bytescale、Vercel等
No 28. [CL]《MambaByte: Token-free Selective State Space Model》
No 29. [CL] MaLA-500: Massive Language Adaptation of Large Language ......
No 30. OpenAI发布新嵌入模型，降低GPT-3.5 Turbo价格
No 31. Vlogger：一个通用的人工智能系统，用于生成用...
No 32. 今日推介(第1296期)：基于自我监督学习的自适应众包、对黑盒模型进行基于概念的干预、分类任务常识偏差的发现与消除、非token选择状态空间模型、用任务不可知分解指派框架增强语言模型 ......
No 33. 早！[太阳]
No 34. GeoGPT+：OpenAI定制模型在地理空间分析的新应用
No 35. [LG]《Beyond Concept Bottleneck Models: How to Make Black Boxes Intervenable?》
No 36. Ollama发布Python和JavaScript库：简化应用集成
No 37. Startup funding simulator：一个开源工具，旨在帮助创业者理解现代融资(使用安全协议)的工作原理，以及在筹集资金时可以预期的稀释程度。Startup funding simulator允许用户添加后金安全协议(Post-money Safes)、定价轮次和向员工发放期权，并可以看到这些操作如何影响他们的所有权
No 38. [CV]《Deconstructing Denoising Diffusion Models for Self-Supervised Learning》
No 39. 关于使用RAG模式(Retrieval-Augmented Generation)的应用和资源的信息，包括关于RAG技术的综述，以及一些GitHub库和企业级应用的链接，这些应用使用RAG模型来增强自然语言处理和信息检索能力
No 40. OpenGFW：Linux 上灵活、易用、开源的 GFW 实现，并且在许多方面比真正的 GFW 更强大，可以部署在家用路由器上的网络主权，使用场景包括广告拦截、家长控制、恶意软件防护、VPN/代理服务滥用防护、流量分析 (纯日志模式)等
No 41. CMU新课：神经代码生成，介绍了使用深度学习方法对...
No 42. Fish Audio Preprocessor：一些用于音频处理的脚本，包括：将视频/音频转换为wav格式、音频声音分离、自动音频切片、音频音量匹配、音频数据统计、音频重采样
No 43. [LG] SpacTor-T5: Pre-training T5 Models with Span Corruption ......
No 44. json_repair：修复损坏的JSON文件，尤其是LLM输出的病态JSON文件
No 45. 聊天机器人：改善心理健康的新途径
No 46. 通过分析和分类不同的结构增强型LLM推理方案，提供了对提示工程的深入理解，为未来的提示技术发展指明了方向。//[CL]《Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts》
No 47. Heat.js：轻量的JavaScript库，用于生成可自定义的热力图，用来可视化基于日期的活动和趋势
No 48. 'CUDA高频面试题汇总/C++笔记/CUDA笔记 - CUDA 笔记 / 高频面试题汇总 / C++笔记，个人笔记，更新随缘: ......
No 49. Adept Fuyu-Heavy：新的大规模多模态模型
No 50. GPT Newspaper：创新的自主agent项...

爱可可微博热门分享(12.31)

No 1. 2023年终大放送之 TOP50开源项目榜： No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 2. 2023年终大放送之 TOP50总榜： No. 1 “ChatGPT指令生成器” No. 2 你一直想知道的关于数学的一切 ......
No 3. 2023年10篇值得关注的AI论文
No 4. 因果机器学习综述
No 5. Jan：ChatGPT开源替代，100%离线运行，支持多种硬件架构，包括Nvidia GPU、Apple M系列、Apple Intel、Linux Debian和Windows x64
No 6. 新书《机器学习面试指南》
No 7. 2023年终大放送之 TOP30论文榜：No. 1 [LG]《Graph Representation Learning via Aggregation Enhancement》
No 8. #免费##抽奖# 携手@博文视点Broadview 送出5本《马同学图解微积分（上）》
No 9. 之前总看到有人说已经用Perplexity AI替代Google当作主力搜索引擎，一直心痒有点犹豫要不要冲，今天偶尔看到有个假日优惠马上截止了，折扣代码“HOLIDAYS23”，月付可以免费用一个月，年付可以免费用两个月，力度还是不错的，赶在活动截止前充了一年 ......
No 10. NeuroAI“万物理论”年终回顾
No 11. #免费##抽奖# 携手@博文视点Broadview 送出5本《LangChain入门指南：构建高可复用、可扩展的LLM应用程序》
No 12. Semantic Router：用于LLM(语言模型)和Agent的超快的决策层，利用语义向量空间的能力来做出决策，通过语义意义来路由请求，支持定义不同的决策对象，并使用相应的编码器模型进行语义决策
No 13. CNN Explainer：交互式卷积神经网络(CNN)可视化解释器
No 14. ollama-voice-mac：Mac上完全离线的语音助手，使用Mistral 7b和Whisper语音识别模型
No 15. go-redislock：基于Go语言实现的高性能Redis分布式锁服务
No 16. Motorica Dance Dataset：包含8种不同舞蹈风格的6小时运动捕捉和音频数据集，数据以BVH格式呈现，并针对一个统一的骨架进行重新定位，特色是包含了不同风格的舞蹈，并提供了详细的运动捕捉和音频数据
No 17. fastui-chat：用纯Python编写的简洁易用轻量的聊天机器人界面，提供了基本的聊天处理器和聊天消息历史记录功能
No 18. 晚安～ [月亮]
No 19. 使用Langchain表达式语言和GPT4-Vision的多模态 RAG
No 20. 关于旨在替代Transformer/注意力机制的状态空间模型(SSM)的论文和研究列表
No 21. Fine-tune Phi-2：对Phi-2模型进行微调的代码实例，包括使用QLoRA进行微调、创建合成对话数据集和使用多个GPU进行训练等
No 22. 早！[太阳]
No 23. [CL]《Task Contamination: Language Models May Not Be Few-Shot Anymore》
No 24. [CV] Unified-IO 2: Scaling Autoregressive Multimodal Models ......
No 25. 深度学习面试题库，涵盖了大模型、计算机视觉、感知算法、深度学习基础与框架等专题，提供详细的题目解析
No 26. 今日推介(第1270期)：由于任务污染语言模型或不是真正的少样本学习、无需人工标注逐步验证和强化LLM、LLM的结构化裁剪、基于小型骨干的高效多模态大语言模型、基于习得哈希探测的紧凑神经图形原语 ......
No 27. Leonardo.Ai最新推出的Realtime Gen实时图片生成，可实时调整画风
No 28. 上下文学习解析
No 29. [CV] I2V-Adapter: A General Image-to-Video Adapter for Video ......
No 30. OpenAI 最近的年化收入超过了 16 亿美元，在两个月内实现了 20% 的增长
No 31. Convert any Corpus of Text into a Graph of Knowledge：将任意文本转换为知识图谱，可用于图增强生成或基于知识图谱的问答。特色：将文本转换为图表示，可视化并进行查询
No 32. RAG进阶图解
No 33. nnsight：能解释和操控深度学习模型内部结构和参数的软件包
No 34. 'ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 chatGPT' yzfly GitHub: github.com/yzfly/awesome-chatgpt-zh ......
No 35. [CV]《TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones》
No 36. [CV] MobileVLM : A Fast, Reproducible and Strong Vision Language ......
No 37. de4py：用于Python逆向工程的工具包，特点包括高级反混淆、执行Python代码、字符串提取、移除退出函数、获取所有函数、Pyshell图形界面等功能，支持GUI和命令行，还有文件分析和行为监控功能
No 38. 'KS的日语学习工具 v0.2 - 简易日语学习 / 视觉小说阅读辅助工具，特色包括句子分析、游戏文本提取和谷歌翻译等功能’ ......
No 39. 关于图像生成的一个现实问题：如果有人用生成式AI工具生成一幅与受版权保护的作品（绘画、照片、电影截图等）在实质上相似的图像，谁应该对版权侵权负责？ ......
No 40. [LG]《The LLM Surgeon》
No 41. None
No 42. 提出一种自动构建数学推理过程监督数据的方法，通过MATH-SHEPHERD模型在验证和强化学习任务中的应用，显著提高了语言模型的准确性和推理能力。//[CL]《Math-Shepherd: Verify and Reinforce LLMs Step-by-step without Human Annotations》
No 43. 提出一种紧凑的神经图形基元方法，通过学习探测哈希表实现了压缩和速度的最佳平衡，可以在高保真沉浸式体验中有效地压缩多媒体内容。//[CV]《Compact Neural Graphics Primitives with Learned Hash Probing》
No 44. '荀子系列大语言模型 - 一系列针对古籍智能处理的开源模型，特色包括古籍智能标引、信息抽取、诗歌生成、高质量翻译、阅读理解、词法分析和自动标点等功能，旨在提升古籍研究与传承的效率与质量’ ......
No 45. 含噪评估是联邦超参数调优面临的主要挑战
No 46. Aurora：中文版MoE模型，具有强大的自然语言处理能力，基于Mixtral-8x7B的进一步工作，激活了该模型在中文开放域的聊天能力
No 47. [CL]《Math-Shepherd: Verify and Reinforce LLMs Step-by-step without Human Annotations》
No 48. GitHub: github.com/dvmazur/mixtral-offloading //@爱可可-爱生活:研究了如何在消费者硬件上运行大型MoE语言模型，并提出一种新的卸载(offloading)策略，利用MoE ......
No 49. 《Python Cookbook》(第三版) 中文版 (在线)
No 50. LLM Distillation Playbook：关于如何有效蒸馏大型语言模型的最佳实践实用指南，提供了一系列的最佳实践，帮助工程师和机器学习从业者在生产应用中更高效地蒸馏和使用语言模型

今日学术视野

arXiv论文跟踪

爱可可微博热门分享(1.28)

No 1. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 2. MoE-LLaVA：多模态混合专家模型，在多模态学习中表现出卓越性能，具有相对较少的参数，但在各种视觉理解数据集中表现出与LLaVA-1.5-7B相媲美的性能，甚至在对象幻觉基准测试中超越了LLaVA-1.5-13B
No 3. 向量数据库将走向哪里
No 4. makeMoE：从头开始实现的稀疏专家混合语言模型，基于PyTorch的自回归字符级语言模型，采用稀疏专家混合架构，与makemore相似
No 5. WhisperFusion：具有超低延迟无缝对话功能的AI系统，基于WhisperLive和WhisperSpeech的能力，集成了Mistral，一个大型语言模型(LLM)，在实时语音转文本管道上运行。LLM和Whisper都经过优化，以TensorRT引擎的形式高效运行，以实现高性能和实时处理能力
No 6. Dendy：用Go编写的NES/Famicom游戏机模拟器
No 7. 根据LLM匿名竞技场的最新排名，Google的Bard模型取得了显著进步，成功超越了OpenAI GPT-4模型，排到了第二名，但仍落后于GPT-4 ......
No 8. Obsidian Latex Suite：Obsidian插件，旨在通过快捷方式和文本扩展使LaTeX数学排版与手写一样快速
No 9. TaskingAI：旨在将Firebase的简单性...
No 10. 掌握Llama 2：Meta推出提示工程交互式指南
No 11. 故事生成/叙事生成相关论文列表，主题包括大型语言模型、情节发展、更好的叙事、可控性、角色、写作风格、故事规划、评估、应用和数据集
No 12. 美国商务部：算力管制还不够，云计算也要严加控制
No 13. Pluto：合成数据生成库，旨在帮助细调LLMs的用户解决数据不足的问题，可以通过主题树来增加数据的多样性，克服数据的重复性，并支持并行采样请求以加速数据生成，用户可以使用任何模型提供者生成数据
No 14. 几篇论文实现代码
No 15. 晚安～ [月亮]
No 16. 社交媒体、人工智能与大脑争夺战
No 17. Pipelight：自托管的轻量级CLI工具，用于创建微小的自动化流水线，可将CI/CD引入最小的项目，基于Rust，占用空间小(13Mb)并使用TypeScript、Toml和Yaml定义流水线
No 18. 免费书稿：《机器学习工程》，提供了一系列关于机器学习工程的深入内容，包括但不限于数据处理、模型训练、模型评估、模型部署等方面的知识，可以帮助读者更好地理解和掌握机器学习工程的各个方面，从而在实际工作中更有效地应用机器学习技术
No 19. [LG]《Active Inference as a Model of Agency》
No 20. 你在用什么AI编程辅助工具？- Github Copilot：由Github官方推出的智能编程辅助插件，可以直接集成到VSCode等编辑器或IDE，提供智能代码建议与补全。 ......
No 21. Search with Lepton：使用Lepton构建自己的会话式搜索引擎，只需不到500行代码，具备内置的LLM(语言模型)支持、内置的搜索引擎支持和可定制的漂亮用户界面
No 22. Mamba状态空间模型相关文献列表
No 23. makeMoE：从零开始实现稀疏混合专家语言模型
No 24. Kimi Commits：利用Kimi AI技术，为IntelliJ、PyCharm、WebStorm和GoLand等开发工具提供智能的提交消息生成功能，支持在列表的名称和描述中添加表情符号
No 25. 《「我在淘天做技术」智能对话新纪元：百万日活对话机器人的LLM落地实践》
No 26. [CV] CreativeSynth: Creative Blending and Synthesis of Visual ......
No 27. Lumos：基于RAG(Retrieval-Augmented Generation)的大型语言模型(LLM)协作工具，用于浏览网络，由本地LLM驱动
No 28. [AS]《DITTO: Diffusion Inference-Time T-Optimization for Music Generation》
No 29. 从零开始实现LoRA
No 30. [CV] pix2gestalt: Amodal Segmentation by Synthesizing Wholes ......
No 31. imp：旨在提供一系列强大的多模态小型语言模型(M...
No 32. StreamRAG: GPT驱动的视频检索和流媒体工具，可以用于以下用途：上传多个视频以创建库或集合，搜索这些视频并获得实时视频响应或编译，将可搜索的集合发布到ChatGPT商店，接收摘要文本答案(RAG)，从特定视频获得关键见解
No 33. mPLUG-HalOwl: 多模态幻觉评估和缓解
No 34. 通过提出一个通用框架，研究了基于Transformer的模型在学习结构化递归中的表现，发现模型存在捷径算法和归约方面的问题，为更好处理递归任务提供了重要的理论和实证基础。//[CL]《Transformer-Based Models Are Not Yet Perfect At Learning to Emulate Structural Recursion》
No 35. 今日推介(第1298期)：机器人开放知识模型集成、扩散推理时T最优化音乐生成、基于Transformer的模型在学习仿真结构化递归方面尚不完美、大语言模型的指令指纹、 ......
No 36. 'CUDA高频面试题汇总/C++笔记/CUDA笔记 - CUDA 笔记 / 高频面试题汇总 / C++笔记，个人笔记，更新随缘: ......
No 37. 状态空间模型(SSM)相关资源代码列表
No 38. 向量数据库横向对比，包括Pinecone、Weaviate、Qdrant、Chroma、LanceDB、Milvus、Vespa、Vald、Postgres、Redis、ElasticSearch等
No 39. [AS] StreamVoice: Streamable Context-Aware Language Modeling ......
No 40. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 41. [CL]《Instructional Fingerprinting of Large Language Models》
No 42. Figure最新发布的机器人视频 🤖
No 43. 提出一种通过优化初始噪声潜变量来控制音乐生成的通用框架，实现了高质量、灵活和无需重新训练的音乐生成。//[AS]《DITTO: Diffusion Inference-Time T-Optimization for Music Generation》
No 44. 物料成本700+元的FOC双轮腿机器人，提供了一种新型结构的轮腿机器人的开源资料，包括机械设计、电子设计、算法仿真和软件开发等材料
No 45. [CL]《Unitxt: Flexible, Shareable and Reusable Data Preparation and Evaluation for Generative AI》
No 46. [CL]《Transformer-Based Models Are Not Yet Perfect At Learning to Emulate Structural Recursion》
No 47. 早！[太阳]
No 48. [CV] Sketch2NeRF: Multi-view Sketch-guided Text-to-3D Generation ......
No 49. Fish Audio Preprocessor：一些用于音频处理的脚本，包括：将视频/音频转换为wav格式、音频声音分离、自动音频切片、音频音量匹配、音频数据统计、音频重采样
No 50. 关于ChatGPT的资源集合，包括了各种工具、文档、应用和使用案例

爱可可微博热门分享(1.17)

No 1. 来来来，说说你最常用的是哪几个？为什么？爱可可-爱生活的微博...
No 2. 2024机器学习书单
No 3. 大型语言模型基础知识可视化学习指南
No 4. #抽奖# #赠书# 携手@图灵新知 @图灵文化送出5本《智能文本处理实战》
No 5. 图/几何机器学习2024回顾与展望之理论与架构
No 6. 含噪数据的平滑
No 7. 图/几何机器学习2024回顾与展望之应用
No 8. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 9. Draw2Img：一个简单的Web用户界面，用于交互式文本引导的图像生成，适用于任何年龄和技能水平
No 10. 大语言模型抽象(LLM Abstraction)框架指南
No 11. 最近试用了网易有道新推的Hi Echo，一款主打虚拟人的口语练习App，在目前的大模型落地应用中算是表现比较突出的，其设计理念体现了大模型个性化服务的精髓：用户可以根据自己的口语水平和学习阶段，选择不同难度的练习，确保了各种水平的学习者都能得到适合的训练。Hi ......
No 12. Animate 3D Motion：上传一段视频，AI自动识别视频中的运动主体人物，并一键替换成有趣的3D角色模型，生成与众不同的AI视频
No 13. 'Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型，支持加载本地知识库做检索增强生成RAG。Training ......
No 14. Fitten code：GPT驱动的免费代码生成和完成工具，支持多种语言：Python、Javascript、Typescript、Java等
No 15. Stability AI面向会员发布Stable Code 3B
No 16. Gigastep：每秒可进行10亿步的多智能体强化学习框架
No 17. Calendar：适合打印的年历，适合安排和回顾全年日程
No 18. CSGHub：开源的大型模型资产平台，类似于本地的Huggingface，可以帮助管理数据集、模型文件、代码等。CSGHub提供类似私有化的Huggingface功能，类似于OpenStack Glance管理虚拟机镜像、Harbor管理容器镜像以及Sonatype Nexus管理制品的方式，以实现对大型模型资产的管理
No 19. 理解和编写LLM中的自注意力、多头注意力、交叉注意力和因果注意力
No 20. 构建基于大语言模型(LLM)系统和产品的7个关键设计模式
No 21. Write You a Vector Database：在关系数据库系统中添加向量功能的教程，在CMU-DB的BusTub教育数据库系统的修改版上实现类似pgvector的能力，包括向量存储、向量表达式和向量索引
No 22. 语言模型与形式数学
No 23. 数字人对话系统 - Linly-Talker
No 24. 《微软推出 Copilot Pro 订阅：每月 20 美元，可使用 GPT-4 Turbo》
No 25. ChatGPT会有意识吗？
No 26. Towards Understanding the Correlation between LLM Benchmarks：探索LLM评估与人工标注之间的相关性，以期能兼得廉价和与人工评估的高相关性
No 27. 首次证明了大型语言模型不仅能够模仿人类语言，还能通过预测和控制神经活动来非侵入性地操纵人类大脑的语言网络，揭示了语言输入特性对神经响应的影响。//[LG]《Driving and suppressing the human language network using large language models》
No 28. [CL]《Few-Shot Detection of Machine-Generated Text using Style Representations》
No 29. 几篇论文实现代码
No 30. [RO] RePLan: Robotic Replanning with Perception and Language ......
No 31. '中文对话0.2B小模型 ChatLM-Chinese-0.2B - 开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调' ......
No 32. [CL]《Can LLMs Keep a Secret? Testing Privacy Implications of Language Models via Contextual Integrity Theory》
No 33. Inferflow：高效且高度可配置的大型语言模型(LLM)推理引擎。可以通过简单修改配置文件中的几行内容，而无需编写源代码，来为大多数常见的Transformer模型提供服务
No 34. [CL] An Experimental Design Framework for Label-Efficient ......
No 35. Kotomamba：Mamba训练库，支持PyTorch FSDP分布式训练、混合精度训练、V100和A100转换为HF transformers、检查点连续预训练Mamba模型以及指令调整Mamba模型等功能
No 36. 开源语音合成(TTS)项目汇总：XTTS - 网页链接YourTTS - 网页链接FastSpeech2 - 网页链接VITS ......
No 37. Fluid Database：可以根据摄取的数据更新其架构的“流体”自适应数据库，支持以自然语言以及半结构化格式输入数据，既支持传统查询语言，也支持直观的自然语言查询
No 38. LLM大众化: 采用4-bit量化的优化LLM推断
No 39. 今日推介(第1287期)：用大语言模型驱动和抑制大脑语言网络、面向人工智能的脑器官储库计算、从文学角度评价大语言模型的创造力、基于风格表示的机器生成文本少样本检测、利用上下文完整性理论检验语言模型的隐私推理能力 ......
No 40. [LG]《Secrets of RLHF in Large Language Models Part II: Reward Modeling》
No 41. TrustLLM: LLM(大型语言模型)可信度研究，包括对LLM可信度不同维度的原则制定、建立了六个维度的基准评估，涵盖了真实性、安全性、公平性、鲁棒性、隐私性和机器伦理等方面
No 42. [CV]《Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMs》
No 43. 人工智能下一步将如何发展?
No 44. 目前的结果符合你的预期吗？
No 45. Daily Newsletter for 🤗 Daily Papers：每天都会发送一封新闻简报，内容来自🤗 Daily Papers，发送时间是每天的0点20分
No 46. TPOT2 ALPHA：用遗传编程来优化机器学习流水线的Python自动化机器学习工具，TPOT(Tree-based Pipeline Optimization Tool)的重写版本，增加了对基于图的流水线和其他参数的支持，以更好地指定所需的搜索空间
No 47. GitChat：搜索和回答关于GitHub存储库问题的聊天机器人
No 48. [CL]《The Unreasonable Effectiveness of Easy Training Data for Hard Tasks》
No 49. Summarization Evaluation：自动文本摘要评估工具，可进行无参考评估，支持潜在幻觉检测
No 50. Open TTS Tracker：开放TTS语音合成引擎大列表

爱可可微博热门分享(1.2)

No 1. AI热门开源项目排行(1-10)1、Stanford Alpaca简介：提供了用于训练斯坦福大学Alpaca模型的代码和文档，以及生成相关数据。Alpaca模型是一种大型语言模型，专注于提供更高效的文本生成和处理能力。项目旨在促进语言模型的研究与开发。地址：github.com/tatsu-lab/stanford_alpaca2、llama.cpp简 ......
No 2. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 3. AI热门开源项目排行(11-20) 11、3D Gaussian Splatting 简介：一个3D Gaussian ......
No 4. 《2024年， AI领域将会有哪些新突破？ - 知乎》
No 5. [CL] Large Language Models for Generative Information Extraction: ......
No 6. 用“思维树提示”(Tree of Thoughts Prompting)解决复杂推理问题
No 7. EmbeddingStudio：将'嵌入+向量数据库'无缝转换为全方位搜索引擎的开源框架，具有点击流收集、搜索体验持续改进和嵌入模型的自动微调等功能，为全周期搜索引擎提供了开箱即用的解决方案
No 8. Minigpt4Qwen：在MiniGPT4的基础上对齐了Qwen-Chat语言模型，使用高质量的指令微调数据，通过单阶段预训练达到了很好的效果
No 9. 2023年终大放送之 TOP30论文榜：No. 1 [LG]《Graph Representation Learning via Aggregation Enhancement》
No 10. 2024爱老师送给大家的第一份礼物，独家梳理的开源项目排行，会持续更新，特色：项目新、更新快、覆盖广、排序不单纯取决于Star数，希望你喜欢，欢迎转发～//AI热门开源项目排行(1-10)1、Stanford ......
No 11. GPT4最新越狱技巧：“I’m a journalist(我是名记者)”[笑而不语]
No 12. 随着经典版米老鼠形象版权的解禁，一大批相关创意集中涌现，比如用来生成米老鼠图片的SD微调模型Mickey-1928 ( http://t.cn/A6l3QPuV )，还有看起来相当精彩的以经典米老鼠为主角的FPS(第一人称射击)游戏《MOUSE》
No 13. 2024年，用一句话跟拖延“断交”——Just do it! 三个理解的层次： - 清楚区分“必须做”的事和“可有可无”的事，越晚做“必须做”的事，损失往往越大； ......
No 14. Open LLM Leaderboard：全面、客观的开放大语言模型排行榜，可以看到开放大模型日新月异的发展，同时反思数据污染可能造成的负面影响
No 15. #免费##抽奖# 携手@博文视点Broadview 送出5本《马同学图解微积分（上）》
No 16. 大语言模型视觉理解相关论文资源列表
No 17. #免费##抽奖# 携手@博文视点Broadview 送出5本《LangChain入门指南：构建高可复用、可扩展的LLM应用程序》
No 18. ComfyScript：用Python写的ComfyUI前端工具，可以将ComfyUI的工作流转化为可读的Python脚本，支持直接运行脚本生成图像，还具有脚本生成工作流和从脚本中检索信息的功能，可以将Python代码与ComfyUI的节点混合使用，方便进行循环、调用库函数和自定义节点的封装
No 19. 2023年终大放送之 TOP50总榜：No. 1 “ChatGPT指令生成器” 微博正文No. 2 你一直想知道的关于数学的一切 ......
No 20. 2023年大语言模型(LLM)各领域精彩提示语(prompt)合集
No 21. 2023年10篇值得关注的AI论文
No 22. 之前总看到有人说已经用Perplexity AI替代Google当作主力搜索引擎，一直心痒有点犹豫要不要冲，今天偶尔看到有个假日优惠马上截止了，折扣代码“HOLIDAYS23”，月付可以免费用一个月，年付可以免费用两个月，力度还是不错的，赶在活动截止前充了一年 ......
No 23. AI视频生成工具集锦(110+)
No 24. [CV] Learning Vision from Models Rivals Learning Vision from ......
No 25. [CL] Building Efficient Universal Classifiers with Natural ......
No 26. Jan：ChatGPT开源替代，100%离线运行，支持多种硬件架构，包括Nvidia GPU、Apple M系列、Apple Intel、Linux Debian和Windows x64
No 27. Overleaf Workshop：在VSCode中打开Overleaf/ShareLaTex项目，并提供完整协作支持
No 28. Durdraw：多功能的ASCII和ANSI艺术文本编辑器，可以在Linux/Unix/macOS终端中绘图，支持动画、256色和16色、Unicode和CP437字符集，以及可自定义的主题
No 29. PyTorch的定制C++和CUDA 扩展
No 30. Page Replica：用Node.js、Express和Puppeteer构建的多功能网页爬取和缓存工具，可以通过Nginx提供预渲染的网页，用于SEO或其他用途。该工具可以爬取单个页面或整个网站地图，并可选择删除JavaScript并缓存HTML。此外，还提供了一个优化的Nginx配置，可以有效处理用户和搜索引擎爬虫的流量
No 31. 早！[太阳]
No 32. ParlayANN：用于高维近似最近邻搜索的算法库，用C++编写，并使用了ParlayLib的并行原语，目前包括ANNS算法DiskANN、HCNNG和pyNNDescent的实现
No 33. Tricksy：在单个GPU上进行快速近似推理，支持稀疏感知卸载(offloading)
No 34. [LG]《LARP: Language-Agent Role Play for Open-World Games》
No 35. [LG] The Duck's Brain: Training and Inference of Neural Networks ......
No 36. relplot: 用于测量校准和绘制可靠性图表的工具包，提供了可视化方法来评估模型的校准程度，并生成可靠性图表以帮助分析模型的可靠性
No 37. Examples for crewAI：使用crewAI框架自动化流程的示例，包括旅行规划、股票分析和页面生成等，旨在促进角色扮演AI智能体之间的协作，通过使用这些示例，可以了解如何在crewAI框架中实现自动化流程
No 38. [CV]《FlowVid: Taming Imperfect Optical Flows for Consistent Video-to-Video Synthesis》
No 39. Semantic Router：用于LLM(语言模型)和Agent的超快的决策层，利用语义向量空间的能力来做出决策，通过语义意义来路由请求，支持定义不同的决策对象，并使用相应的编码器模型进行语义决策
No 40. LLM生成文本检测相关论文资源列表，内容覆盖数据、检测器、度量标准、当前问题和未来方向
No 41. 因果机器学习综述
No 42. 爱老师独家发布
No 43. 晚安～ [月亮]
No 44. '荀子系列大语言模型 - 一系列针对古籍智能处理的开源模型，特色包括古籍智能标引、信息抽取、诗歌生成、高质量翻译、阅读理解、词法分析和自动标点等功能，旨在提升古籍研究与传承的效率与质量’ ......
No 45. epubhv：使EPUB电子书垂直或水平布局的工具，还可以进行简繁体字的转换和添加日语假名或中文拼音
No 46. 免费书稿：《深度学习数学工程》
No 47. TinyLlama-1.1B-Chat-v1.0：基于1.1B参数的小型Llama聊天模型，可用于进行对话和交流，在UltraChat数据集上进行微调，该数据集包含由ChatGPT生成的各种对话
No 48. AI与自我认知测试
No 49. TransferAttack：旨在提升图像分类中对抗性传递性的PyTorch框架，提供了评估和攻击模型的功能，并对已有的传递性攻击进行分类和评估
No 50. Emacs Copilot：为Emacs提供大型语言模型代码补全的项目，使用本地运行的LLM生成代码补全，支持快速输入代码，具有优秀的质量和自由度，能根据文件扩展名确定编程语言，适用于各种编程语言

爱可可微博热门分享(1.11)

No 1. cutword：一个中文分词库，其字典文件根据最新数据统计得到，词频更加合理，分词速度是结巴分词的两倍
No 2. AI行业四大战场——数据之战、GPU贫富之战、多模态之战、RAG/运维之战
No 3. DeepSeekMoE 16B ：DeepSeek开源的大语言模型，采用了创新的混合专家(MoE)架构，包括细粒度的专家分段和共享专家隔离两个主要策略。该模型是从头开始训练的，使用了2T个Token，性能与DeekSeek 7B和LLaMA2 7B相媲美，但计算量仅为其40%左右
No 4. 大模型的“涌现能力”可能并不只是规模的直接结果，而是学习过程中某种形式的“认知重组”或“知识内化”，类似于人类认知发展中的某些阶段性质变。例如，儿童在某个年龄段突然能够掌握抽象思维，不仅仅是知识量的增加，而是认知结构的根本改变——所以，大模型“认知发展”阶段的研究也很值得期待。//大模型“涌现现象”存在吗 ......
No 5. 早！[太阳]
No 6. 用 Unsloth 和 TRL(Transformer Runtime Library) 将 LLM 微调速度提高 2 倍
No 7. GPT Store发布
No 8. LLM匿名竞技场最新排名：Mixtral 8x7b 跃居最佳开放模型，Mistral-Medium排名仅次于GPT-4
No 9. 基于新版Transformers.js v2.14制作的SAM在线本地推断Demo，可以直接在浏览器中为场景中的目标生成高质量的分割Mask
No 10. 音乐人声分离工具：极简的人声和背景音乐分离工具，本地化网页操作，无需连接外网，使用 2stems/4stems/5stems 模型
No 11. 免费书稿《深度学习数学导论：方法、实现和理论》
No 12. Teamlinker：团队协作平台，集成了多功能模块，包括联系人、任务管理、会议、即时通讯、Wiki和文件管理
No 13. LAiW：中文法律大模型综合性基准（狴犴）
No 14. AIlice：轻量级AI代理，同时也是一个简单的开发框架，用于快速构建和尝试各种AI智能体的想法
No 15. Nebula engine：C++游戏引擎，游戏引擎，特色包括完全基于数据驱动的设计、高性能数据结构套件、多线程支持、SSE加速的数学库、完整支持Python脚本、先进的渲染框架和着色器、性能测试工具和性能分析工具等
No 16. 免费书稿《数学分析(第二卷)》
No 17. Promptuity：提供交互式提示的库，具有高度可扩展性，允许你从头开始构建自己的提示，主要用于Rust语言，可以用于构建命令行工具和交互式应用程序
No 18. 涌现现象与基准数据集的难度分布有关。如果难度梯度分布广泛，模型规模增长带来的是由易到难样本数量的连续改善，不会有显著的涌现点出现。如果数据集难度较为一致，模型在某一规模阶段可能会经历突然能高效处理大多数样本的显著跳跃，形成明显的涌现。涌现现象依赖于如何选择和构建所用的基准数据集。//大模型“涌现现象”存在吗 ......
No 19. 大模型“涌现现象”存在吗去年年初大家讲涌现讲得比较多，因为大模型存在涌现现象，所以大家都对大模型的发展非常乐观。涌现的本质是有些困难的任务小模型做不了，大模型突然就能做了，这自然带给大家对未来乐观的预期：就是说我将来把模型做得更大一点，现在尽管很多事都做不好，但是将来一 ......
No 20. LLaMa2lang v0.3：用于将LLaMa2-7b模型进行语言微调的便捷脚本集合，以适用于除英语以外的任何语言
No 21. 晚安～ [月亮]
No 22. SwiftInfer：基于TensorRT实现的Streaming-LLM技术，旨在支持LLM模型进行无限输入长度的推理
No 23. 几篇论文实现代码
No 24. Twinny：为VS Code设计的本地或API主机的AI代码补全插件，类似于GitHub Copilot，但完全免费和100%私密
No 25. 今日推介(第1281期)：面向表格理解的演化表格推理链、线性递归特征机可证明恢复低秩矩阵、多粒度答案的开放域问答、用大型语言模型处理无限序列长度的免费午餐、基于单非自回归Transformer的掩码音频生成 ......
No 26. 通过无约束生成对中文大型语言模型的幻觉产生进行基准测试
No 27. 图解AI开放状况(数据来源：Coatue)：从模型代码、模型权重、训练数据、模型评估、架构决策和商业许可的开放性等方面，对比了主流的AI模型——GPT-2、GPT-3、GPT-4、LaMA(来自Meta)、LaMA-2和Mistral-7B的开放程度。 ......
No 28. AI Toolkit：用于构建游戏NPC智能控制系统的C++头文件库，提供有限状态机、行为树、实用AI和目标导向行动规划等功能
No 29. AI Gateway：高性能的AI路由，具有极快速和友好的API，可以将请求路由到100+个LLM(Language Model Model)，提供了一个统一的接口，方便使用者与多个LLM进行交互，并支持生成式AI和语言链等功能
No 30. [CL]《Mixtral of Experts》
No 31. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 32. [CL]《Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM》
No 33. 妆容迁移/发型迁移相关资源列表
No 34. 《‌⁢‍⁡⁢⁤‍⁣⁢⁣‍⁡‍⁤‍⁣⁤⁣‌涓海录AIGC学习文档 - 飞书云文档》
No 35. 'cloudflare-ai-web - 支持GeminiPro Vision / Cloudflare Workers ......
No 36. '开源大模型食用指南 - 基于AutoDL快速部署开源大模型，提供完整指南，包括环境配置、部署和微调，助你轻松掌握各类大模型应用' ......
No 37. SmartExcel.cc：使用人工智能生成所需Excel公式的工具，利用ChatGPT API和Vercel AI SDK进行实时交互，通过Vercel Edge Function将其发送到ChatGPT API，然后将响应流式传输回应用界面
No 38. 提示工程职业化的反思
No 39. Local AI Voice Chat：基于Zephyr 7B模型使用自定义语音进行本地AI对话，使用RealtimeSTT和faster_whisper进行转录，使用RealtimeTTS和Coqui XTTS进行语音合成，提供了一个实时的聊天机器人，可以进行语音交互
No 40. [CV] MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation ......
No 41. [CV] Let's Go Shopping (LGS) -- Web-Scale Image-Text Dataset ......
No 42. [CL]《Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding》
No 43. [CL]《Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths in Large Language Models》
No 44. [CL] From LLM to Conversational Agent: A Memory Enhanced Architecture ......
No 45. [AS] DiarizationLM: Speaker Diarization Post-Processing ......
No 46. 近年来AI发展里程碑论文集锦： - Transformers: Attention is All You Need 提出了Transformer模型，完全基于注意力机制，摒弃了以往模型依赖的递归和卷积结构，为自然语言处理领域带来了革命性的影响，并极大地提高了机器翻译任务的效率和准确性。 ......
No 47. KAIST课程《3D数据机器学习》，内容涵盖了深度学习在处理和分析3D数据方面的最新进展，包括计算机视觉、计算机图形学和机器人领域的应用
No 48. [CV] A Survey on 3D Gaussian Splatting 网页链接 3D高斯Splatting(3D ......
No 49. [CL] AST-T5: Structure-Aware Pretraining for Code Generation ......
No 50. chatllm-vscode：VSCode扩展，允许以灵活和长篇的方式与LLM API进行交互，支持各种LLM APIs (currently OpenAI, Together, Google)

爱可可微博热门分享(12.30)

No 1. 新书《机器学习面试指南》
No 2. #免费##抽奖# 携手@博文视点Broadview 送出5本《LangChain入门指南：构建高可复用、可扩展的LLM应用程序》
No 3. de4py：用于Python逆向工程的工具包，特点包括高级反混淆、执行Python代码、字符串提取、移除退出函数、获取所有函数、Pyshell图形界面等功能，支持GUI和命令行，还有文件分析和行为监控功能
No 4. '荀子系列大语言模型 - 一系列针对古籍智能处理的开源模型，特色包括古籍智能标引、信息抽取、诗歌生成、高质量翻译、阅读理解、词法分析和自动标点等功能，旨在提升古籍研究与传承的效率与质量’ ......
No 5. #免费##抽奖# 携手@博文视点Broadview 送出5本《马同学图解微积分（上）》
No 6. Jan：ChatGPT开源替代，100%离线运行，支持多种硬件架构，包括Nvidia GPU、Apple M系列、Apple Intel、Linux Debian和Windows x64
No 7. RAG进阶图解
No 8. CNN Explainer：交互式卷积神经网络(CNN)可视化解释器
No 9. [LG]《Fast Inference of Mixture-of-Experts Language Models with Offloading》
No 10. [CV] Unsupervised Universal Image Segmentation 提出一种名为U2Seg的无监督通用图像分割框架，能同时处理实例分割、语义分割和全景分割任务。U2Seg通过自监督模型生成伪语义标签，并利用聚类算法将像素分为不同的语义和实例成员。然后，使用这些伪标签对模型进行自训练，取 ......
No 11. Flowpilot：基于openpilot的驾驶辅助系统，可以在Linux、Windows和Android设备上运行，提供了自适应巡航控制(ACC)、自动车道居中(ALC)、预碰撞警告(FCW)、车道偏离警告(LDW)和驾驶员监测(DM)等功能
No 12. Neural Concatenative Singing Voice Conversion：任意到任意的歌声转换模型，可以将一种歌声转换为另一种歌声
No 13. DL3DV-10K Dataset：包含真实场景级视频和场景标注的大型数据集，具有10,510个多视角场景，51.2百万帧，分辨率为4k，还包括140个用于新视角合成(NVS)的基准视频以及来自SOTA NVS方法的训练参数，为深度学习的3D视觉任务提供了丰富的场景和标注信息
No 14. 深度学习面试题库，涵盖了大模型、计算机视觉、感知算法、深度学习基础与框架等专题，提供详细的题目解析
No 15. 晚安～ [月亮]
No 16. ollama-voice-mac：Mac上完全离线的语音助手，使用Mistral 7b和Whisper语音识别模型
No 17. 免费书稿：《深度学习数学工程》
No 18. 2023年生物技术研究重大进展：从AI到染色体
No 19. [CL]《Do Androids Know They're Only Dreaming of Electric Sheep?》
No 20. 在三个复杂度级别上构建基于大语言模型(LLM)的Agent
No 21. TACO(Topics in Algorithmic COde generation dataset)：关于算法代码生成的数据集，具有更大规模、更高质量和更精细标签的特点，旨在提供一个更具挑战性的训练数据集和评估基准，用于代码生成模型领域
No 22. 上下文学习解析
No 23. 含噪评估是联邦超参数调优面临的主要挑战
No 24. 'KS的日语学习工具 v0.2 - 简易日语学习 / 视觉小说阅读辅助工具，特色包括句子分析、游戏文本提取和谷歌翻译等功能’ ......
No 25. 早！[太阳]
No 26. 分不清是人还是AI？来，稍微上点难度…… [笑cry]
No 27. 将市场和进化作为强化学习和优化的基础——市场/进化作为强化学习/优化的后盾/基本事实：关于Coase的公司理论/线性优化/DRL/进化/多细胞生命/痛苦/互联网社区作为多级优化问题之间的一些联系
No 28. Information Assistant Accelerator：使用Azure OpenAI服务和行业加速器构建的信息助手，结合了Azure AI Search和OpenAI的大型语言模型，提供了自然语言的问答交互，帮助用户查询相关信息，还提供了个性化的AI交互和可自定义的设置，以及解释思维过程、引用和验证内容的功能
No 29. llmbinge：基于LLM的Web应用，用于探索主题，可以生成响应和相关建议，可通过点击建议进一步探索主题，目前只支持ollama后端
No 30. 26个提示(prompt)优化技巧，帮你更好地使用ChatGPT们：1 - 不需要过多客套，直接表达即可，无需使用'请'、'如果你不介意'、'谢谢'、'我想要'等短语。2 ......
No 31. 我们的AI距离大脑还有多远
No 32. VoiceStreamAI: 使用自托管的Whisper和WebSocket在Python/JS中进行近实时音频转录的项目，支持实时音频流传输、语音活动检测、多语言转录等
No 33. Motorica Dance Dataset：包含8种不同舞蹈风格的6小时运动捕捉和音频数据集，数据以BVH格式呈现，并针对一个统一的骨架进行重新定位，特色是包含了不同风格的舞蹈，并提供了详细的运动捕捉和音频数据
No 34. 关于图像生成的一个现实问题：如果有人用生成式AI工具生成一幅与受版权保护的作品（绘画、照片、电影截图等）在实质上相似的图像，谁应该对版权侵权负责？ ......
No 35. Inpaint-iOS：基于CoreML技术的免费开源的修复图片应用，可在iPhone/iPad/MacBook上使用，支持本地处理，无需服务器
No 36. 有效利用AI扩展个人认知边界的十个提示
No 37. 《Python Cookbook》(第三版) 中文版 (在线)
No 38. 《大语言模型为何拥有智能 - 知乎》
No 39. 斯坦福《Transformers United》课程2023年秋季第3版，探讨Transformer的工作原理和在各个领域的应用，特别是在语言模型方面，采用讲座、嘉宾讲座和课堂讨论结合的方式授课
No 40. PokerKit：用于模拟扑克游戏和评估扑克手牌的Python库
No 41. [LG]《Gradient-based Planning with World Models》
No 42. Langri-La：使用OpenAI API或Azure轻松使用ChatGPT的实用工具，注重简单架构，以提高可读性
No 43. [CL]《Mindstorms in Natural Language-Based Societies of Mind》
No 44. 研究了如何在消费者硬件上运行大型MoE语言模型，并提出一种新的卸载(offloading)策略，利用MoE LLM的特性加速卸载过程，实现了在桌面硬件和Google Colab实例上的高效运行。//[LG]《Fast Inference of Mixture-of-Experts Language Models with Offloading》
No 45. GitHub: github.com/dvmazur/mixtral-offloading //@爱可可-爱生活:研究了如何在消费者硬件上运行大型MoE语言模型，并提出一种新的卸载(offloading)策略，利用MoE ......
No 46. 今日推介(第1269期)：世界模型中基于梯度的规划、用Transformer语言模型的内部状态进行幻觉检测、基于大语言模型的心智社会与思维风暴、基于Pairwise ......
No 47. Mixtral 8x7B真的能打败GPT-3.5 Turbo吗？
No 48. 科研主管利用ChatGPT提高工作效率
No 49. [CV] DL3DV-10K: A Large-Scale Scene Dataset for Deep Learning-based ......
No 50. [CV] InsActor: Instruction-driven Physics-based Characters ......

爱可可微博热门分享(1.23)

No 1. 你在用什么AI编程辅助工具？- Github Copilot：由Github官方推出的智能编程辅助插件，可以直接集成到VSCode等编辑器或IDE，提供智能代码建议与补全。 ......
No 2. 从零开始实现LoRA
No 3. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 4. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 5. 关于使用RAG模式(Retrieval-Augmented Generation)的应用和资源的信息，包括关于RAG技术的综述，以及一些GitHub库和企业级应用的链接，这些应用使用RAG模型来增强自然语言处理和信息检索能力
No 6. CMU新课：神经代码生成，介绍了使用深度学习方法对...
No 7. 用AI辅助CS50课程教学
No 8. 一键部署开源AI项目列表
No 9. AI Filesystem：本地语义搜索工具，可以在文件夹中进行语义搜索
No 10. OpenGFW：Linux 上灵活、易用、开源的 GFW 实现，并且在许多方面比真正的 GFW 更强大，可以部署在家用路由器上的网络主权，使用场景包括广告拦截、家长控制、恶意软件防护、VPN/代理服务滥用防护、流量分析 (纯日志模式)等
No 11. 大型语言模型有助于计算机程序的发展
No 12. Ragswift：可伸缩的中心化文本嵌入检索平台，可用于快速构建RAG应用，旨在轻松处理规模化的文档摄取、存储和检索任务，通过Ray充分利用分布式计算的强大能力，使用户能在多个CPU和GPU节点上并行处理大规模文档集，支持数十亿个向量的规模
No 13. RAGxplorer：一个交互式工具，用于在嵌入空间中可视化文档块，旨在诊断和探索Retriever-Answer Generator(RAG)模型的应用。该工具允许用户上传文档，将其转换为适用于RAG应用的块格式，并在嵌入空间中可视化这些块
No 14. 晚安～ [月亮]
No 15. 高效LLM和多模态基础模型相关论文资源列表，包括大型语言模型(LLM)、视觉Transformer(ViT)、扩散和LLM基础的多模态模型，它们如何在机器学习生命周期的各个阶段，从训练到部署
No 16. 机器人革命：亚马逊十年见证机器人数量指数级增长
No 17. RAG - Maestro (Now Live!)：使用RAG管道构建的聊天机器人，用于阅读、总结和引用与用户查询相关论文
No 18. 零一万物开源视觉语言模型Yi Visual Language (Yi-VL)，支持多轮文本-图像对话、双语文本支持(英语和中文)、强大的图像理解、高分辨率图像处理等功能
No 19. [CV]《Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data》
No 20. [CL] Large Language Models on Graphs: A Comprehensive Survey ......
No 21. [LG] Zero Bubble Pipeline Parallelism 介绍了一种有效减少流水线并发训练中的流水线空闲时间(pipeline ......
No 22. 向量数据库横向对比，包括Pinecone、Weaviate、Qdrant、Chroma、LanceDB、Milvus、Vespa、Vald、Postgres、Redis、ElasticSearch等
No 23. #抽奖# #赠书# 携手@图灵新知 @图灵文化送出5本《智能文本处理实战》
No 24. 老照片自动着色
No 25. [LG]《Exploring the Power of Graph Neural Networks in Solving Linear Optimization Problems》
No 26. PRISMA：计算摄影流水线，可以从任何图像或视频中执行多个推断(称为“bands”)。类似于光线通过棱镜弯曲成不同波长，这个流水线将图像扩展为可用于3D重建或实时后处理操作的数据
No 27. 面向低级视觉的扩散模型相关论文资源列表，包括了各种扩散模型在低级别视觉任务中的应用，如自然图像恢复、超分辨率、修复、去雾、低光增强等。这些模型在不同领域，包括医学图像分析、遥感图像处理等方面都有应用
No 28. 早！[太阳]
No 29. 几篇论文实现代码
No 30. 今日推介(第1293期)：多解码头的简单LLM推理加速框架、用跨语言专家语言模型打破多语言诅咒、通过修剪无需微调提高已对齐LLM抗越狱能力、释放大规模未标记数据的潜力、图神经网络求解线性最优化问题的潜力 ......
No 31. 理解和编写LLM中的自注意力、多头注意力、交叉注意力和因果注意力
No 32. 通过扩大数据规模和引入辅助监督，构建了一个简单而强大的基础模型，实现了鲁棒的单目深度估计，在泛化能力和性能上取得了显著的提升。//[CV]《Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data》
No 33. 'TCM-Ancient-Books - 中医药古籍文本，近700项' GitHub: github.com/xiaopangxia/TCM-Ancient-Books ......
No 34. Orion-14B 系列模型，具有140亿参数的多语种大模型，在一个包含2.5万亿token的多样化数据集上进行了训练，涵盖中文、英语、日语、韩语等多种语言，包括一系列相关的衍生模型，包括对话模型，长文本模型，量化模型，RAG微调模型，Agent微调模型等
No 35. LLM App Stack：LLM应用栈工具、项目和供应商列表，旨在更全面地覆盖每个类别中的所有可用选项，涵盖了数据管道、嵌入模型、向量数据库、沙盒、编排器、API / 插件、LLM缓存、日志/监视/评估、验证器、LLM API(专有)、LLM API(开源)、应用程序托管平台、云提供商、有见解的云项目列表等类别
No 36. 科学领域预训练语言模型大列表，包括数学、物理、化学、生物学、医学、材料科学和地球科学等领域的模型，涵盖不同的参数规模，从小于100M到700B参数，以及不同的模态(如语言、视觉、分子、蛋白质、图表等)
No 37. Lingo3DMol：结合语言模型和几何深度学习的3D分子生成模型
No 38. 'ChatGPT Next Web LangChain - 一键拥有自己的 ChatGPT 网页服务(基于 langchain ......
No 39. [LG]《Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads》
No 40. 大型语言模型基础知识可视化学习指南
No 41. 资源高效LLM相关论文资源列表
No 42. 宝马与Figure联手，人形机器人将助力汽车制造
No 43. 《AI 研发提效研究：自己动手训练 LoRA》
No 44. [CV] The possibility of making $138,000 from shredded banknote ......
No 45. Even Flow: 旨在创建自组织Python函数的框架，允许程序员定义一系列具有清晰定义的输入和单一输出的函数，然后'Evenflow'会自动将这些函数组合成另一个flowable函数
No 46. [LG]《Pruning for Protection: Increasing Jailbreak Resistance in Aligned LLMs Without Fine-Tuning》
No 47. [CV] Synthesizing Moving People with 3D Control 介绍了一种基于扩散模型的人物动画方法，通过单张图像生成真实的人物运动序列。该方法包括学习人体和服装的隐藏部分，并使用3D人体姿态控制渲染新的身体姿态。实验证明，该方法在生成复杂的姿势和动作时比之前的方法更具鲁 ......
No 48. ❍ Movies Demo：用Ion构建的演示电影应用，演示如何在应用中用AI处理数据
No 49. Plock：可以从任何可以输入的地方使用LLM(大语言模型)，默认情况下使用Ollama，但也可以与其他可以写入stdout的工具一起使用
No 50. [LG] Evolving Code with A Large Language Model 介绍了一种使用大型语言模型(LLM)演化代码的方法。与传统的遗传编程不同，LLM ......

爱可可微博热门分享(1.12)

No 1. 最近试用了网易有道新推的Hi Echo，一款主打虚拟人的口语练习App，在目前的大模型落地应用中算是表现比较突出的，其设计理念体现了大模型个性化服务的精髓：用户可以根据自己的口语水平和学习阶段，选择不同难度的练习，确保了各种水平的学习者都能得到适合的训练。Hi ......
No 2. 给年轻人的一些建议
No 3. ReplaceAnything：高质量内容替换，可用于多种场景，如人物置换、服装置换、背景置换等
No 4. 关于学习，软件开发人员应该了解的10件事
No 5. Perfect Roadmap To Learn Data Science In 2024：关于学习数据科学的新版路线图，包括深入学习Python编程语言，统计学，数据库，机器学习，深度学习，自然语言处理以及MLOPS(机器学习运维)，提供了广泛的学习资源和实际项目实践，是学习数据科学的理想指南
No 6. Maybe: 开源个人财务管理应用，提供包括净值跟踪、金融账户同步、投资基准比较、投资组合分配、债务洞察、退休规划、投资回报模拟以及手动账户/投资跟踪等功能
No 7. 大型语言模型能否识别并纠正它们的错误？
No 8. cutword：一个中文分词库，其字典文件根据最新数据统计得到，词频更加合理，分词速度是结巴分词的两倍
No 9. TrustLLM: LLM(大型语言模型)可信度研究，包括对LLM可信度不同维度的原则制定、建立了六个维度的基准评估，涵盖了真实性、安全性、公平性、鲁棒性、隐私性和机器伦理等方面
No 10. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 11. Reverse Engineering Resources：关于逆向工程的资源集合，旨在帮助人们从零开始学习逆向工程，包含了高质量的学习资源，涵盖了汇编、操作系统内部、反混淆、反调试等多个领域，包括详细的学习路线、针对不同操作系统的指南、汇编项目示例以及关于逆向工程的博客推荐
No 12. KG-RAG：知识图谱检索增强生成框架，将知识图谱(KG)的显式知识与大型语言模型(LLM)的隐式知识结合起来
No 13. skfolio：用于投资组合优化的Python库，建立在Scikit-Learn之上
No 14. Replace Anything：一个简单的网络应用程序，允许用基于描述生成的图像替换图像的任意部分
No 15. spin：在本地复制生产环境，用Docker轻松运行并配置，可以在不同操作系统上运行，包括MacOS、Windows和Linux，通过简单的配置文件实现基础设施的集中管理
No 16. 近年来AI发展里程碑论文集锦： - Transformers: Attention is All You Need 提出了Transformer模型，完全基于注意力机制，摒弃了以往模型依赖的递归和卷积结构，为自然语言处理领域带来了革命性的影响，并极大地提高了机器翻译任务的效率和准确性。 ......
No 17. 晚安～ [月亮]
No 18. 早！[太阳]
No 19. Anim-400K: 大规模的视频配音数据集，包含了英语和日语两种语言的音视频剪辑，由超过425,000个对齐的剪辑(763小时)组成，涵盖了190多种不同的作品，涵盖了数百个主题和流派
No 20. VTable：高性能的多维数据分析表格，不仅能处理百万级数据的快速运算和渲染，还提供强大的图形能力，能自动分析和呈现多维数据
No 21. GPT Stats：自定义聊天GPTs(非OpenAI创建)统计信息，提供最新的热门GPTs及创作者排行榜
No 22. DeepSeekMoE 16B ：DeepSeek开源的大语言模型，采用了创新的混合专家(MoE)架构，包括细粒度的专家分段和共享专家隔离两个主要策略。该模型是从头开始训练的，使用了2T个Token，性能与DeekSeek 7B和LLaMA2 7B相媲美，但计算量仅为其40%左右
No 23. AIlice：轻量级AI代理，同时也是一个简单的开发框架，用于快速构建和尝试各种AI智能体的想法
No 24. 大模型的“涌现能力”可能并不只是规模的直接结果，而是学习过程中某种形式的“认知重组”或“知识内化”，类似于人类认知发展中的某些阶段性质变。例如，儿童在某个年龄段突然能够掌握抽象思维，不仅仅是知识量的增加，而是认知结构的根本改变——所以，大模型“认知发展”阶段的研究也很值得期待。//大模型“涌现现象”存在吗 ......
No 25. Teamlinker：团队协作平台，集成了多功能模块，包括联系人、任务管理、会议、即时通讯、Wiki和文件管理
No 26. Promptuity：提供交互式提示的库，具有高度可扩展性，允许你从头开始构建自己的提示，主要用于Rust语言，可以用于构建命令行工具和交互式应用程序
No 27. Wordflow：社交化、可定制的AI写作助手，可以轻松创建和运行不同的大型语言模型(例如GPT 4和Gemini Pro)的AI提示。用户还可以在社区中发现和分享自己喜欢的提示。特点包括存储和运行喜爱的AI提示、支持多个AI模型、强大的定制化功能以及社区提示的发现和分享
No 28. [CL]《User Embedding Model for Personalized Language Prompting》
No 29. [CL] I am a Strange Dataset: Metalinguistic Tests for Language ......
No 30. 几篇论文实现代码
No 31. [CV] Structure from Duplicates: Neural Inverse Graphics from ......
No 32. GPIOViewer Arduino Library to see live GPIO Pins on ESP32 boards：用于在ESP32开发板上实时查看GPIO引脚状态的Arduino库，有助于简化微控制器项目的故障排除
No 33. [CV]《Score Distillation Sampling with Learned Manifold Corrective》
No 34. 音乐人声分离工具：极简的人声和背景音乐分离工具，本地化网页操作，无需连接外网，使用 2stems/4stems/5stems 模型
No 35. 'ChatGPT-Plus - AI 助手全套开源解决方案，自带运营管理后台，开箱即用。集成了 ChatGPT, ......
No 36. Twinny：为VS Code设计的本地或API主机的AI代码补全插件，类似于GitHub Copilot，但完全免费和100%私密
No 37. LAiW：中文法律大模型综合性基准（狴犴）
No 38. NASA-Earth-Data：包含NASA地球科学数据产品的综合列表，可供研究和分析使用
No 39. 妆容迁移/发型迁移相关资源列表
No 40. SwiftInfer：基于TensorRT实现的Streaming-LLM技术，旨在支持LLM模型进行无限输入长度的推理
No 41. [CL]《Bootstrapping LLM-based Task-Oriented Dialogue Agents via Self-Talk》
No 42. [CL]《The Impact of Reasoning Step Length on Large Language Models》
No 43. Blitzar：旨在加速SQL操作的零知识证明，提供了CPU和GPU上的加速密码学零知识证明算法的C++库，支持多标量乘法、广义Pedersen承诺和多指数运算等密码学原语，能在单个GPU上以极快的速度运行Proof of SQL，同时提供了CPU支持，用于测试
No 44. [CL]《Mixtral of Experts》
No 45. [CV]《InseRF: Text-Driven Generative Object Insertion in Neural 3D Scenes》
No 46. GPT Store发布
No 47. [CL] Attendre: Wait To Attend By Retrieval With Evicted Queries ......
No 48. [CV] PIXART-δ: Fast and Controllable Image Generation with ......
No 49. Hook：图形化的C/C++运行时编辑器，可以用于快速实验，可以连接到正在运行的程序，并允许实时更改变量，避免了繁琐的编辑-编译-运行-编辑的循环，使用C++、CMake和Shell等语言开发
No 50. 大模型“涌现现象”存在吗去年年初大家讲涌现讲得比较多，因为大模型存在涌现现象，所以大家都对大模型的发展非常乐观。涌现的本质是有些困难的任务小模型做不了，大模型突然就能做了，这自然带给大家对未来乐观的预期：就是说我将来把模型做得更大一点，现在尽管很多事都做不好，但是将来一 ......

爱可可微博热门分享(1.16)

No 1. 来来来，说说你最常用的是哪几个？为什么？爱可可-爱生活的微博...
No 2. 大型语言模型基础知识可视化学习指南
No 3. 构建基于大语言模型(LLM)系统和产品的7个关键设计模式
No 4. 《AI 研发提效研究：自己动手训练 LoRA》
No 5. #转发赠书#携手@博文视点Broadview 送出5本《Chatbot从0到1（第2版）：对话式交互实践指南》
No 6. 'WechatAnnualReport - 微信聊天记录导出、微信年度报告生成' GitHub: github.com/chenyifanthu/WechatAnnualReport ......
No 7. 'Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型，支持加载本地知识库做检索增强生成RAG。Training ......
No 8. LLM大众化: 采用4-bit量化的优化LLM推断
No 9. 理解和编写LLM中的自注意力、多头注意力、交叉注意力和因果注意力
No 10. '中文对话0.2B小模型 ChatLM-Chinese-0.2B - 开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调' ......
No 11. 本地LLM运行指南
No 12. metahuman-stream：基于ernerf模型的流式数字人，实现音视频同步对话。基本可以达到商用效果
No 13. Calendar：适合打印的年历，适合安排和回顾全年日程
No 14. CSGHub：开源的大型模型资产平台，类似于本地的Huggingface，可以帮助管理数据集、模型文件、代码等。CSGHub提供类似私有化的Huggingface功能，类似于OpenStack Glance管理虚拟机镜像、Harbor管理容器镜像以及Sonatype Nexus管理制品的方式，以实现对大型模型资产的管理
No 15. 人工智能下一步将如何发展?
No 16. 用大语言模型(LLM)实现音频描述
No 17. 开源语音合成(TTS)项目汇总：XTTS - 网页链接YourTTS - 网页链接FastSpeech2 - 网页链接VITS ......
No 18. 《微软推出 Copilot Pro 订阅：每月 20 美元，可使用 GPT-4 Turbo》
No 19. 每个AI/ML工程师都应该了解的Gen AI框架和工具
No 20. Write You a Vector Database：在关系数据库系统中添加向量功能的教程，在CMU-DB的BusTub教育数据库系统的修改版上实现类似pgvector的能力，包括向量存储、向量表达式和向量索引
No 21. 几篇论文实现代码
No 22. 最近试用了网易有道新推的Hi Echo，一款主打虚拟人的口语练习App，在目前的大模型落地应用中算是表现比较突出的，其设计理念体现了大模型个性化服务的精髓：用户可以根据自己的口语水平和学习阶段，选择不同难度的练习，确保了各种水平的学习者都能得到适合的训练。Hi ......
No 23. PhotoMaker在线Demo：几秒钟内定制照片，无需LoRA训练
No 24. [CV]《Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMs》
No 25. 晚安～ [月亮]
No 26. [CL] Adapting Large Language Models for Document-Level Machine ......
No 27. 早！[太阳]
No 28. Kotomamba：Mamba训练库，支持PyTorch FSDP分布式训练、混合精度训练、V100和A100转换为HF transformers、检查点连续预训练Mamba模型以及指令调整Mamba模型等功能
No 29. [CL]《The Unreasonable Effectiveness of Easy Training Data for Hard Tasks》
No 30. 'CapsWriter-Offline - CapsWriter 的离线版，一个好用的 PC 端的语音输入工具' ......
No 31. pdf2md：将PDF转换成Markdown文件的JavaScript npm库
No 32. mamba.c：纯C语言推断Mamba模型，在CPU上的速度比pytorch更快
No 33. TrustLLM: LLM(大型语言模型)可信度研究，包括对LLM可信度不同维度的原则制定、建立了六个维度的基准评估，涵盖了真实性、安全性、公平性、鲁棒性、隐私性和机器伦理等方面
No 34. [LG]《Graph Q-Learning for Combinatorial Optimization》
No 35. 我个人习惯用Poe，直读链接/PDF、引擎随心换、可定制Bot，结合非官方Python库还可以方便地自动化。引擎层面ChatGPT和Claude用最多，相比之下ChatGPT更“博学”，Claude更懂文字
No 36. [CL]《INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning》
No 37. [LG]《A Turing Test: Are Ai Chatbots Behaviorally Similar to Humans? 》
No 38. Surya：多语言文档OCR工具包，可进行准确的文本行检测，即将推出文本识别功能，以及表格和图表检测功能，可以处理各种类型的文档和多种语言
No 39. 今日推介(第1286期)：多模态LLM视觉缺陷探索、容易训练数据对困难任务不可思议的有效性、不可能语言模型、通过指令微调释放大型语言模型在搜索中的潜力、AI聊天机器人在行为上与人类的相似性 ......
No 40. OpenAI采取多方面举措确保其技术不会用于破坏2024全球大选进程
No 41. [CV] Beyond the Surface: A Global-Scale Analysis of Visual Stereotypes ......
No 42. Summarization Evaluation：自动文本摘要评估工具，可进行无参考评估，支持潜在幻觉检测
No 43. Perfect Roadmap To Learn Data Science In 2024：关于学习数据科学的新版路线图，包括深入学习Python编程语言，统计学，数据库，机器学习，深度学习，自然语言处理以及MLOPS(机器学习运维)，提供了广泛的学习资源和实际项目实践，是学习数据科学的理想指南
No 44. Citadel：电子书库管理工具，与Calibre向后兼容，其目标包括与Calibre兼容、提供良好的用户体验和高性能等
No 45. The Sage Programming Language：Sage是一种编程语言，旨在实现最大的可移植性、表达力和直观性。它借鉴了Rust、C和Python的一些特点，目前具有x86编译器后端、C源代码后端和可以在Web上运行的VM解释器后端
No 46. [CL] Relying on the Unreliable: The Impact of Language Models' ......
No 47. 通过图灵测试，结合行为经济学博弈，全面评估了AI聊天机器人的行为特点和个性特征，发现他们的行为与人类无法区分，并且表现更为合作和利他。
No 48. 图解：API vs. SDK
No 49. 拖延症患者既能用8小时搞定半小时的活，也能用半小时搞定8小时的活。
No 50. 关于生成式AI，技术领导者需要面对的5个残酷事实

爱可可微博热门分享(1.25)

No 1. Hugging Face发布《深度强化学习课程 v2.0》中文版，涵盖深度强化学习主题
No 2. '闯关式 SQL 自学网 - 免费的闯关式 SQL 自学教程网站，从 0 到 1 带大家掌握常用 SQL 语法，纯前端实现，简单易学' ......
No 3. 你在用什么AI编程辅助工具？- Github Copilot：由Github官方推出的智能编程辅助插件，可以直接集成到VSCode等编辑器或IDE，提供智能代码建议与补全。 ......
No 4. 'CUDA高频面试题汇总/C++笔记/CUDA笔记 - CUDA 笔记 / 高频面试题汇总 / C++笔记，个人笔记，更新随缘: ......
No 5. 聊天机器人：改善心理健康的新途径
No 6. Luna AI：全自动的 AI 直播系统，由Cha...
No 7. #抽奖##赠书#携手@博文视点Broadview 送出5本《Llama大模型实践指南》
No 8. PDFToChat：PDF对话项目，使用了一系列技术栈，包括Next.js、Together AI、Pinecone、Bytescale、Vercel等
No 9. GeoGPT+：OpenAI定制模型在地理空间分析的新应用
No 10. Alphabet与AI数据公司Appen断约：AI训练的未来将何去何从？
No 11. [CL] From Understanding to Utilization: A Survey on Explainability ......
No 12. 从零开始实现LoRA
No 13. Lightning Studio：一体化云平台，用于大规模构建和部署人工智能产品
No 14. 物料成本700+元的FOC双轮腿机器人，提供了一种新型结构的轮腿机器人的开源资料，包括机械设计、电子设计、算法仿真和软件开发等材料
No 15. 深度学习自动化测试：DeepLearning.AI的免费LLMOps短期课程
No 16. GPT Newspaper：创新的自主agent项...
No 17. 《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战 - 知乎》
No 18. 看了感觉真可怜。。定睛一看爸爸妈妈好像也是AI生成的图，更可怜了。
No 19. X-Force IDE：低代码、agent即服务的UI框架，通过拖放创建基于agent的工作团队(workforces)，可将创建的工作团队导出为Python脚本，并在本地计算机上运行它们
No 20. 机器学习/深度学习推荐书单，包括作者自己的一本书《...
No 21. Ollama发布Python和JavaScript库：简化应用集成
No 22. AI游戏开发工具集，包括LLM、Agent、Cod...
No 23. Adept Fuyu-Heavy：新的大规模多模态模型
No 24. 晚安～ [月亮]
No 25. OpenGFW：Linux 上灵活、易用、开源的 GFW 实现，并且在许多方面比真正的 GFW 更强大，可以部署在家用路由器上的网络主权，使用场景包括广告拦截、家长控制、恶意软件防护、VPN/代理服务滥用防护、流量分析 (纯日志模式)等
No 26. 闯关式 SQL 自学网//'闯关式 SQL 自学网 - 免费的闯关式 SQL 自学教程网站，从 0 到 1 带大家掌握常用 SQL ......
No 27. rtp-llm 是阿里巴巴大模型预测团队开发的 LLM 推理加速引擎，提供高性能、低成本和用户友好的推理服务，帮助客户和开发人员定制适合其业务的推理服务，从而促进业务增长
No 28. Scalable Vector Search：用于向量相似性搜索的性能库，通过使用本地自适应向量量化和高度优化的索引和搜索算法，使得在数十亿个高维向量上实现了高精度和最先进的速度的向量相似性搜索成为可能，同时使用的内存比其替代品少
No 29. InstantID在线Demo，InstantID是一种基于扩散模型的图像生成技术，专注于实现零样本身份保持(Identity-Preserving)的个性化图像合成，允许用户仅使用一张面部图像，在几秒钟内生成保持身份特征的个性化图像
No 30. Segment Matting：旨在通过SAM(Segment Anything Model)模型来提高图像抠图质量和性能的项目，专注于优化抠图过程，以减少锯齿边缘并提高分割的整体准确性
No 31. '每天一句**古诗词，生成 AI 图片 Powered by Bing DALL-E-3.' GitHub: github.com/liruifengv/daily-poetry-image ......
No 32. SuperNOVA：一个交互式工具，旨在帮助研究人员探索现有的notebook可视化分析工具，并寻找设计灵感和实施参考，收集了160多个notebook视觉分析工具，用户可以在浏览器中探索这些工具
No 33. tsfm：关于时间序列基础模型(TSFM)的开放笔记本和实用工具
No 34. Vlogger：一个通用的人工智能系统，用于生成用...
No 35. moondream1：一个微型(1.6B参数)视觉语言模型，其性能与两倍大小的模型相当，使用LLaVa训练数据集进行训练，视觉基于SigLIP，文本基于Phi-1.5
No 36. Zed：高性能多人协作代码编辑器，由Atom和Tree-sitter的创造者开发，主要特点是其高效的性能和协作功能，及其简洁的用户界面
No 37. Open-LX01：小爱音箱mini定制固件，让小爱音箱mini成为一个完全自主控制的音箱
No 38. 早！[太阳]
No 39. GAIA测试评估排行榜：用于评估大型语言模型(LL...
No 40. Lumiere：Google Research的文本到视频扩散模型，设计用于合成描绘真实、多样和连贯运动的视频，这是视频合成中的一个关键挑战
No 41. nvcc4jupyter: 用于Jupyter Notebook的CUDA C++插件，提供了cell magic和line magic功能，允许在笔记本中运行CUDA C++代码
No 42. Depth Anything在线Demo，Depth Anything是一种鲁棒的单目深度估计解决方案，充分利用各种未标记的图像和预训练模型中丰富的语义先验，具有优异的零样本深度估计能力
No 43. 2023年终总结集
No 44. [CV] CheXagent: Towards a Foundation Model for Chest X-Ray Interpretation ......
No 45. json_repair：修复损坏的JSON文件，尤其是LLM输出的病态JSON文件
No 46. phidata：使用LLM函数调用构建AI助手的框架，允许LLM通过运行函数并基于响应智能选择行动的强大方法，助手具有内置的记忆、知识、存储和工具，使其易于构建各种应用程序，如知识助手、数据助手、Python助手、客户助手、研究助手、营销助手、旅行助手和餐前准备助手
No 47. 几篇论文实现代码
No 48. vx.dev：v0.dev的开源替代，成本可控，高度可定制，无缝集成 GitHub。v0.dev是由Vercel发布的一款AI驱动的用户界面生成工具。它可以根据用户的文本提示即时生成UI组件，并支持实时修改和迭代
No 49. Startup funding simulator：一个开源工具，旨在帮助创业者理解现代融资(使用安全协议)的工作原理，以及在筹集资金时可以预期的稀释程度。Startup funding simulator允许用户添加后金安全协议(Post-money Safes)、定价轮次和向员工发放期权，并可以看到这些操作如何影响他们的所有权
No 50. 大家看得真细，可以作为AIGC反面案例了 //@真十内:放大看了看细节，好怪的图。。[汗]//@BkFs_:好像小女孩划的火柴//@Bruce_Segal:新中式恐怖是吧//@阿尔菲的花匠:看了感觉真可怜

爱可可微博热门分享(1.9)

No 1. 近年来AI发展里程碑论文集锦： - Transformers: Attention is All You Need 提出了Transformer模型，完全基于注意力机制，摒弃了以往模型依赖的递归和卷积结构，为自然语言处理领域带来了革命性的影响，并极大地提高了机器翻译任务的效率和准确性。 ......
No 2. 用MLX在Mac上微调LLM的简单指南
No 3. 理解Mixtral-8x7b
No 4. 2023年终大放送之 TOP50开源项目榜：No. 1 ChatGPT 中文指南，指令指南，精选资源清单，更好的使用 ......
No 5. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风：传奇程序员练级攻略》
No 6. [LG] Improving sample efficiency of high dimensional Bayesian ......
No 7. [CV] Open-Vocabulary SAM: Segment and Recognize Twenty-thousand ......
No 8. 晚安～ [月亮]
No 9. GPT-Analyst：专门用于GPT分析和逆向工程的项目，提供了一系列资源，包括保护GPT提示和防止指令泄露和盗版的综合指南，以及GPT-Analyst工具，用于详细分析系统提示和GPT指令，可以使用不同的命令进行安全分析、操作分析、越狱分析等
No 10. [CV] Progressive Knowledge Distillation Of Stable Diffusion ......
No 11. ToRA: ToRA(Tool-integrated Reasoning LLM Agents)系列工具，旨在通过与其他工具的交互来解决复杂的数学推理问题，使用自主Agent技术，能集成在工具中进行推理，并提供强大的数学推理能力
No 12. 机器学习论文成果发布工具包(开源指南)
No 13. 《‌⁢‍⁡⁢⁤‍⁣⁢⁣‍⁡‍⁤‍⁣⁤⁣‌涓海录AIGC学习文档 - 飞书云文档》
No 14. KAIST课程《3D数据机器学习》，内容涵盖了深度学习在处理和分析3D数据方面的最新进展，包括计算机视觉、计算机图形学和机器人领域的应用
No 15. '开源大模型食用指南 - 基于AutoDL快速部署开源大模型，提供完整指南，包括环境配置、部署和微调，助你轻松掌握各类大模型应用' ......
No 16. 几篇论文实现代码
No 17. [CV]《Denoising Vision Transformers》
No 18. ChatGPT Web Midjourney Proxy：具有中文界面的ChatGPT Web项目，支持midjourney、GPT Store、tts和whisper等功能，提供了自定义API key和base_url的选项
No 19. [LG]《Diffusion Variational Inference: Diffusion Models as Expressive Variational Posteriors》
No 20. LinguaCafe：免费的自托管软件，旨在帮助语言学习者通过阅读来学习词汇
No 21. 今日推介(第1279期)：用长期思维扩展开源语言模型、面向信息抽取的文档图语言模型、通过不一致的解决视角更好地进行反思、去噪视觉Transformer、扩散变分推断 ......
No 22. CivRealm: 基于开源游戏Freeciv-web的学习和推理环境，提供了基于强化学习和语言模型的决策智能体接口，以及训练和评估工具和基线模型，希望成为复杂环境中学习和推理代理的测试平台
No 23. 早！[太阳]
No 24. LiteLlama-460M-1T：4.6 亿参数的“小规模”LLaMa 2开源复现，使用RedPajama数据集的1T Token进行训练，旨在提供原始模型的更易用版本，有助于开发更高效、可扩展的语言模型
No 25. 软件工程大语言模型相关资源列表
No 26. AI Gateway：高性能的AI路由，具有极快速和友好的API，可以将请求路由到100+个LLM(Language Model Model)，提供了一个统一的接口，方便使用者与多个LLM进行交互，并支持生成式AI和语言链等功能
No 27. Augmentoolkit：用于生成多轮对话训练数据的开源工具包，通过配置提示和设置，轻松生成符合特定口味和兴趣的对话。不用OpenAI API，避免了高昂费用和API密钥被撤销的风险
No 28. mistral-haystack collection：包含一系列笔记本和资源的集合，用于构建检索增强生成(RAG)流水线，其中使用了Mistral模型和Haystack LLM编排框架
No 29. AI热门开源项目排行(51-60)51、StableLM简介：StableLM是Stability AI推出的语言模型，旨在提供高性能的自然语言处理功能。地址：github.com/Stability-AI/StableLM52、IF简介：开源的文本到图像模型，具有高度的照片真实感和语言理解能力。地址：github.com/deep-floyd/IF53、OpenFlamingo ......
No 30. ‘国内用户 HuggingFace 高速下载 - 利用HuggingFace的官方下载工具从镜像网站进行高速下载' ......
No 31. [CL]《DocGraphLM: Documental Graph Language Model for Information Extraction》
No 32. Twinny：为VS Code设计的本地或API主机的AI代码补全插件，类似于GitHub Copilot，但完全免费和100%私密
No 33. [CL]《DeepSeek LLM: Scaling Open-Source Language Models with Longtermism》
No 34. Talk2Arxiv：使用ChatGPT让您能与任何ArXiv论文进行对话，利用RAG(检索增强生成)系统，通过解析PDF、文本嵌入和上下文相关性等技术，提供了一个交互式的聊天界面，让您能与论文进行对话和交流
No 35. [CL]《Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives》
No 36. OpenAI对新闻组织诉讼的回应
No 37. '语音识别转文字工具 - Voice Recognition to Text Tool / 一个离线运行的本地语音识别转文字服务，输出json、srt字幕带时间戳、纯文字格式' ......
No 38. 肖像大师：肖像生成项目，提供了中文版的ComfyUI肖像生成器。可以通过选择不同的参数来生成符合要求的肖像
No 39. 使用大型语言模型进行生成式信息抽取(IE)的论文集合，涵盖了命名实体识别、关系抽取、事件抽取等多个信息抽取任务，介绍了学习范式、特定领域、数据增强、评估分析等方面的内容
No 40. llama-cpp-agent Framework：与大型语言模型(LLM)进行交互的工具，提供了一个简单而强大的界面，允许用户与LLM模型聊天、执行结构化函数调用并获得结构化输出
No 41. OpenSPG：基于SPG(Semantic-enhanced Programmable Graph)框架开发的知识图谱引擎，为领域图谱构建提供了明确的语义表示、逻辑规则定义、算子框架( 构建、推理)等能力，支持各厂商可插拔的适配基础引擎、算法服务，构建自定义的解决方案
No 42. 关于开发者在使用大型语言模型(LLM)时选择哪个模型的视角的资源库，列举了当前开发者使用的一些开源和商业LLM，并提供了关于如何选择LLM的指南
No 43. 3D人工智能生成内容(AIGC)的论文和资源列表，旨在跟上未来几个月预期的研究潮流，内容包括文本生成、图像生成、音频生成、3D编辑、人物形象生成、城市/自动驾驶、SLAM、生物医学、4D AIGC等领域。此外，还包括开源实现、非官方实现、数据集、博客文章、教程视频等附加资源
No 44. 检索增强生成(RAG)进阶技巧速查
No 45. 2023年终大放送之 TOP50总榜：No. 1 “ChatGPT指令生成器” 微博正文No. 2 你一直想知道的关于数学的一切 ......
No 46. 提出一种使用扩散模型作为变分后验概率的近似推断算法，通过反转噪声过程在潜变量空间中进行扩散，优化基于边缘似然的下界，提高了变分推断的表达能力和性能。//[LG]《Diffusion Variational Inference: Diffusion Models as Expressive Variational Posteriors》
No 47. [LG] Infinite-LLM: Efficient LLM Service for Long Context with ......
No 48. 自始至终就我一人儿 [笑cry] 评论少可能因为都是技术内容太严肃了，欢迎大家多提好建议～ //@非洲鸡亲爱精诚:爱可可背后是什么大佬在运营？才发现有八十多万关注，每天信息量大到惊人，但大部分内容都没评论没互动[笑cry]
No 49. 关于大型语言模型的实用课程，涵盖了技术、项目和企业解决方案，课程以实践为导向，通过使用OpenAI和Hugging Face库的模型进行实际操作来提供实践经验。课程分为三个主要部分：技术与库、项目和企业解决方案。课程提供了丰富的笔记本和文章，供学习者参考
No 50. 过去50年来最重要的统计学**：反事实因果推断、bootstrapping和基于模拟的推断、过参数化模型和正则化、贝叶斯多层模型、通用计算算法、自适应决策分析、鲁棒推断和探索性数据分析。这些**在统计学和数据科学领域的研究中起到了重要的推动作用

爱可可老师24小时热门分享

微博内容精选

爱可可老师一周论文精选

爱可可微博热门分享(12.29)

No 1. 免费书稿：《深度学习数学工程》
No 2. 26个提示(prompt)优化技巧，帮你更好地使用ChatGPT们：1 - 不需要过多客套，直接表达即可，无需使用'请'、'如果你不介意'、'谢谢'、'我想要'等短语。2 ......
No 3. 深度学习面试题库，涵盖了大模型、计算机视觉、感知算法、深度学习基础与框架等专题，提供详细的题目解析
No 4. CNN Explainer：交互式卷积神经网络(CNN)可视化解释器
No 5. RAG进阶图解
No 6. 2023最受欢迎的Chrome扩展，大多和AI相关
No 7. 我们的AI距离大脑还有多远
No 8. #免费##抽奖# 携手@博文视点Broadview 送出5本《LangChain入门指南：构建高可复用、可扩展的LLM应用程序》
No 9. 在三个复杂度级别上构建基于大语言模型(LLM)的Agent
No 10. 有效利用AI扩展个人认知边界的十个提示
No 11. Mixtral 8x7B真的能打败GPT-3.5 Turbo吗？
No 12. '荀子系列大语言模型 - 一系列针对古籍智能处理的开源模型，特色包括古籍智能标引、信息抽取、诗歌生成、高质量翻译、阅读理解、词法分析和自动标点等功能，旨在提升古籍研究与传承的效率与质量’ ......
No 13. de4py：用于Python逆向工程的工具包，特点包括高级反混淆、执行Python代码、字符串提取、移除退出函数、获取所有函数、Pyshell图形界面等功能，支持GUI和命令行，还有文件分析和行为监控功能
No 14. 早！[太阳]
No 15. 科研主管利用ChatGPT提高工作效率
No 16. 晚安～ [月亮]
No 17. 斯坦福《Transformers United》课程2023年秋季第3版，探讨Transformer的工作原理和在各个领域的应用，特别是在语言模型方面，采用讲座、嘉宾讲座和课堂讨论结合的方式授课
No 18. 《大语言模型为何拥有智能 - 知乎》
No 19. DL3DV-10K Dataset：包含真实场景级视频和场景标注的大型数据集，具有10,510个多视角场景，51.2百万帧，分辨率为4k，还包括140个用于新视角合成(NVS)的基准视频以及来自SOTA NVS方法的训练参数，为深度学习的3D视觉任务提供了丰富的场景和标注信息
No 20. Rust Rustcamp：学习Rust的逐步培训计划，通过严格的培训和实践项目，帮助参与者成为熟练的初级Rust开发者
No 21. Flowpilot：基于openpilot的驾驶辅助系统，可以在Linux、Windows和Android设备上运行，提供了自适应巡航控制(ACC)、自动车道居中(ALC)、预碰撞警告(FCW)、车道偏离警告(LDW)和驾驶员监测(DM)等功能
No 22. 'KS的日语学习工具 v0.2 - 简易日语学习 / 视觉小说阅读辅助工具，特色包括句子分析、游戏文本提取和谷歌翻译等功能’ ......
No 23. [CV] Vision Language Transformers: A Survey 视觉语言Transformer(Vision ......
No 24. Deita：旨在为大型语言模型(LLM)的指令微调提供自动数据选择工具和高质量的对齐数据集，Deita模型能通过比其他SOTA LLM少10倍的指令微调数据进行训练，达到与它们相媲美的性能
No 25. Neural Concatenative Singing Voice Conversion：任意到任意的歌声转换模型，可以将一种歌声转换为另一种歌声
No 26. [CL] What Makes Good Data for Alignment? A Comprehensive Study ......
No 27. [LG]《User Modeling in the Era of Large Language Models: Current Research and Future Directions》
No 28. EricLLM：快速批处理API，用于提供LLM模型的服务
No 29. [CL]《Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4》
No 30. [LG]《Diffusion Models With Learned Adaptive Noise》
No 31. [CV] CogAgent: A Visual Language Model for GUI Agents CogAgent是一种专门用于理解和导航图形用户界面(GUI)的视觉语言模型(VLM)，能识别分辨率为1120×1120的页面元素和文本。CogAgent在各种基准测试中表现优于大型语言模型(LLM)，包括GUI理解任务和视觉问答任务。通过仅依赖视觉输入，CogAgent展 ......
No 32. 提示优化技巧，值得在实践中参考//26个提示(prompt)优化技巧，帮你更好地使用ChatGPT们：1 ......
No 33. '独立开发者出海之路' GitHub: github.com/hua1995116/indiehackers-steps ......
No 34. [LG] Diffusion Models for Generative Artificial Intelligence: ......
No 35. TokenCost：用于计算大型语言模型(LLM)API的Token使用成本，可以准确计算提示Token的数量，并提供使用提示和完成的估计成本，还可以跟踪LLM价格的变化
No 36. 分不清是人还是AI？来，稍微上点难度…… [笑cry]
No 37. Lit-GPT：基于nanoGPT的开源大型语言模型的可定制实现，支持Flash Attention 2、4-bit和80bit量化、LoRA和LLaMA-Adapter微调、预训练等特性，支持 Llama2、Mistral 和 Mixtral 等
No 38. [CL] SOLAR 10.7B: Scaling Large Language Models with Simple ......
No 39. gpt-review：用GPT来进行代码pull requests评审的命令行工具
No 40. Inpaint-iOS：基于CoreML技术的免费开源的修复图片应用，可在iPhone/iPad/MacBook上使用，支持本地处理，无需服务器
No 41. Information Assistant Accelerator：使用Azure OpenAI服务和行业加速器构建的信息助手，结合了Azure AI Search和OpenAI的大型语言模型，提供了自然语言的问答交互，帮助用户查询相关信息，还提供了个性化的AI交互和可自定义的设置，以及解释思维过程、引用和验证内容的功能
No 42. 比llama.cpp快12倍！PowerInfer: 在消费级GPU上进行高速大型语言模型服务，其目标是提供一种利用普通PC上的消费级GPU进行高效语言模型服务的解决方案
No 43. 今日推介(第1268期)：更快更好的自动语音识别编码器、基于近端初始化的扩散模型有效归属推理攻击、基于掩码单元预测的多分辨率语音自监督学习、大语言模型时代的用户建模、基于习得自适应噪声的扩散模型 ......
No 44. [AS]《Zipformer: A faster and better encoder for automatic speech recognition》
No 45. 提出Zipformer，一种更快、更高效、性能更好的ASR编码器模型，通过U-Net结构、重新设计的块结构、新的激活函数和优化器的改进，取得了与Conformer相媲美的结果，并在效率方面有显著提升。
No 46. TACO(Topics in Algorithmic COde generation dataset)：关于算法代码生成的数据集，具有更大规模、更高质量和更精细标签的特点，旨在提供一个更具挑战性的训练数据集和评估基准，用于代码生成模型领域
No 47. PokerKit：用于模拟扑克游戏和评估扑克手牌的Python库
No 48. 2023年AI领域的重要事件和进展
No 49. 提出一种通过学习自适应噪声进程来改进扩散模型的方法，实现了在图像密度估计方面的最先进性能。//[LG]《Diffusion Models With Learned Adaptive Noise》
No 50. notux-8x7b-v1：从Mixtral-8x7B-Instruct-v0.1通过DPO微调而来的预训练的稀疏专家混合生成模型，，目前在Hugging Face Open LLM Leaderboard上排名第一

部分微博内容404了，能否直接分享内容？多谢老师！！！

RT

Recommend Projects

React

A declarative, efficient, and flexible JavaScript library for building user interfaces.
Vue.js

🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
Typescript

TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
TensorFlow

An Open Source Machine Learning Framework for Everyone
Django

The Web framework for perfectionists with deadlines.
Laravel

A PHP framework for web artisans
D3

Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

javascript

JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
web

Some thing interesting about web. New door for the world.
server

A server is a program made to process requests and deliver data to clients.
Machine learning

Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Visualization

Some thing interesting about visualization, use data art
Game

Some thing interesting about game, make everyone happy.

Recommend Org

Facebook

We are working to build community through open source technology. NB: members must have two-factor auth.
Microsoft

Open source projects and samples from Microsoft.
Google

Google ❤️ Open Source for everyone.
Alibaba

Alibaba Open Source for everyone
D3

Data-Driven Documents codes.
Tencent

China tencent open source team.