MiniMind 是一个开源的大语言模型(LLM)项目,旨在从零开始,以极低的成本(仅需3块钱)和极短的时间(2小时)训练出一个轻量级的语言模型。该项目由开发者 Jingyao Gong 发起,旨在降低大模型的学习门槛,让更多人能够从零开始训练和理解大模型的原理。
- MiniMind官网入口网址:https://jingyaogong.github.io/minimind/
- MiniMind开源项目地址:https://github.com/jingyaogong/minimind
MiniMind 的核心特点是其极小的模型体积,最小模型体积仅为 GPT-3 的 1/7000,适合个人 GPU 快速训练。项目提供了完整的训练流程,包括预训练、监督微调(SFT)、LoRA 微调、强化学习(RLHF)等全过程代码,并且所有代码均从零开始用 PyTorch 重构,不依赖第三方库。
MiniMind 提供了多种模型版本,包括 MiniMind2 系列和 MiniMind-V(多模态扩展),支持多种训练和推理框架,如 llama.cpp、vllm、ollama 等。项目还提供了丰富的数据集和训练脚本,支持从零开始训练模型,并提供了详细的训练和评估工具。
MiniMind 的目标是推动 AI 社区的进步,让更多人能够理解和参与大模型的开发与训练。通过 MiniMind,用户可以体验从零开始训练一个语言模型的全过程,感受创造的乐趣。
数据统计
数据评估
关于MiniMind特别声明
本站素材下载导航网提供的MiniMind都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由素材下载导航网实际控制,在2025年11月24日 下午11:35收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,素材下载导航网不承担任何责任。
相关导航
MuseTalk 是一个实时高质量音频驱动唇形同步模型,旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战,尤其适用于实时应用如直播视频 。

53AI
53AI企业大模型应用平台是大中型企业广泛采用大模型落地应用平台,系统实现对全部主流大模型的统一纳管,包括DeepSeeK、OpenAI、Azure OpenAI、文心一言、讯飞星火、零一、LlaMa等。

文心大模型
百度文心,产业级知识增强大模型,包含基础通用大模型及面向重点领域和重点任务的大模型,同时有丰富的工具与平台支撑高效便捷的应用开发,学习效率高,可解释性好,大幅降低AI开发与应...

FaceChain
FaceChain 是一个基于深度学习技术的个性化数字形象生成工具,利用生成对抗网络(GANs)和 Stable Diffusion 模型,通过少量照片生成高度个性化的数字形象。

紫东太初
新一代多模态大模型

Veo3
Veo 3 是 Google DeepMind 推出的新一代视频生成模型,专为电影制作人、故事讲述者和创意工作者设计,将视频与音频无缝结合,开启生成式 AI 的创作新篇章。

硅基流动SiliconFlow
致力于打造规模化、标准化、高效能 AI Infra 平台,提供高效能、低成本的多品类 AI 模型服务,助力开发者和企业聚焦产品创新

Claude
AI 聊天机器人
暂无评论...
