MiniMind 是一个开源的大语言模型(LLM)项目,旨在从零开始,以极低的成本(仅需3块钱)和极短的时间(2小时)训练出一个轻量级的语言模型。该项目由开发者 Jingyao Gong 发起,旨在降低大模型的学习门槛,让更多人能够从零开始训练和理解大模型的原理。
- MiniMind官网入口网址:https://jingyaogong.github.io/minimind/
- MiniMind开源项目地址:https://github.com/jingyaogong/minimind
MiniMind 的核心特点是其极小的模型体积,最小模型体积仅为 GPT-3 的 1/7000,适合个人 GPU 快速训练。项目提供了完整的训练流程,包括预训练、监督微调(SFT)、LoRA 微调、强化学习(RLHF)等全过程代码,并且所有代码均从零开始用 PyTorch 重构,不依赖第三方库。
MiniMind 提供了多种模型版本,包括 MiniMind2 系列和 MiniMind-V(多模态扩展),支持多种训练和推理框架,如 llama.cpp、vllm、ollama 等。项目还提供了丰富的数据集和训练脚本,支持从零开始训练模型,并提供了详细的训练和评估工具。
MiniMind 的目标是推动 AI 社区的进步,让更多人能够理解和参与大模型的开发与训练。通过 MiniMind,用户可以体验从零开始训练一个语言模型的全过程,感受创造的乐趣。
数据统计
数据评估
关于MiniMind特别声明
本站素材下载导航网提供的MiniMind都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由素材下载导航网实际控制,在2025年11月24日 下午11:35收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,素材下载导航网不承担任何责任。
相关导航
AnchorCrafter 是由中国科学院与腾讯联合推出的一项创新技术,旨在通过人工智能生成高保真度的产品推广视频。

可灵大模型
由快手AI团队自研打造的视频生成大模型

MMAudio
MMAudio是一个多模态音频生成模型,旨在通过视频和/或文本输入生成高质量、同步的音频。

天壤小白
语言大模型AI应用开放平台
VASA-1
微软亚洲研究院开发的一款革命性的 AI 模型,能够将静态照片和音频文件结合生成逼真的说话视频
Aidge
Aidge 是阿里巴巴国际数字商业集团推出的一款 AI 驱动的综合 AI 工具套件,旨在简化全球商业运营,特别是针对中小企业(SMEs)和跨境电子商务领域的商家。

MiracleVision奇想智能
美图自研,一款懂美学的AI视觉大模型

Moondream
Moondream 是一个开源的轻量级视觉语言模型,由开发者 vikhyatk 推出,旨在提供高效、灵活的图像理解和文本生成能力。
暂无评论...
