3

GitHub 开源项目 jzhang38/TinyLlama 介绍,The TinyLlama project is an open endeav...

 7 months ago
source link: https://zhupeng.github.io/19-29-cg-jzhang38-TinyLlama/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

GitHub 开源项目 jzhang38/TinyLlama 介绍,The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.

compress_github_jingxuan.png

大家好,又见面了,我是 GitHub 精选君!

今天要给大家推荐一个 GitHub 开源项目 jzhang38/TinyLlama,该项目在 GitHub 有超过 4.3k Star,用一句话介绍该项目就是:“The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.”。

TinyLlama_logo.png
llama2-training.png
Pythia_saturation.png

背景介绍:在当今这个数据爆炸的时代,语言模型的训练变得越来越复杂和困难。我们需要巨大的计算资源和时间来训练一个高效的语言模型。然而,这对许多人来说并不现实。与此同时,我们也遇到了如何在有限的内存和计算资源中使用大型语言模型的挑战,特别是在边缘设备上。

项目介绍:” TinyLlama “ 是一个开源项目,旨在预训练一个 1.1B 的 Llama 模型在 3 万亿的 token 上。在一些恰当的优化下,我们可以在短短 “90 天” 内使用 16 个 A100-40G GPUs 来达到这个目标。该项目采用了与 Llama 2 完全相同的架构和 tokenizer,这意味着 TinyLlama 可以在许多基于 Llama 的开源项目中插入并播放。此外,TinyLlama 非常紧凑,只有 1.1B 的参数。这种紧凑性使其能够满足许多需要限制计算和内存占用的应用。

如何使用:访问工程链接,您可以找到该项目的安装和使用指南。代码示例会在项目的 README.md 中给出,用户可以根据自己的需要,选择适合自己的版本进行下载和使用。

项目推介:TinyLlama 是一个令人兴奋的开源项目,它正在积极解决一些关键问题,并在开源社区中得到了广泛的关注。该项目的开发活跃状态,作者在 AI 领域的声誉,以及该项目得到的一些大公司的使用和认可,都使得该项目非常值得一试。此外,该项目的开发者也在开源社区中非常活跃,他们积极地回答问题,帮助新用户并持续改进项目。

以下是该项目 Star 趋势图(代表项目的活跃程度):

TinyLlama&type=Timeline

更多项目详情请查看如下链接。

开源项目地址:https://github.com/jzhang38/TinyLlama

开源项目作者:jzhang38

以下是参与项目建设的所有成员:

TinyLlama

关注我们,一起探索有意思的开源项目。


更多精彩请扫码关注如下公众号。

compress_github_jingxuan.png
Written on January 5, 2024

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK