Meta Llama 3开源大语言模型正式发布

xuhua

(@xuhua)

帖子: 52

会员 Admin

社区贡献点: 625

楼主

Meta 公司今天发布新闻稿，宣布推出下一代大语言模型 Llama 3，共有 80 亿和 700 亿参数两种版本。

Meta 公司今天发布新闻稿，宣布推出下一代大语言模型 Llama 3。

访问链接：

官方页面

首批发布的Llama3 8B和Llama3 70B包括预训练和指令微调版本，8K上下文，在两个24K GPU定制集群上使用15万亿tokens数据训练而成，Meta称它们分别是80亿和700亿参数上最好的模型，同时一个参数超过400B的「最大Llama3」也在训练中。

Meta 声称，Llama 3 的性能优于 Claude Sonnet、Mistral Medium 和 GPT-3.5。

Meta表示，新一代Llama3在Llama 2 的基础上有了重大飞跃，确立了 LLM的新标准。在预训练和后训练过程上的改进大大降低了错误拒绝率，提高了一致性，并增加了模型响应的多样性。在推理、代码生成和指令遵循等方面都得到了极大改善，使得 Llama 3 更加可控。

已发布 : 19/04/2024 10:59 上午

板块跳转:

欢迎来到AI爱好者