Meta 推出 AI 语言模型 LLaMA，一个有着 650 亿参数的大语言模型

(相关资料图)

IT之家 2 月 25 日消息，Meta 在当地时间周五宣布，它将推出一种针对研究社区的基于人工智能 (AI) 的新型大型语言模型，与微软、谷歌等一众受到 ChatGPT 刺激的公司一同加入人工智能竞赛。

Meta 的 LLaMA 是“大型语言模型 Meta AI” （Large Language Model Meta AI）的缩写，它可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。

该公司将提供底层代码供用户使用，因此用户可以自行调整模型，并将其用于与研究相关的用例。Meta 表示，该模型对算力的要求“低得多”。

据介绍，该公司正在开发多种参数（7B、13B、33B 和 65B）的 LLaMA。其中，LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tokens 上训练，而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的训练。

与其他大型语言模型一样，LLaMA 的工作原理是将一系列单词作为“输入”并预测下一个单词以递归生成文本。为了这套模型，Meta 从使用人数最多的 20 种语言中选择文本进行训练，重点是拉丁语和西里尔字母。

当然，与其他模型一样，LLaMA 也面临着偏见、有毒评论和幻觉的挑战，Meta 还需要做更多的研究来解决这类语言模型中的不足。

Meta 表示，LLaMA 作为一个基础模型被设计成多功能的，可以应用于许多不同的用例，而不是为特定任务设计的微调模型。通过开源 LLaMA 的代码，其他研究人员可以更轻松地找到限制或消除这些问题的新方法。Meta 还在本文中提供了一组评估模型偏差和毒性的基准评估标准，以显示模型的局限性并支持研究人员在这一关键领域的进一步研究。

值得一提的是，Meta 在去年 5 月也曾推出过大型语言模型 OPT-175B。该项目同样也是针对研究人员的，这构成了其聊天机器人 blenterbot 新迭代的基础。

后来，该公司还推出了一款名为“卡拉狄加”(Galactica) 的模型，据称它可以撰写科学文章和解决数学问题，但其演示版本后来被下架，因为它反复生成“听起来很权威”的内容。

IT之家附官方链接：

推荐内容

Meta 推出 AI 语言模型 LLaMA，一个有着 650 亿参数的大语言模型

每日消息!News Analysis: Huawei Hurtles to “Smart Selection” From HI Business Model

每日快讯!European Commission bans TikTok from official devices

焦点资讯：Chinese EV Maker JAC Group Unveils China's First Sodium-ion Battery Vehicle

聊一款普及32GB大内存的商务本

ROG 超杀 27 OLED 显示器即将发售，2K 240Hz 规格

Blackmagic发布ATEM Microphone Converter转换器

富士相机新镜头：森养 2 月 28 日发布 X 卡口新品

生存恐怖游戏《灰岭事件》即将登陆Steam，讲述“外星人入侵”

News Analysis: Huawei Hurtles to “Smart Selection” From HI Business Model

European Commission bans TikTok from official devices

环球微头条丨广东：金融助力粤澳合作

当前关注：护好黑土地，端稳中国饭碗

当前热点-第三十五届北京图书订货会开幕：书展回归，点燃全民阅读热情

消息！冠心病必备三种药_女性的冠心病早期症状

天天关注：脉冲式电子围栏

环球视讯！新集能源: 新集能源关于持股5%以上股东进行股票质押式回购交易的公告

郭明錤：苹果将推出更便宜的第二代AR/VR头显

消息称三星 2024 年将发布 6 款折叠屏设备

4999 元，华硕无畏 15i 轻薄本发布：2.8K 120Hz OLED 屏