Meta 推出 AI 语言模型 LLaMA,一个有着 650 亿参数的大型语言模型
2 月 25 日消息,meta 在当地时间周五宣布,它将推出一种针对研究社区的基于人工智能 (AI) 的新型大型语言模型,与微软、谷歌等一众受到 ChatGPT 刺激的公司一同加入人工智能竞赛。
meta 的 LLaMA 是“大型语言模型 meta AI” (Large Language Model meta AI)的缩写,它可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。
该公司将提供底层代码供用户使用,因此用户可以自行调整模型,并将其用于与研究相关的用例。meta 表示,该模型对算力的要求“低得多”。
据介绍,该公司正在开发多种参数(7B、13B、33B 和 65B)的 LLaMA。其中,LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tokens 上训练,而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的训练。
与其他大型语言模型一样,LLaMA 的工作原理是将一系列单词作为“输入”并预测下一个单词以递归生成文本。为了这套模型,meta 从使用人数最多的 20 种语言中选择文本进行训练,重点是拉丁语和西里尔字母。
当然,与其他模型一样,LLaMA 也面临着偏见、有毒评论和幻觉的挑战,meta 还需要做更多的研究来解决这类语言模型中的不足。
meta 表示,LLaMA 作为一个基础模型被设计成多功能的,可以应用于许多不同的用例,而不是为特定任务设计的微调模型。通过开源 LLaMA 的代码,其他研究人员可以更轻松地找到限制或消除这些问题的新方法。meta 还在本文中提供了一组评估模型偏差和毒性的基准评估标准,以显示模型的局限性并支持研究人员在这一关键领域的进一步研究。
[img]
值得一提的是,meta 在去年 5 月也曾推出过大型语言模型 OPT-175B。该项目同样也是针对研究人员的,这构成了其聊天机器人 blenterbot 新迭代的基础。
后来,该公司还推出了一款名为“卡拉狄加”(Galactica) 的模型,据称它可以撰写科学文章和解决数学问题,但其演示版本后来被下架,因为它反复生成“听起来很权威”的内容。
相关文章
- 利用人工智能技术,微软推出Code Optimizations助力开发者优化.NET应用和云服务
- 必应聊天新增保存聊天记录功能,灵活管理对话内容
- 王小川解读人工智能技术发展:奇点或将加速到来
- 微软必应聊天(Bing Chat)推出新特性:分享和导出聊天内容功能
- 美图设计室推出"AI海报"功能,降低设计门槛,提高制作效率
- 网络爆红!AI孙燕姿惊人翻唱引起轰动
- 重庆人工智能创新中心:引领「东数西算」战略 助力区域科技创新
- 49%员工担忧人工智能抢走饭碗 微软报告揭示对未来的担忧
- 人工智能生成内容需标识 发布者需对后果负责——抖音平台规范解读
- 李楠分享vivo X Flip使用心得 称其小巧设计打破“魔法数字”
- 巴菲特谈AI:尊重技术进步,也需警惕潜在风险
- 巨大变革与机遇:大模型技术开启人工智能新时代
- Meta纳入Graphcore团队以加强AI处理器技术
- 亚马逊广告业务实现两位数增长 2022年收益达380亿美元
- 微软首席经济学家:人工智能一旦落入坏人之手非常危险
- 联发科AI研究小组发布全球首个繁体中文AI大型语言模型
热门教程
Edge浏览器怎么卸载?完全卸载Edge浏览器的两种方法
2电脑出现百度网盘同步空间怎么删除?四种方法轻松解决!
3电脑鼠标右键菜单选项太多怎么删除?win10清理右键多余选项方法
4Win11激活密钥_最新Windows11产品密钥分享
5微软官方 Win11激活密钥 神KEY (可激活所有版本)
6win11的wifi功能突然消失了怎么解决?win11的wifi功能突然消失的解决方法
7Win11任务栏为什么消失了?Win11任务栏消失的解决方法
8Win10共享文件夹无法访问怎么办?Win10共享文件夹无法访问的解决方法
9Win11正式版激活密钥_永久激活产品密钥
10Win11序列号 Win11永久激活密钥 Win11神KEY
装机必备 更多+
重装教程
大家都在看
电脑教程专题 更多+