收起左侧
发新帖

xAI宣布开源大语言模型Grok-1并开放下载

时间:2024-3-18 09:39 0 789 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x
3月18日消息,美国当地时间周日,埃隆·马斯克(Elon Musk)旗下的人工智能初创企业xAI宣布,其大语言模型Grok-1已实现开源,并向公众开放下载。感兴趣的用户可通过访问GitHub页面github.com/xai-org/grok来使用该模型。
xAI介绍称,Grok-1是一款基于混合专家系统(Mixture-of-Experts,MoE)技术构建的大语言模型,拥有3140亿参数。近期,公司发布了Grok-1的基本模型权重和网络架构详情。
该公司表示,Grok-1始终由xAI自行训练,其预训练阶段于2023年10月完成。此次发布的是Grok-1预训练阶段结束时的原始基础模型检查点,即该模型未经过针对任何具体应用的微调。
xAI强调,Grok-1的权重和架构均依照Apache 2.0开源许可协议发布。
xAI还特别强调了Grok-1的几大特性:
首先,Grok-1是一个未针对特定任务进行微调的基础模型,它基于大量文本数据训练而成;
其次,作为一款基于混合专家技术构建的大语言模型,Grok-1拥有3140亿参数,在处理每个token时有25%的权重处于活跃状态;
最后,Grok-1是xAI团队使用JAX和Rust编程语言自定义训练栈从零开始训练的成果,训练完成于2023年10月。
DSC0000.jpg

此外,xAI还提到,Grok-1的封面配图是借助人工智能绘图工具Midjourney生成的,基于以下提示创作而成:展示一个3D插图的神经网络,其中包含透明的节点和发光的连接线,通过线条的粗细和颜色变化来表示权重的不同。(辰辰)

                    
               
               
               
               
               
               
                    
                        延伸阅读
                        
                           
                           
                           
                                美媒:新版CarPlay成苹果进军汽车业的最后希望
                           
                           
                           
                           
                                MEGA真实订单约4000,理想当务之急是稳住L系列
                           
                           
                           
                           
                                欧阳明高院士回应电动车质疑:不能动摇、无需改变
                           
                           
                        
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部