- 微软正在训练一种新的内部 ai 语言模型,目的是与谷歌和 openai 的模型竞争
- 新模型由谷歌 deepmind 联合创始人梅斯塔法・苏莱曼领导开发,预计参数规模将达到5000亿
- 微软将在未来的 build 开发者大会上预览新模型
站长之家(chinaz.com) 5月7日 消息:据外媒the information报道,微软正准备推出一种新的、内部 ai 语言模型。
新模型内部代号为 mai-1,由最近加入微软的梅斯塔法・苏莱曼负责,他是谷歌 deepmind 的联合创始人,也是人工智能初创公司 inflection 的前 ceo。两名了解该努力的微软员工透露说,这一模型的确切目的尚未确定,将取决于其表现如何。微软可能会在本月晚些时候的 build 开发者大会上预览这一新模型。
图源备注:图片由ai生成,图片授权服务商midjourney
据报道,mai-1的规模将 “远远大于” 微软此前训练过的较小的开源模型,这意味着成本将更高昂。微软上个月推出了一种规模较小的人工智能模型 phi-3-mini,目的是吸引更广泛的客户群体,提供成本效益较高的选择。该公司已经向 openai 投资了数十亿美元,并在其一系列办公软件中部署了 chatgpt 技术,使其在生成式人工智能竞赛中处于领先地位。微软一直在预留大量配备英伟达图形处理单元和大量数据的服务器集群,以改进模型。
据报道,mai-1将拥有大约5000亿参数,而 openai 的 gpt-4据说拥有一万亿参数,phi-3mini 的参数数量为38亿。微软于三月份任命梅斯塔法・苏莱曼为其新成立的消费者人工智能部门负责人,并雇佣了 inflection 的多名员工。报道补充说,新模型并非来自 inflection,尽管它可能基于该初创公司的训练数据。