评论

Meta 推出先进的人工智能模型,推出 Llama 4 系列

meta-unveils-advanced-ai-models-introducing-llama-4-series

Meta 公司本周末发布了 Llama 4,这是其著名的人工智能模型系列的最新一代产品,具有更强的文本、图像和视频处理能力。发布的日子对科技巨头来说很不寻常,是星期六、 拉马 4 中国的 DeepSeek 等公司的开源产品在某些基准测试中甚至超过了以前的 Llama 型号。

Llama 4 系列的最新成员包括 Scout、Maverick 和即将推出的 Behemoth 型号。据 Meta 公司称,每个变体都经过了大量无标记多媒体数据存储库的训练,增强了全面理解和生成视觉内容的能力。这些进步似乎是对 DeepSeek 能力的直接回应,促使 Meta 公司召集了专门的团队,负责剖析竞争对手是如何以更低的运营成本高效地提供强大的人工智能模型的。

Meta 推出 Llama 4 系列产品 这显然标志着人工智能工具开发的一个重要关头,为其人工智能生态系统的广阔未来奠定了基石。

Meta 的最新创新产品 Scout 和 Maverick 已经可以通过 Llama.com 和 Hugging Face 等平台访问,从而使更多开发人员能够获得这些尖端资源。相反,体型更大的 Behemoth 仍在接受严格的培训,预计将于稍后推出。值得注意的是,这家科技巨头已经开始将 Llama 4 模型集成到其人工智能支持的助手 Meta AI 中,将这一先进功能引入到 Messenger、WhatsApp 和 Instagram 等流行应用程序中,供遍布 40 个国家的用户使用,不过目前多模态功能仅限于美国用户使用英语进行交互。

近距离观察特立独行、侦察兵和巨兽的能力

为了凸显这些新模型的能力,Maverick 包含了 4000 亿个庞大的参数,但通过其由 128 位不同 "专家 "组成的网络,只主动利用了其中的 170 亿个参数。在人工智能模型中,参数与其解决各种问题的效率密切相关,Maverick 在以创造力为导向的任务(如内容合成和基于对话的应用)中表现尤为突出。令人印象深刻的是,Meta 声称 Maverick 在多语言交互、扩展对话语境、重逻辑任务和某些编码考试等领域的表现优于竞争对手,如谷歌的 Gemini 2.0 和 OpenAI 的 GPT-4o。不过,它略微落后于谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等最新机型。

相比之下,Scout 擅长总结和在庞大的代码库中执行逻辑运算,拥有处理多达 1000 万个标记输入的非凡能力--相当于数百万字的庞大文本汇编。这一显著特点增强了 Scout 对需要复杂理解和细致总结大量文件的应用程序的吸引力。更引人注目的是,Scout 可在单个 Nvidia H100 GPU 上有效运行,而 Maverick 则需要更强大的 Nvidia H100 DGX 或同等性能基准的硬件。

即将推出的重量级产品 Behemoth 承诺提供更高的性能指标,并要求相应的强大硬件。Behemoth 的总参数规模接近两万亿个,并主动采用了约 2880 亿个参数,在以 STEM 为重点的关键评估中将 GPT-4.5 和 Claude 3.7 Sonnet 等竞争机型甩在了后面。尽管如此,即使是这种先进的迭代也无法超越谷歌最新的 Gemini 2.5 Pro,这表明人工智能性能的顶级竞争已变得多么激烈。

然而,这些新的 Llama 迭代产品都不像 OpenAI 的 o1 和 o3-mini 所倡导的那样,主要侧重于 "推理模型",后者采用事实验证来提高回复的准确性,但却牺牲了即时性。尽管存在这种限制,Meta 还是通过公司代表向用户保证,Llama 4 模型将持续提供平衡、准确的回复,并承诺将继续改进,以防止出现偏向特定观点或政治倾向的情况。

有趣的是,这些保证是在围绕人工智能的紧张政治气氛下做出的,与前总统唐纳德-特朗普结盟的权势人物,如埃隆-马斯克和投资者大卫-萨克斯,对流行的人工智能聊天机器人表示出越来越多的怀疑,怀疑它们压制保守意识形态。马斯克的创业公司xAI本身也曾被指责有偏见,这说明要制造完全中立的人工智能对话模型普遍存在困难,而且尚未解决。因此,Meta 与 OpenAI 等竞争对手一起,开始努力提高模型的透明度和响应能力,尤其是对公众提出的政治敏感或有争议的问题。

分享

添加评论

在应用程序中看起来更好

我们使用 cookie 来改善您的网站体验。如果您继续使用本网站,我们将认为您对本网站感到满意。

登录/注册

加入最大的人工智能社区,发现最新的人工智能工具、有用的教程和独家优惠。