Cohere最新力作CommandR模型性能超GPT4价格更有优势

Cohere最新力作CommandR模型性能超GPT4价格更有优势-2

Cohere发布的Command R+模型备受关注, 128k的上下文长度、优秀的函数调用(超越了GPT-4-Turbo)、出色的多语言支持等特点 ,让其成为一大极具竞争力对手。

Command R+是由Cohere 发布的最先进的、优化了检索增强生成(RAG)的模型,专为处理企业级工作负载而设计,首次在Microsoft Azure上推出。

是Cohere 最强大、可扩展的大型语言模型(LLM),专为实际企业用例而生。Command R+加入了专注于高效率和强准确性平衡的R系列LLM,使企业能够超越概念证明阶段,进入AI的生产应用。

与其之前推出的Command R模型一样,Command R+具有128k令牌的上下文窗口,并旨在提供一流的性能:

- 先进的检索增强生成(RAG),减少幻觉

- 支持全球商务运营的10种主要语言的多语言覆盖

- 自动化复杂商业流程的工具使用

该最新的模型在Command R的基础上进一步提升了性能。在可扩展市场类别的相似模型中,Command R+的表现超越了其他模型,并且在关键的商业关键能力方面能与更昂贵的模型竞争。该新模型在保持对数据隐私和安全的承诺的同时实现了这一点。

“与Cohere的合作凸显了我们在AI革命中领导潮流的决心,将创新的Command R+模型带到Azure AI上,”

Microsoft Azure AI平台的CVP John Montgomery说:

“这次合作体现了Cohere 提供全面的AI工具套件的承诺,这些工具使企业能够在坚持最高安全和合规标准的同时实现更多。共同,我们正在为企业AI设定新的可能性标准,培育一个技术放大人类能力和创新的未来。”

Cohere最新力作CommandR模型性能超GPT4价格更有优势-3

(左图) Azure上可用模型在多语言、RAG和工具使用方面的性能比较。性能是基于下文中列出的基准测试的模型得分平均值。

(右图)Azure上可用模型的每百万输入和输出令牌成本比较。

开发者和企业可以从今天开始在Azure上首先访问Cohere的最新模型,不久后将在Oracle Cloud Infrastructure(OCI)以及未来几周内的其他云平台上推出。Command R+也将立即在Cohere的托管API上提供。

“企业显然正在寻找像Cohere最新的Command R+这样高精度和高效率的AI模型,以投入生产使用,”Oracle的应用开发与策略小组副总裁Miranda Nash说。“Cohere的模型已集成在Oracle NetSuite和Oracle Fusion Cloud应用中,帮助客户解决实际商业问题,并在财务、人力资源和市场等领域提高生产力。”

行业领先的RAG解决方案

RAG已成为企业采用LLM并使用自己的专有数据定制化的基础构建模块。Command R+在RAG用例上建立了Command R的卓越性能。

Command R+针对高级RAG进行了优化,提供企业就绪、高度可靠、可验证的解决方案。新模型提高了回应准确性,并提供内联引文以减少幻觉。这一能力有助于企业通过AI扩展,快速找到支持各种商业职能(如财务、人力资源、销售、市场和客户支持等)的最相关信息,覆盖多个行业。

Cohere最新力作CommandR模型性能超GPT4价格更有优势-4

(左图)使用整体评分方案的人类头对头偏好结果,结合了文本流畅性、引用质量和总体效用。在摘要中,引用按句子级别测量,并连接到源文档的一块。Cohere 使用了一个包含250份高度多样化文件和带有复杂指令的摘要请求的专有测试集,类似于API数据。基线模型经过大量提示工程处理,采用少量样本提示(Sonnet)和先总结后插入引用的2步总结(GPT4),而Command R+使用 Cohere 的RAG-API。

(右图)在具有相同搜索工具的不同模型中进行多跳REACT代理的准确性,从维基百科(HotpotQA)和互联网(Bamboogle和StrategyQA)检索。HotpotQA和Bamboogle的准确性通过由提示评估员(Command R、GPT3.5和Claude3-Haiku,以减少已知模型内偏差)进行的三方多数投票来判断, Cohere 使用人类注释在一千个示例子集上进行了验证。StrategyQA的准确性是用最终以是/否判断结束的长形式回答来判断的。使用了(Shin et al. 2023)、(Press et al. 2023)和(Chen et al. 2023)的测试集。

自动化复杂商业工作流程的工具使用

大型语言模型的一个重要承诺是它们不仅能够摄取和产生文本,还能作为核心推理引擎:能够做出决策并使用工具来自动化那些需要智力解决的困难任务。为了交付这一能力,Command R+附带了工具使用功能,可通过Cohere 的API和LangChain无缝自动化复杂商业工作流程。

Cohere 的模型家族与工具结合使用,可以应对重要的企业用例,比如自动更新您的客户关系管理(CRM)任务、活动和记录。这一能力帮助将模型应用从简单的聊天机器人升级为强大的代理和研究工具,以提高生产力。

Command R+的新增功能是 支持多步工具使用 ,它允许模型结合多个工具和多个步骤来完成困难的任务。当Command R+尝试使用工具并失败时,例如遇到工具中的错误或故障,它甚至可以纠正自己,使模型能够多次尝试完成任务,提高成功率。

Cohere最新力作CommandR模型性能超GPT4价格更有优势-5

Cohere 评估了对话式工具使用和单转功能调用能力,使用微软的ToolTalk(Hard)基准测试(Farn & Shin 2023)和伯克利的功能调用排行榜(BFCL)(Yan et al. 2024)。对于ToolTalk,预测的工具调用与真实值进行比较,整体对话成功指标取决于模型召回所有工具调用的可能性,以及避免不良行为(即有不希望的副作用的工具调用)。对于BFCL,在评估中包括了错误修复 - 所有模型都从中受益 - 并报告了所有子类别的平均函数成功率得分。通过额外的人类评估清理步骤验证了错误修复,以防止误报。

全球商务运营的多语言支持

Command R+旨在服务尽可能多的人、组织和市场。Cohere 建立的Command R+,使其在全球商业的10种关键语言上表现出色:英语、法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文。

版权声明:
作者:clash
链接:https://www.shadowrocket6.top/281.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>