2024-04-19 08:53来源:得道网
得到亚马逊(Amazon)和谷歌(Google)支持的美国人工智能初创企业Anthropic最近推出了一款聊天机器人,其直接目标是挑战生成式人工智能(generative AI)的领导者OpenAI。
这家位于旧金山的公司表示,这款名为Claude 3的聊天机器人提供了“智能的新标准”,其性能优于谷歌的Gemini和OpenAI的ChatGPT。
克劳德3“在广泛的认知任务中设定了新的行业基准……(它的)模型在遵循复杂的、多步骤的指令方面做得更好”,Anthropic表示。
“他们特别擅长坚持品牌声音和回应准则,并开发用户可以信任的面向客户的体验。”
Claude 3包含三个大型语言模型(llm),其底层算法使用深度学习并分析大量数据以生成内容。
法学硕士包括俳句、十四行诗和作品,每一个都提供“越来越强大的性能,允许用户为他们的特定应用选择智能、速度和成本的最佳平衡”。
Anthropic以艺术作品来命名Claude 3的法学硕士——俳句是三行诗,十四行诗有14行,而作品是一篇作文——每一篇都提供了相对于其定义的更高的能力。
该公司表示,俳句可以将“成千上万”的文件总结为结构化数据,十四行诗有助于对话和翻译语言,而Opus“达到了接近人类的理解能力”,可以充当经济分析师。
Anthropic为Opus提供的一个例子是查找美国国内生产总值(gdp)趋势,并将其列在表格中。
根据Anthropic的基准统计数据——与目前商业上发布的评估(一种评估法学硕士的行业术语)的法学硕士进行比较——Claude 3的表现优于Gemini和ChatGPT。
例如,在小学数学方面,Opus的准确率为95%,而OpenAI的GPT-4和Gemini 1.0 Pro的准确率分别为92%和94.4%。
在文本推理方面,这三个数字分别为83.1%、80.9%和82.4%,而在常识方面,这三个数字分别为95.4%、95.3%和87.8%。
也许最能说明问题的数据是,Claude 3可以总结多达15万个单词,而ChatGPT只能总结3000个单词。
虽然一些结果显示Claude 3以微弱优势获胜,但一致认为Opus在每个指标上都优于ChatGPT和Gemini。
在低端,Sonnet和Haiku的表现也大大优于GPT-3.5和Gemini 1.0 Pro。
与之前的作品相比,十四行诗的速度比克劳德2和克劳德2.1快两倍。Opus可以提供与Claude 2和2.1类似的速度,但“具有更高的智能水平”。
十四行诗和作品现在在159个国家可以买到,包括阿联酋。该公司表示,俳句将很快推出。
克劳德3是英语的,可以用其他语言交谈,包括西班牙语,日语和法语。Anthropic没有提供完整的语言列表。
俳句是最实惠的选择,每百万代币(MTok)的输入价格为0.25美元,输出价格为1.25美元,而十四行诗的价格为3美元和15美元。不出所料,Opus是最贵的,分别为15美元和75美元。
相比之下,OpenAI的GPT-4 Turbo的输入价格为10美元,输出价格为30美元,而且上下文窗口也更小,只有12.8万MTok。
人工智能中的符号是计算文本长度的基本单位,可以包括标点符号和空格。令牌计数因语言而异。
根据Claude 3的模型卡,Opus和Sonnet面向企业,“旨在使企业能够自动化任务,通过面向用户的应用程序产生收入,进行复杂的财务预测,并加快各个领域的研究和开发”。