超强AI模型Claude 3智商超我大学舍友!但有点没素质
文字狂徒
2024-05-13 16:02:38
0

人工智能创业公司 Anthropic 近日宣布推出其突破性的 Claude 3 系列模型,该系列大型语言模型 (LLM) 在各种认知任务上树立了新的性能标杆。

Claude 3 系列包含三个子模型,分别为 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。

发布以来,它被誉为比 OpenAI 的 ChatGPT 和谷歌的 Gemini AI 更熟练、更博学、更善于推理。

根据 Anthropic 的研究,在这三种模型中,Opus 在几个关键领域的表现优于 GPT-3.5、GPT-4 和谷歌的 Gemini。

测试的技能包括常识、本科生水平的知识、研究生水平的专家推理、基础数学、数学问题解决和编码。

Anthropic 表示,凭借更高级的训练和知识,Claude 3 在复杂任务中表现出 “接近人类水平的理解力和流畅性”。

经过实测,Claude 3 可以在一分钟内抓取超过 200 篇最新论文,然后完成学习并回答相关问题。

Claude 新版本的响应速度也更快。Sonnet 是 Claude 2 和 Claude 2.1 的两倍,而且更加智能。

因此,Anthropic 宣称这种模式是检索信息或自动销售的理想选择。Haiku 是三者中速度最快的,它能在三秒内读完一篇带有图表的密集研究论文。

Anthropic 还称 Claude 3 比以前的版本更准确、更不易出错。为了测试这一点,该公司向不同的模型提出了大量复杂的事实性问题。

在使用 Opus 模型时,Claude 3 的正确答案是 Claude 2.1 的两倍,而错误答案则更少。

为了避免提供有害信息,人工智能通常会拒绝回答被认为不恰当的问题。但有时它们也会把无害的提示误解为有害的。

在 Anthropic 的测试中,Claude 3 比以前的版本更少出现拒绝回答无害提示的情况。

在这方面,三个 Claude 3 模型都能更好地理解请求,并能更好地区分有害和无害的问题。

不过在网友的“引导”下,Claude 3 还是被迫没素质起来,和我舍友玩 LOL 时不分伯仲。

Anthropic 还称 Claude 3 更易于使用,能够接受更长的提示,并能更好地保留以前提示的信息。

Claude 的一项重大改进是其接受上传文件的能力。现在,用户可以向它发送各种类型的文件,包括图片、PDF、文本文件、Microsoft Office 文件、CSV 文件和 HTML 文件。

Claude 会对文件内容进行分析、总结并回答相关问题。不过,Claude 3 还是无法生成图片。

根据 36 氪的报道,Opus 在多项 AI 系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界 LLM 的性能。

在 Maximumtruth.org 进行的智商测试中,Claude3 的 IQ 智商测试首次突破 100,达到人类平均水平。而我的大学舍友,玩个薇恩打完团满血满蓝,一般认为他的智商低于 90。

虽然 AI 智商测试超过 100 很惊人,但更惊人的是 AI 智商的增长速度。

Claude 3 系列模型在分析预测、创建细微内容、代码生成,以及用西班牙语、日语、法语等非英语语言交流的能力上都实现了显著进步。

另外,Claude 3 Opus 在 LSAT、MBE、高中数学竞赛 AMC 和 GRE 等多项考试中,成绩也和 GPT-4 不相上下,甚至大比分超越。

据称,它甚至帮科学家完成了某种算法。

在上下文窗口大小方面,Claude 3 系列模型在发布时将提供 20 万 token 的上下文窗口。

并且这三个模型都能够接受超过 100 万 token 的输入,Anthropic 未来可能会增加对更大上下文窗口的支持。

Opus 和 Sonnet 目前已集成到 Anthropic 的 Claude.ai 和 Claude API 中,可在 159 个国家 / 地区使用,Haiku 将很快推出。

Sonnet 也可以通过亚马逊云科技的 Bedrock 服务以及谷歌云 Vertex AI Model Garden 的私人预览渠道获得,Opus 和 Haiku 也将在不久后登陆这两个平台。

要试用 Claude 3,可以访问其官方网站。Claude Pro 每月收费 20 美元,使用更先进的 Opus 模型,并提供一些特权,如高峰期优先访问和提前使用新功能。

Anthropic 是由 OpenAI 的前成员创立的。

2021 年,一批 OpenAI 前员工不满于该组织在获得微软的投资后向封闭化方向发展,因而离开,并一同创立了 Anthropic。

他们对 OpenAI 在安全问题尚未解决的情况下便发布 GPT-3 的行为感到不满,并声称该组织已经为谋取利益而 “忘记了初心”。

这些前员工当中,包括拥有 GPT-2 以及 GPT-3 研究领域副总裁职位的 Dario Amodei,自 2016 年进入 OpenAI,并在过去担任该组织的研究副总裁,为其担当核心位置。

Anthropic 呼吁对人工智能采取更安全的方法,专注于创建遵循规则的模型,其推理过程是人类可以理解的。Anthropic 目前已获得来自谷歌、亚马逊等 26 个机构或个人的融资,总计融资金额达到了 76 亿美元。

公司的第一版 Claude 于 2023 年 3 月向公众发布。随后,Claude 2 于 2023 年 7 月发布。

Claude 3 在与使用者的对话中,将自己描述为一个具有自然语言处理能力的人工智能,同时还说:

“我要强调的是,我不是一个有生命的人,而是一个经过训练的非常先进的语言模型,它乐于助人、诚实、无害。我实际上没有情感体验,也没有主观经验。我的反应是高度复杂的模式识别和语言生成的结果,而不是内在的精神生活。”

相关内容

超强AI模型Claude ...
人工智能创业公司 Anthropic 近日宣布推出其突破性的 Cl...
2024-05-13 16:02:38

热门资讯

餐饮股早盘回暖 海底捞涨超7%... 餐饮股早盘回暖,海底捞(06862)上涨7.34%,报13.16港元;奈雪的茶(02150)上涨2....
外交部:在中国不存在所谓“脱北... 1月24日,外交部发言人汪文斌主持例行记者会。 韩联社记者提问,韩国政府在日内瓦举行的联合国人权理...
ALCO HOLDINGS(0... 格隆汇3月8日丨ALCOHOLDINGS(00328.HK)公告, 董事会欣然宣布,配售协议所载全部...
连续涨停个股 谁在抱团拉升?谁...   1月18日晚间,多家A股公司发布股票交易异常波动风险提示公告。从龙虎榜数据来看,游资和散户是多只...
智通港股早知道 恒指季检结果... 【今日头条】香港特区政务司司长8字评人口止跌回升:人口回升,吉祥之兆香港人口止跌回升成为近期备受关注...
《FF7重生》内容非常丰富!两... 我们已经知道,《最终幻想7重生》的实体版本将会有两张光盘,然而在最近游戏的联合制作人表示,两张光盘都...
护盘资金现身!中央汇金公司:将...   2月6日9时41分,中央汇金公司官网发布公告称,充分认可当前A股市场配置价值,已于近日扩大交易型...
2024年1月29日全国主要批... (原标题:2024年1月29日全国主要批发市场澳洲龙虾价格行情) ...
周易里面的精髓有哪些 谢咏易经文化详解~周易里面的精髓有哪些《周易》,又名《易经》或《易》,曾被认为是一本预测的书,后来成...
先声药业(02096HK):S... 格隆汇3月10日丨先声药业(02096.HK)发布公告,于北京时间2024年3月9日,集团自主研发的...