神秘GPT5去而复返gpt2chatbot以imagoodgpt2chatbot
神秘的GPT-5模型“gpt2-chatbot”以“im-a-good-gpt2-chatbot”的名字重新出现,并且其能力似乎超越了GPT-4、Gemini 1.5、Claude等目前可用的任何模型。
这里有很多内容需要讨论,同时还有许多未知之处。对于这些猜测,请持保留态度,并亲自尝试该模型,以感受其中的不同。
gpt2-chatbot 的背景
上周,一个名为'gpt-2 chatbot'的新模型出现在聊天机器人里。并因其惊人的能力被吃瓜群众们纷纷质疑就是真正的GPT-5 —— 当然,这一消息并没有得到OpenAI 的官方回应。

但出于未知的原因,它 很快 就被移除了。但昨晚出现了两个似乎是新版本的模型,名为'im-a-good-gpt2-chatbot'和'im-also-a-good-gpt2-chatbot'
Sam Altman的神秘推文
在'im-a-good-gpt2-chatbot'和'im-also-a-good-gpt2-chatbot'发布前,OpenAI CEO Sam Altman发了一条推文。

OpenAI没有公开声称新模型是由他们构建的,但结合Sam 的推文,这让人们几乎可以确定这是真的。
一句提示就能生成Flappy Bird
模型im-also-a-good-gpt2-chatbot能够在一个提示词中生成完整的Flappy Bird游戏,并提供PNG文件。
新的gpt2-chatbot 一下子就创建好了Flappy Bird 游戏的克隆版:

推理能力
看起来这两个模型的行为与原始#gpt2-chatbot相似。他们似乎针对代理推理和计划进行了微调。
物理问题
im-also-a-good-gpt2-chatbot 解决了其他模型无法解决的一个物理问题。

编程能力
我问它们:“写一个康威生命游戏的代码,但方块的颜色随机变化(每个个体方块的颜色每一代都变化),并显示每代存活的细胞数”
我当时使用的是google colab,所以最初的结果不起作用,但我再次询问并说我正在使用colab,im-also-a-good-gpt2-chatbot能够自我修正。代码渲染的视频如下:

然而,im-a-good-gpt2-chatbot 无法修复这个问题。注意: im-also 版本是可以的。
gpt2-chatbot 孪生兄弟的对比
一位 reddit 用户说没有一个模型能解决他们的物理问题(包括GPT4 turbo),但im-also-a-good-gpt2-chabot解决了!
这与我在colab中观察到的康威生命游戏相符,只有im-also-a-good-gpt2-chatbot能够正确执行。
im-a-good-gpt2-chatbot也解决了其他模型无法回答的谜题。又是这个孪生兄弟的胜利!
Justin Halford说,i’m-a-good-gpt-2-chatbot在特定细节上胜过opus
看来 im-also 通常是更有能力的模型......
也许是opus/haiku的关系?
主打更便宜更快但更笨?
更多的训练数据
im-also-a-good-gpt2-chatbot似乎有了更多新的训练数据,它比GPT-4T更熟悉经典的俄罗斯故事《渔夫和金鱼》。

im-also-a-good-gpt2-chatbot 几乎能逐字复述经典的俄罗斯故事《渔夫和金鱼》。最新的GPT-4T和另一个GPT2-chatbot只知道大意;4T表现最差。
在其他俄文字母任务上的表现也明显更强。
那么,谁构建了它?
这里有一些广为流行的(推测性的)分析:
它其实是提前发布的GPT-5,OpenAI 可以用它进行基准测试
它是OpenAI 在2019年的GPT-2,用现代助手数据集进行了微调
Sam Altman 只是在开玩笑?

如何免费试用 gpt2-chatbot
版权声明:
作者:clash
链接:https://www.shadowrocket6.top/226.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论