时间:2025-05-06 来源:网络 人气:
哇,你知道吗?最近有个超级酷的AI测试游戏横空出世,它不仅让AI们有了“一决高下”的机会,还让咱们普通人也能参与到这场智能的较量中来!没错,就是那个风靡全球的《我的世界》!
想象一群AI在《我的世界》里大显身手,用方块搭建出各种奇妙的建筑,而你,就是那个评委!是不是很激动?
这位神奇的组织者,竟然是一位年仅12岁的高中生,名叫Adi Singh。他创建了一个名为MC-Bench的网站,专门用来测试AI在《我的世界》中的表现。?
在这个平台上,AI们会根据相同的提示,在《我的世界》中搭建出各种建筑。而你,作为评委,可以在不知道哪个作品是哪个AI创作的的情况下,为它们投票。?
别看Adi Singh年纪小,他的想法却非常前卫。他选择《我的世界》作为AI测试平台,不仅仅是因为这款游戏的热度,更是因为它的高普及度和人们对其视觉风格的熟悉度。
“即使你没玩过《我的世界》,也能一眼看出哪个方块状的菠萝更逼真。”Adi Singh这样解释道。
MC-Bench目前主要进行的是相对简单的建筑任务,比如根据“冰霜之王”或“原始沙滩上的迷人热带小屋”这样的提示,让AI编写代码来创建相应的游戏结构。
这种测试方式的好处是,用户无需深入研究复杂的代码,仅凭直观的视觉效果就能判断作品的优劣。
当然,MC-Bench不仅仅是一个简单的AI测试游戏,它还具有一定的创新性。
Adi Singh表示,他们目前进行的测试仍然较为基础,主要用于观察AI从GPT-3时代至今的进步。
未来,他们或许会拓展到更复杂的目标导向任务和长期规划能力评估,游戏或许是测试AI智能体推理能力的一种理想方式。
“相比现实世界,它更安全,也更可控。”Adi Singh这样说道。
值得一提的是,MC-Bench得到了包括Anthropic、谷歌、OpenAI和阿里巴巴在内的多家顶尖AI公司的支持。
这些公司为MC-Bench提供了AI计算资源支持,但并未直接参与开发。
“这让我们能够更好地专注于测试本身,而不是计算资源。”Adi Singh表示。
MC-Bench的出现,无疑为AI评测领域带来了新的视角。它不仅让AI们有了“一决高下”的机会,还让咱们普通人也能参与到这场智能的较量中来。
Adi Singh表示,他们希望MC-Bench能够帮助AI开发者判断自己是否走在正确的方向上,为AI技术的发展提供有益的参考。
“未来,我们希望MC-Bench能够成为AI评测领域的一个重要平台,让更多的人参与到这场智能的较量中来。”Adi Singh充满信心地说道。
这个最新的AI测试游戏《我的世界》不仅让AI们有了“一决高下”的机会,还让咱们普通人也能参与到这场智能的较量中来。让我们一起期待,AI在《我的世界》中创造更多奇迹吧!