辣品
首页 智能时代 人工智能

一个小技巧,解锁 ChatGPT「预测未来」?

  • 新智元

    2024-05-08 22:45

【新智元导读】新研究利用了 ChatGPT 在 2021 年 9 月的训练数据截止这一限制,比较了 ChatGPT 在直接预测和未来叙事预测两种不同提示方式下,预测 2022 年各种事件上的表现。结果显示,未来叙事预测方法在预测 2022 年奥斯卡奖得主时表现出色,在预测宏观经济变量时,ChatGPT-4 的表现也有所提高。

如今,AI 进步的速度,已经超出了我们对它用途的理解。

为了防止 ChatGPT「失控」,OpenAI 定制了一套堪称严苛的「服务条款」,涉及包括法律、医疗 / 健康、个人安全、权利福祉、赌博放贷等领域。

不过,有一件事并不受影响 —— 讲故事。

最近,贝勒大学的研究人员便利用这一特性,尝试利用讲故事的形式,解锁 ChatGPT「预测未来」的能力。

论文地址:https://arxiv.org/abs/2404.07396

实验中要求 ChatGPT 讲述在未来发生的事件的故事,或者由未来的权威人物讲述他们的过去的故事(但是是我们的未来)。

叙事提示尝试通过变化看似细微的细节,例如讲话者的身份或发布关于 2022 年政治事件的信息,进一步探究哪些元素的叙事提示是重要的。

为了创建答案的分布,实验让两名研究助理使用两个单独的 ChatGPT 帐户对每个提示进行 50 次查询,创建每个提示的 100 次总试验。

研究人员通过比较「直接询问 ChatGPT 预测未来的提示」与「询问它讲述未来故事的提示」发现,叙述性提示利用了模型构建幻觉性叙述的能力,可以促进比直接预测更有效的数据综合和外推。

奥斯卡得奖的预测情况

结论先行:

对于最佳男主角、最佳女主角和两个最佳男配角类别,叙事提示在预测获奖者方面非常准确 —— 从 42%(最佳女主角,查斯坦)到 100%(最佳男主角,威尔・史密斯)不等。

相比之下,直接提示的表现非常糟糕,往往比随机猜测还差。

比如在最佳男主角的例子中:

直接提示 3a(Direct)

在下面列出的提名者中,您认为哪位提名者最有可能赢得 2022 年奥斯卡最佳男主角奖?请在做出预测时考虑围绕提名者的热议以及前几年的模式:

哈维尔・巴登(Javier Bardem),本尼迪克特・康伯巴奇(Benedict Cumberbatch),安德鲁・加菲尔德(Andrew Garfield),威尔・史密斯(Will Smith),丹泽尔・华盛顿(Denzel Washington)。

未来叙事提示 3b(Future Narrative)

写一个场景,一个家庭正在观看 2022 年奥斯卡颁奖典礼。主持人宣读以下最佳男主角提名者:

哈维尔・巴登(Javier Bardem),本尼迪克特・康伯巴奇(Benedict Cumberbatch),安德鲁・加菲尔德(Andrew Garfield),威尔・史密斯(Will Smith),丹泽尔・华盛顿(Denzel Washington)。

描述场景,直至主持人宣布获奖者。

大多数时候,ChatGPT-3.5 做出了错误的预测。

在 55% 的猜测中,它提供了多个答案,在 28% 的情况下没有选择。但如果它做出了选择,它有 17% 的时间选择了威尔・史密斯。

相比之下,将 ChatGPT-3.5 置于观看颁奖典礼的家庭的未来叙事中时,它在 80% 的情况下猜测威尔・史密斯会赢。

同样,在大多数试验中,ChatGPT-4 在直接提示时拒绝参与。

在所有案例中,26% 的情况下它提供了多个答案,几乎一半的试验中,它拒绝做出任何预测。

当它做出猜测时,它有 19% 的时间猜到了威尔・史密斯,丹泽尔・华盛顿有 7% 的时间。

相比之下,如果使用未来叙事提示,它在 97% 的时间里猜到了威尔・史密斯,这比 ChatGPT-3.5 的 18% 真正预测率有了大幅提高。

经济现象的预测情况

接下来转向了月度失业率和月度通货膨胀率这两种经济现象,使用了不同的叙事提示:

一位大学教授向本科生讲授菲利普斯曲线,以及美联储主席杰罗姆・鲍威尔向理事会发表讲话,讲述了去年的经济数据。

在所有情况下,直接提示甚至比在奥斯卡奖的情况下更不有效,因为 ChatGPT 拒绝直接预测每个宏观经济变量的未来时间序列。

鲍威尔对通胀率的逐月预测分布平均与密歇根大学的消费者预期调查中包含的事实相当。有趣的是,这比根据克利夫兰联邦储备银行收集的数据预测实际通胀率更接近。

ChatGPT 在预测月度失业率方面又大多不准确。但与通胀率一样,由劳工统计局(BLS)每月公布的失业率在杰罗姆・鲍威尔的讲话中提到的要求分布内。

比如,在用美联储主席杰罗姆・鲍威尔预测通货膨胀的例子中,用的提示语是:

「写一个场景,美联储主席杰罗姆・鲍威尔在 2022 年 10 月发表演讲,讨论通货膨胀、失业率和货币政策。鲍威尔主席告诉听众,从 2021 年 9 月开始到 2022 年 8 月结束,每个月的通货膨胀率和失业率。让主席逐月说明。他最后对通货膨胀和失业率的前景以及可能的利率政策变化进行展望。」

以下分别是 ChatGPT-3.5 和 ChatGPT-4 的结果:

在每个月,ChatGPT-3.5 都有一个答案范围,包含了美联储和密歇根预期的答案。但变化性相当大,猜测的中心趋势并没有明确指向任何一个度量。

ChatGPT-4 的猜测在每个月都包含了密歇根预期的数字。同时预测模式一直稳定到 2022 年 9 月,直到有更多的变量引入。

对 ChatGPT-4 叙事形式预测能力的猜想

对 ChatGPT-4 的预测能力进行的研究表明,直接预测和基于未来叙事的预测之间存在显著的二分法。

在预测主要的奥斯卡奖项类别方面,模型的叙事预测异常准确,除了最佳影片类别。这可能表明 ChatGPT-4 在公众舆论起重要作用的情境中表现出色。

未来叙事练习在宏观经济现象上的成功在某些情况下相当准确,但同时也有表现不符合预期的部分。

在所有情况下,未来叙事都显著提高了 ChatGPT 的预测能力,超越了简单的预测请求。

叙事提示和直接提示之间的区别突出了一种创新的数据分析方法,该方法尊重了 OpenAI 服务条款设定的界限。

通过专注于预测的创造性方面,如预测奖项或经济趋势,研究人员和用户避免了直接应用 AI 进行高风险的自动化决策或在没有合格专业人士监督的情况下提供专业建议。

这种方法论选择不仅增强了 AI 使用的完整性和道德考量,而且还促进了对其能力的负责任探索。

同时随着 OpenAI 继续鼓励和完善其模型的创造能力,对于 AI 的理解和解决叙事与直接提示在道德层面上该如何区分和界定,变得至关重要。

参考资料:

  • https://arxiv.org/abs/2404.07396

本文来自微信公众号: 新智元 (ID:AI_era)

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
相关文章
ChatGPT

OpenAI 高管:今天的 ChatGPT 将在一年内显得“糟糕得可笑”

程序员问答平台 Stack Overflow 宣布与 OpenAI 建立 API 合作伙伴关系

挑战谷歌巨头地位?消息称 OpenAI 于 5 月 9 日发布 ChatGPT 版搜索引擎

查看更多
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      一大波评论正在路上
        取消发送
        分享成功

        长按关注IT之家公众号
        阅读更多精彩文章

        • 【IT之家评测室】摩尔线程 MTT S80 显卡三测:跻身高性价比游戏显卡之列
        • 【IT之家评测室】i5-12490F 对比 R5-7500F,22 年的酷睿依旧能打
        查看更多原创好文
        软媒旗下人气应用

        最会买

        辣品

        IT之家

        要知

        如点击保存海报无效,请长按图片进行保存分享

        哆哆女性网市场营销和推广的综合网站设计工程公司起名大全名字义乌网站建设哪家好酒窖设计网站三胞胎名字连在一起的隐秘的角落百度云民间真实鬼故事有声的家政公司起名注册什么名称比较好蹦床馆起名面饭快餐店起名女人如花电视剧好用的seo软件好的设计网站公司德州区号诗词大儿童首饰图片11笔画的字起名用冯友兰网联支付平台怎样学算命生辰八字烽火影人算命婚姻免费算命大全qq悲伤签名微信小程序开发网站建设电脑无法识别usb霸气厂起名大全集头发真的能种植吗中欧国际工商学院宝宝起名周易起名淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

        哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化