The News HongKongThe News HongKong
  • 家
  • 國際
  • 香港
  • 企業
  • 科技
  • 娛樂
  • 體育
什么比较流行

法国财政前景黯淡,马克龙面临新考验

Kaija Saariaho 的发光音乐是个人邀请

加里·科恩 (Gary Cohen)、豪伊·罗斯 (Howie Rose) 和另外两人入选大都会队名人堂

  • 家
  • 編輯政策
  • 聯繫表
  • 關於我們
  • 隱私政策
  • DMCA
The News HongKong The News HongKong
  • 家
  • 國際

    大多数身份不明的受害者亲属努力到达印度火车失事地点

    在以色列,棘手的问题发生在埃及边境发生的致命袭击事件之后

    泽伦斯基暗示乌克兰战争的下一阶段将是严峻的

    印度致命的火车相撞事故:实时更新

    来自俄罗斯的和平主义教派因战争和现代性而动摇

  • 香港
  • 企業

    法国财政前景黯淡,马克龙面临新考验

    沙特阿拉伯表示将减产以阻止油价下滑

    查克托德离开“与媒体见面”

    前 CNN 总裁 Jeff Zucker 在 RedBird IMI 找到了一份新工作。 它是什么?

    CNN 外部的杰夫扎克的观点:他可以做得更好

  • 科技

    研究发现,直肠癌患者可能不需要放射治疗

    对于这些禽流感研究人员来说,工作是在非常“恶心”的海滩上度过的一天

    鸟类最初是如何起飞的?

    纽约海岸发现 2 头死去的座头鲸

    康奈尔鸟类学实验室的艾莉·史密斯 (Alli Smith) 提供了探索广阔鸟类世界的初学者技巧。

  • 娛樂

    Kaija Saariaho 的发光音乐是个人邀请

    为当今世界重塑迪士尼经典的男人

    编剧罢工持续,好莱坞导演与制片厂达成协议

    伊恩·博斯特里奇 (Ian Bostridge) 谈音乐的身份模糊边界

    谁拥有贝宁青铜器? 答案变得更加复杂。

  • 體育

    加里·科恩 (Gary Cohen)、豪伊·罗斯 (Howie Rose) 和另外两人入选大都会队名人堂

    对于克拉丽莎·希尔兹 (Claressa Shields),重复冠军头衔并没有带来淘汰赛

    一级方程式:西班牙大奖赛时间、电视和结果

    一级方程式:西班牙大奖赛时间、电视和结果

    比尔·格里森 (Bill Greason) 从黑人联盟明星到阿拉巴马州牧师的旅程

The News HongKongThe News HongKong
Home»科技»人工智能聊天机器人是否发展了心智理论? 我们做什么和不知道什么。
科技

人工智能聊天机器人是否发展了心智理论? 我们做什么和不知道什么。

读心术在我们人类中很常见。 不是以心理学家声称的方式,通过获得充满每个人经验的温暖意识流,或者以心理学家声称的方式,通过随意从你的脑海中抽出一个想法。 日常的读心术更加微妙:我们观察人们的面部表情和动作,倾听他们的话语,然后判断或凭直觉判断他们脑子里可能在想什么。

在心理学家中,这种直觉心理学——将不同于我们自己的心理状态归因于他人的能力——称为心理理论,它的缺失或受损与 自闭症, 精神分裂症 和别的 发育障碍. 心理理论帮助我们相互交流和理解; 它使我们能够欣赏文学和电影、玩游戏并了解我们的社会环境。 在许多方面,能力是人的重要组成部分。

如果机器也能读心会怎样?

最近,斯坦福商学院的心理学家 Michal Kosinski, 提出了那个论点:像 OpenAI 的 ChatGPT 和 GPT-4 这样的大型语言模型——在来自互联网的大量文本上训练的下一个词预测机器——已经发展出了心智理论。 他的研究尚未经过同行评审,但它们引发了认知科学家之间的审查和对话,他们最近一直在尝试回答这个经常被问到的问题——ChatGPT 能做到吗 这? – 并将其转移到更强大的科学探究领域。 这些模型有什么能力,它们会如何改变我们对自己思想的理解?

加州大学伯克利分校的心理学家 Alison Gopnik 说:“心理学家不会接受任何仅仅根据你与他们互动的轶事来断言幼儿的能力,这似乎是 ChatGPT 正在发生的事情。” 1980 年代第一批研究心智理论的研究人员。 “你必须做非常仔细和严格的测试。”

Kosinski 博士之​​前的研究表明,经过训练以分析面部特征(如鼻子形状、头部角度和情绪表达)的神经网络可以预测人们的 政治观点 和 性取向 具有惊人的准确度(第一种情况下约为 72%,第二种情况下约为 80%)。 他最近在大型语言模型方面的工作使用了经典的心理测试理论来衡量儿童归因的能力 错误的信念 给其他人。

新一代聊天机器人

第 1 张卡片,共 5 张卡片

一个勇敢的新世界。 一批由人工智能驱动的新型聊天机器人引发了一场争夺,以确定该技术是否 可以颠覆互联网的经济,将今天的强者变成过时的,并创造行业的下一个巨头。 以下是需要了解的机器人:

聊天GPT。 ChatGPT 是来自研究实验室 OpenAI 的人工智能语言模型,自去年 11 月以来一直成为头条新闻,因为它能够回答复杂的问题、写诗、生成代码、 计划假期 和翻译语言。 GPT-4,3月中旬推出的最新版本, 甚至可以响应图像 (并在统一律师考试中取得优异成绩)。

必应。 在 ChatGPT 首次亮相两个月后,OpenAI 的主要投资者和合作伙伴微软, 添加了一个类似的聊天机器人, 能够就几乎任何主题进行开放式文本对话,到它的 Bing 互联网搜索引擎。 但这是机器人偶尔不准确、误导和 奇怪的反应 发布后引起了广泛关注。

厄尼。 搜索巨头百度在 3 月份推出了中国的第一个主要竞争对手 ChatGPT。 Ernie 的首次亮相,Enhanced Representation through Knowledge Integration 的缩写, 结果失败了 在承诺的机器人“现场”演示被记录下来之后。

一个著名的例子是 莎莉安妮测试,其中一个女孩 Anne 在另一个女孩 Sally 不注意的时候将一颗弹子从篮子里移到一个盒子里。 研究人员声称,要知道莎莉会在哪里寻找弹珠,观众必须运用心智理论,对莎莉的感知证据和信念形成进行推理:莎莉没有看到安妮将弹珠移到盒子里,所以她仍然相信它是她最后一次离开它的地方,在篮子里。

Kosinski 博士展示了 10 种大型语言模型,这些模型具有这些心理测试理论的 40 种独特变体——描述了像 Sally-Anne 测试这样的情况,在这种情况下,一个人 (Sally) 会形成错误的信念。 然后他向模型询问有关这些情况的问题,促使他们看他们是否会将错误的信念归因于所涉及的角色并准确预测他们的行为。 他发现 2022 年 11 月发布的 GPT-3.5 有 90% 的时间这样做,而 2023 年 3 月发布的 GPT-4 有 95% 的时间这样做。

结论? 机器有心理理论。

但在这些结果公布后不久,哈佛大学心理学家托默·乌尔曼就回应了 一组自己的实验,表明即使是最复杂的大型语言模型,提示中的微小调整也可以完全改变生成的答案。 如果容器被描述为透明的,机器将无法推断有人可以看到它。 在这些情况下,机器很难考虑到人们的证词,有时无法区分容器内和容器顶部的物体。

卡内基梅隆大学计算机科学家 Maarten Sap, 进行了超过 1,000 次心理测试 进入大型语言模型,发现最先进的转换器,如 ChatGPT 和 GPT-4,仅在大约 70% 的时间内通过。 (换句话说,他们 70% 成功地将错误信念归因于测试情境中描述的人。)他的数据与 Kosinski 博士的数据之间的差异可能归结为测试中的差异,但 Sap 博士说即使通过95% 的时间不会成为真正的心智理论的证据。 他说,机器通常会以一种模式化的方式失败,无法进行抽象推理,而且经常会做出“虚假的关联”。

Ullman 博士指出,机器学习研究人员在过去几十年中一直在努力捕捉计算机模型中人类知识的灵活性。 他说,这种困难一直是一个“影子发现”,隐藏在每一个令人兴奋的创新背后。 研究人员已经表明,如果在提出问题之前输入不必要的信息,语言模型通常会给出错误或不相关的答案; 一些聊天机器人被关于会说话的鸟的假设性讨论所抛弃,以至于他们最终 声称鸟会说话. 因为他们的推理对输入的微小变化很敏感,科学家们将这些机器的知识称为“脆”

Gopnik 博士将大型语言模型的心智理论与她自己对广义相对论的理解进行了比较。 “我读了足够多的书,知道这些词是什么,”她说。 “但如果你要我做出新的预测或说出爱因斯坦的理论告诉我们的关于新现象的内容,我会感到很困惑,因为我的脑子里并没有真正的理论。” 她说,相比之下,人类的心理理论与其他常识推理机制相关联; 它在审查面前屹立不倒。

总的来说,Kosinski 博士的工作和对它的回应符合关于这些机器的能力是否可以与人类的能力进行比较的辩论——一场辩论 分裂 从事自然语言处理的研究人员。 这些机器是随机鹦鹉,还是外星智能,还是欺诈骗子? A 2022 调查 该领域的研究人员发现,在做出回应的 480 名研究人员中,51% 的人认为大型语言模型最终可以“在某种非平凡的意义上理解自然语言”,而 49% 的人认为他们不能。

乌尔曼博士并没有低估机器理解或机器心智理论的可能性,但他对将人类能力归因于非人类事物持谨慎态度。 他注意到一个著名的 1944年学习 由 Fritz Heider 和 Marianne Simmel 制作,其中向参与者展示了两个三角形和一个圆形相互作用的动画电影。 当受试者被要求写下电影中发生的事情时,几乎所有人都将这些形状描述为人。

“二次元世界的恋人,毫无疑问; 第二个小三角形和甜蜜的圆圈,”一位参与者写道。 “三角一号(以下简称反派)窥探到年轻的爱人。 啊!”

通过谈论信仰、愿望、意图和想法来解释人类行为是很自然的,而且通常是社会要求的。 这种倾向对我们是谁至关重要——如此重要以至于我们有时会试图读懂没有思想的事物的思想,至少不是像我们自己的思想。

人工智能聊天机器人是否发展了心智理论 我们做什么和不知道什么

有关的帖子

研究发现,直肠癌患者可能不需要放射治疗

对于这些禽流感研究人员来说,工作是在非常“恶心”的海滩上度过的一天

鸟类最初是如何起飞的?

纽约海岸发现 2 头死去的座头鲸

康奈尔鸟类学实验室的艾莉·史密斯 (Alli Smith) 提供了探索广阔鸟类世界的初学者技巧。

麻雀是鸟巢谋杀案的主要嫌疑人

Comments are closed.

不要错过
企業
1 Min Read

法国财政前景黯淡,马克龙面临新考验

By Press room

总统伊曼纽尔·马克龙在全国喧闹之后面临的挑战清单 示威游行 在他的养老金措施上,增加了一项新措施:对法国财政的一连串警告。周五,标准普尔全球警告说,它仍然对法国的信用状况持负面看法。 这距离一些人预期的降级只有一步之遥,但在过去一个月里,另外两家评级机构降低了对该国的看法。标准普尔全球维持法国的投资级信用评级,这是马克龙政府热切期待的决定。 但在重申 1 月份首次发布的负面展望时,该评级机构引用了对法国在本已高企的一般政府债务的情况下控制其公共财政能力的担忧。这也让分析人士更加担心马克龙在紧张的社会和政治环境中能否继续努力提升国家的竞争力和增长。法国财政部长布鲁诺·勒梅尔周五晚些时候在《星期日报》发表的一次采访中表示,他认为该公告是一个“积极信号”,并补充说:“我们的公共财政战略很明确。 这是雄心勃勃的。 而且是可信的。”4月底,惠誉评级 切 法国的主权信用评级在去年 12 月被下调后一级,降至 AA-。 欧洲评级机构…

Kaija Saariaho 的发光音乐是个人邀请

加里·科恩 (Gary Cohen)、豪伊·罗斯 (Howie Rose) 和另外两人入选大都会队名人堂

大多数身份不明的受害者亲属努力到达印度火车失事地点

我们的选择

法国财政前景黯淡,马克龙面临新考验

Kaija Saariaho 的发光音乐是个人邀请

加里·科恩 (Gary Cohen)、豪伊·罗斯 (Howie Rose) 和另外两人入选大都会队名人堂

大多数身份不明的受害者亲属努力到达印度火车失事地点

  • 家
  • 編輯政策
  • 聯繫表
  • 關於我們
  • 隱私政策
  • DMCA
Copyright © All rights reserved. | thenews.hk

Type above and press Enter to search. Press Esc to cancel.