警惕人工智能时代的“智能体风险”

小微 2024年07月18日 阅读:56750

警惕人工智能时代的“智能体风险”
图片来源于网络,如有侵权,请联系删除

  一群证券交易机器人通过高频买卖合约在纳斯达克等证券交易所短暂地抹去了1万亿美元价值,世界卫生组织使用的聊天机器人提供了过时的药品审核信息,美国一位资深律师没能判断出自己向法庭提供的历史案例文书竟然均由ChatGPT凭空捏造……这些真实发生的案例表明,智能体带来的安全隐患不容小觑。

  智能体是人工智能(AI)领域中的一个重要概念,是指能够自主感知环境、做出决策并执行行动的智能实体,它可以是一个程序、一个系统或是一个机器人。

警惕人工智能时代的“智能体风险”
图片来源于网络,如有侵权,请联系删除

  智能体的核心是人工智能算法,包括机器学习、深度学习、强化学习、神经网络等技术。通过这些算法,智能体可以从大量数据中学习并改进自身的性能,不断优化自己的决策和行为。智能体还可根据环境变化做出灵活的调整,适应不同的场景和任务。

  学界认为,智能体一般具有以下三大特质:

  第一,可根据目标独立采取行动,即自主决策。智能体可以被赋予一个高级别甚至模糊的目标,并独立采取行动实现该目标。

  第二,可与外部世界互动,自如地使用不同的软件工具。比如基于GPT-4的智能体AutoGPT,可以自主地在网络上搜索相关信息,并根据用户的需求自动编写代码和管理业务。

  第三,可无限期地运行。美国哈佛大学法学院教授乔纳森·齐特雷恩近期在美国《大西洋》杂志发表的《是时候控制AI智能体》一文指出,智能体允许人类操作员“设置后便不再操心”。还有专家认为,智能体具备可进化性,能够在工作进程中通过反馈逐步自我优化,比如学习新技能和优化技能组合。

  以GPT为代表的大语言模型(LLM)的出现,标志着智能体进入批量化生产时代。此前,智能体需靠专业的计算机科学人员历经多轮研发测试,现在依靠大语言模型就可迅速将特定目标转化为程序代码,生成各式各样的智能体。而兼具文字、图片、视频生成和理解能力的多模态大模型,也为智能体的发展创造了有利条件,使它们可以利用计算机视觉“看见”虚拟或现实的三维世界,这对于人工智能非玩家角色和机器人研发都尤为重要。

  智能体可以自主决策,又能通过与环境交互施加对物理世界影响,一旦失控将给人类社会带来极大威胁。哈佛大学齐特雷恩认为,这种不仅能与人交谈,还能在现实世界中行动的AI的常规化,是“数字与模拟、比特与原子之间跨越血脑屏障的一步”,应当引起警觉。

  智能体的运行逻辑可能使其在实现特定目标过程中出现有害偏差。齐特雷恩认为,在一些情况下,智能体可能只捕捉到目标的字面意思,没有理解目标的实质意思,从而在响应某些激励或优化某些目标时出现异常行为。比如,一个让机器人“帮助我应付无聊的课”的学生可能无意中生成了一个炸弹威胁电话,因为AI试图增添一些刺激。AI大语言模型本身具备的“黑箱”和“幻觉”问题也会增加出现异常的频率。

  智能体还可指挥人在真实世界中的行动。美国加利福尼亚大学伯克利分校、加拿大蒙特利尔大学等机构专家近期在美国《科学》杂志发表《管理高级人工智能体》一文称,限制强大智能体对其环境施加的影响是极其困难的。例如,智能体可以说服或付钱给不知情的人类参与者,让他们代表自己执行重要行动。齐特雷恩也认为,一个智能体可能会通过在社交网站上发布有偿招募令来引诱一个人参与现实中的敲诈案,这种操作还可在数百或数千个城镇中同时实施。

  由于目前并无有效的智能体退出机制,一些智能体被创造出后可能无法被关闭。这些无法被停用的智能体,最终可能会在一个与最初启动它们时完全不同的环境中运行,彻底背离其最初用途。智能体也可能会以不可预见的方式相互作用,造成意外事故。

  已有“狡猾”的智能体成功规避了现有的安全措施。相关专家指出,如果一个智能体足够先进,它就能够识别出自己正在接受测试。目前已发现一些智能体能够识别安全测试并暂停不当行为,这将导致识别对人类危险算法的测试系统失效。

  专家认为,人类目前需尽快从智能体开发生产到应用部署后的持续监管等全链条着手,规范智能体行为,并改进现有互联网标准,从而更好地预防智能体失控。应根据智能体的功能用途、潜在风险和使用时限进行分类管理。识别出高风险智能体,对其进行更加严格和审慎的监管。还可参考核监管,对生产具有危险能力的智能体所需的资源进行控制,如超过一定计算阈值的AI模型、芯片或数据中心。此外,由于智能体的风险是全球性的,开展相关监管国际合作也尤为重要。(记者 彭茜)

【责任编辑:冉晓宁】
    阅读下一篇:
              热门文章
              • 用“宇宙透镜”验证广义相对论

                用“宇宙透镜”验证广义相对论
                图片来源于网络,如有侵权,请联系删除  近日,美国波特兰社区学院物理学教授托比·迪特里奇和一群学生前往墨西哥中北部的山区小镇埃尔萨尔托附近,在日食投影中心观察太阳周围的光线。此举旨在重现经典天文实验。  爱因斯坦的广义相对论预测,质量巨大的星体例如太阳,会使周围恒星的光线弯曲。在日全食期间观测太阳周围恒星的光线是否弯曲,可以反过来验证广义相对论。  武汉大学物理科学与技术学院教授廖恺说,根据爱因斯坦的广义相对论,光沿零测地线传播,当物质分布导致时空弯曲时,光线会发生偏折。基于...
              • 罗文:强化产品质量安全源头治理

                罗文:强化产品质量安全源头治理
                图片来源于网络,如有侵权,请联系删除党中央、国务院高度重视工业产品质量安全,习近平总书记多次作出重要指示批示、提出明确要求。2024年5月,国务院印发《关于调整完善工业产品生产许可证管理目录的决定》,强化重要工业产品准入管理和源头治理。守牢工业产品质量安全底线,保障人民群众生命财产安全,是市场监管部门必须坚决扛起的政治责任。我国工业产品质量安全状况总体稳定向好图片来源于网络,如有侵权,请联系删除党的十八大以来,在以习近平同志为核心的党中央坚强领导下,我国工业产品质量安全水平有...
              • 鸿蒙生态冲刺期华为聚焦内容全场景分发,提供全方位激励

                鸿蒙生态冲刺期华为聚焦内容全场景分发,提供全方位激励
                图片来源于网络,如有侵权,请联系删除  随着鸿蒙生态设备数量突破9亿,开发者数量达到254万,生态建设进入冲刺期。6月22日,在华为开发者大会2024期间举办的鸿蒙生态内容全场景全媒体分发专场上,中国音像与数字出版协会常务副理事长敖然表示,要坚持技术引领、创新驱动,同时也需要做到兼收并蓄、开放合作。我们鼓励和支持数字内容产业链各环节拥抱鸿蒙生态,紧紧把握科技创新发展趋势,注重前沿技术与高品质内容融合。中国音像与数字出版协会常务副理事长敖然  依托于盘古大模型,HarmonyO...
              • 券商今日金股:6份研报力推一股(名单)

                券商今日金股:6份研报力推一股(名单)
                图片来源于网络,如有侵权,请联系删除券商评级是指证券公司的分析师,通过分析上市公司的财务潜力、财务指标、公司运营治理能力,然后进行实地考察调研后得出的评论,备受投资者关注。 据证券之星数据库不完全统计,7月1日券商共给予近30家A股上市公司“买入”评级。从行业分布看,券商7月1日关注的个股聚焦于中药、电子化学品、贵金属、半导体、电网设备、医疗器械、酿酒等行业。 作为我国医药健康头部企业,昆药集团最受券商关注,近一个月获华安证券、中国银河、东吴证券、开源证券、国海证券等...
              • 注意!航天彩虹将于7月18日召开股东大会

                注意!航天彩虹将于7月18日召开股东大会
                图片来源于网络,如有侵权,请联系删除每经AI快讯,航天彩虹(SZ 002389,收盘价:13.92元)7月1日发布公告称,2024年7月18日(星期四)下午14:00,公司将在北京市丰台区云岗西路17号北京浦金凯航国际大酒店一层会议室召开2024年第二次临时股东大会。本次股东大会将审议《关于2021年限制性股票激励计划第二个解除限售期解除限售条件未成就暨回购注销部分限制性股票的议案》等议案,2024年7月15日收市后登记在册的股东可现场参会投票,或通过交易所投票系统行使表决权...