8.2 Collaborative Intelligence

这篇文章深入探讨了多智能体系统在人工智能领域的潜力,尤其是在实现更高效的任务协作和智能化方面。作为风险投资人,我受到启发的是,未来的投资机会可能会集中在那些能够开发和优化多智能体架构的初创公司上。这种架构不仅能提高AI的效率,还能在特定任务上实现更高的专业化,可能会颠覆当前的AI市场格局。

ONE SENTENCE SUMMARY:

多智能体系统通过组合专门化的子代理来实现智能,可能是实现更高效的代理人工智能的最佳途径。

MAIN POINTS:

TAKEAWAYS:

人类并不是简单的生物。尽管我们喜欢向外界展示一个完整统一的自我,但在内心深处,我们是分裂的。Marvin Minsky 在 The Society of Mind 中提出,心智是由较小的代理组成的,每个代理都有其专门的角色和驱动力。电影 头脑特工队 同样想象心智由快乐、悲伤、恐惧、厌恶和愤怒的子自我组成。

多代理系统为人工智能提供了一个类似的模型。它们将一组代理结合在一起,以完成任何单个代理无法独立完成的任务。我们相信,这些系统可能代表了通向代理型人工智能的最佳路径,通过其专门化子代理的多样性而不是单一集中模型的规模来变得更智能。

一些多代理架构更具层次性,具有一个主导的协调代理,作为中央大脑来协调专门子代理的行动。Microsoft Research 最近 发表 了一篇论文,概述了这样一个名为 Magnetic-One 的系统。他们的协调代理与 Coder、ComputerTerminal、WebSurfer 和 FileSurfer 一起完成各种计算机任务。 Nunu 开发了一个协调代理,通过与专门的视觉、游戏和动作模型合作来玩电子游戏。

我们已经看到了这些协调器如何被有用地产品化和部署的初步迹象。ChatGPT 的大脑在认为有必要时使用其搜索工具来回答用户的查询。Anthropic 最近 演示 了一个由 Claude 协调的系统,该系统使用视觉模型和计算机控制来进行计算机使用。尽管这些中央大脑只是与简单工具合作,但 ChatGPT 和 Claude 架构最终可能会整合像 Magnetic-One 使用的自主子代理,以扩展其能力。

在其他情况下,多代理系统的输出可能是许多子代理之间协调行动的结果,而不是与一个中央规划者协调。 Generative Agents 论文详细介绍了一组自主的类似 Sims 的代理如何以完全去中心化的方式组织了一场情人节派对。他们想象将这项技术应用于模拟人类行为、构建沉浸式世界以及模拟用户以优化其产品体验。

多代理系统的一个优势是其组件代理可以使用专注且易于指定的目标函数。为子系统设定一个明确的优化目标,使其更容易利用深度学习技术,如强化学习(RL),在该功能上变得出色。虽然大型语言模型(LLM)通过变得普遍智能并看到一些国际象棋游戏的标记来隐式学习下棋,但一个国际象棋子代理可以更有效地通过 RL 直接学习游戏。而且,虽然可以微调一个大型模型来学习新的专业技能,如国际象棋,但将这种知识传播到一个庞大的模型中可能会很昂贵,并可能对其在其他领域的行为产生意想不到的副作用。

多代理系统的另一个优势是它们可以使可解释性更容易。通过用自然语言的代理之间的交流替代不透明神经网络的激活,多代理系统使观察者更容易理解它们的行为原因。此外,如果代理在内部以自然语言协调,用户可能会根据需要直接干预和调试它们。

哪种多代理系统最适合哪种任务仍然是一个开放的问题。但是,如果多代理系统在某些方面优于单一大型模型,那将是因为专业化的收益超过了通用性和跨学习的优势。这种动态将中和前沿实验室在训练非常大模型方面的优势。如果进一步的进展开始来自于代理可以访问的专门模型的广度,那么将有机会为一个新兴公司建立一个更开放的生态系统,开发者在其中竞争以分享最有用的小模型以实现各种功能。如果你正在朝着这个未来努力,我们很想见到你。

文章来源:Collaborative Intelligence

关键问题与行动计划

关键问题 1: 多智能体系统在特定应用场景中的优势如何评估和验证?

行动计划:

  1. 案例研究分析:研究团队将选择几个成功应用多智能体系统的案例(如游戏、自动化办公等),深入分析其架构、性能和用户反馈,以评估其在特定任务中的优势。
  2. 实验验证:数据团队可以设计实验,比较多智能体系统与传统单一模型在相同任务上的表现,收集数据并进行统计分析,以验证多智能体系统的有效性。

关键问题 2: 如何识别和挖掘潜在的多智能体系统创业公司和项目?

行动计划:

  1. 行业监测:数据团队将定期监测与多智能体系统相关的初创公司和项目,关注其融资动态、技术进展和市场反馈,建立一个潜在投资项目的数据库。
  2. 专家访谈:研究团队可以与行业专家、学者和创业者进行访谈,获取对多智能体系统未来发展的见解和潜在投资机会的推荐。

关键问题 3: 多智能体系统的可解释性如何影响用户的接受度和市场推广?

行动计划:

  1. 用户调研:研究团队将设计问卷或访谈,收集用户对多智能体系统可解释性的看法,分析其对用户接受度和使用意愿的影响。
  2. 市场分析:数据团队可以分析市场上现有多智能体系统产品的用户评价,识别可解释性强的产品与用户满意度之间的关系,为未来产品开发提供指导。

请告诉我们你对此篇总结的改进建议,如存在内容不相关、低质、重复或评分不准确,我们会对其进行分析修正