斯坦福开源Collaborative Gym框架:让AI学会主动协作,效率提升27%!

Written by 30115776@qq.com

❤️斯坦福开源框架让AI学会「打配合」:人机协作竟比纯人类团队效率高27%?

你是否经历过这些团队噩梦?

  • 👉 凌晨三点还在等海外同事的邮件确认
  • 👉 需求文档改了18版,AI助手却只会机械执行
  • 👉 敏捷开发会议上,智能体永远在「掉线」状态……

今天,我们来揭秘斯坦福与CMU联合研发的 Collaborative Gym,它彻底打破了人机协作的次元壁!这个支持异步实时交互的革命性框架,让人工智能真正学会「察言观色」——

  • ✅ 会议纪要秒变项目甘特图,AI自动拆解任务并@责任人
  • ✅ 跨时区协作无需等待,智能体夜间值守推进任务
  • ✅ 私有笔记智能关联,你的碎片灵感自动补全知识图谱

已有团队实测:在旅行规划任务中,人机组合比纯人类团队效率提升27%!接下来,我们将拆解这个「最懂人性」的AI协作框架,手把手教你如何在本地部署智能协作者。

🚀 快速阅读

  • Collaborative Gym简介:专注于人机协作的框架,支持异步交互和三方感知,让AI真正融入团队。
  • 核心功能:支持异步交互、模拟真实协作模式、实时监控环境变化。
  • 技术原理:采用通知协议和Redis服务器实现实时通信,支持公共和私有观测空间。
  • 运行方式:提供详细的本地部署指南和实验脚本。

Collaborative Gym 是什么

Collaborative Gym(Co-Gym) 是一个专注于人机协作(Human-Agent Collaboration)的开源框架,支持人类与AI代理之间的实时交互与协作。它突破了传统多智能体框架中同步行动的限制,支持异步交互,并能处理代理、人类和任务环境之间的三方互动。

Co-Gym借鉴了OpenAI Gym的设计思路,针对人机协作进行了优化。它支持在观测空间中定义公共和私有部分:公共部分对所有参与者可见,私有部分仅对所有者可见,模拟了真实协作场景中共享信息和个人笔记的区别。

Collaborative Gym 的主要功能

  • 支持异步交互:Co-Gym 突破传统多智能体框架中同步行动的限制,支持人类和AI代理在协作中灵活地发起行动,无需严格按顺序交互。更接近真实的人类协作模式。
  • 任务环境设计:Co-Gym 将每个任务定义为部分可观测马尔可夫决策过程(POMDP),支持公共和私有观测空间。公共部分对所有参与者可见,私有部分仅对所有者可见,类似于人类团队中共享白板和个人笔记的区别。
  • 评估框架:Co-Gym 关注任务完成的结果,重视协作过程本身。提供了综合评估框架,从协作质量和协作过程两个维度对代理进行评估。
  • 模拟与真实条件:Co-Gym 支持模拟和真实两种实验条件。模拟条件使用预收集的任务实例和模拟人类行为,便于快速迭代开发;真实条件支持与真实人类在实际任务环境中协作,支持旅行规划、文献综述和表格分析等多种任务。

Collaborative Gym 的技术原理

  • 协作驱动的环境设计:Co-Gym 支持在观测空间中定义公共和私有部分,公共部分对所有参与者可见,私有部分仅对所有者可见。模拟了真实协作场景中共享信息和个人笔记的区别。
  • 异步交互:Co-Gym 支持异步交互,支持人类和代理在必要时独立行动,无需等待对方响应。为此,Co-Gym 引入了两种协作行为:发送消息(SendTeammateMessage)和等待对方继续(WaitTeammateContinue),采用通知协议实时通知参与者环境的变化。
  • 通知协议:Co-Gym 通过 Redis 服务器实现通知协议,支持四种事件类型:共享观测更新、私有观测变化、新消息通知以及环境不活动超时通知。这支持代理实时监控环境变化,更好地与人类协作。
  • 任务环境接口(CoEnv):Co-Gym 提供了灵活的任务环境接口,支持开发者轻松添加新的任务环境。开发者只需定义任务描述、动作空间和观测空间即可。Co-Gym 支持多种任务环境,如旅行规划、文献综述和表格数据分析。

如何运行 Collaborative Gym

1. 安装依赖包

conda create -n cogym python=3.11
conda activate cogym
pip install -r requirements.txt

2. 设置 API 密钥

复制 secrets.example.toml 文件并重命名为 secrets.toml,根据文件中的注释填写所需的字段。

3. 构建 Docker 镜像(用于 Jupyter 执行器)

cd docker
docker build -f Dockerfile_cpu -t cogym-jupyter-cpu-image .

4. 启动 Redis 服务器

docker run -d --name redis-stack -p 6379:6379 -p 8001:8001 redis/redis-stack:latest

5. 运行实验

完全自主代理实验

python -m scripts.fully_auto_agent_exp \\
--task {\"travel_planning\" or \"related_work\" or \"tabular_analysis\"} \\
--start-idx {start_idx_of_simualted_dataset} \\
--end-idx {end_idx_of_simulated_dataset} \\
--team-member-config-path {configs/teams/auto_agent_team_config_xxx.toml} \\
--result-dir-tag {result_dir_tag}

人类-代理协作实验

python -m scripts.collaborative_agent_exp \\
--task {\"travel_planning\" or \"related_work\" or \"tabular_analysis\"} \\
--start-idx {start_idx_of_simualted_dataset} \\
--end-idx {end_idx_of_simulated_dataset} \\
--team-member-config-path {\"configs/teams/basic_coagent_simulated_user_team_config_xxx.toml\" or \"configs/teams/coagent_with_situational_planning_simulated_user_team_config_xxx.toml\"} \\
--result-dir-tag {result_dir_tag

资源

30115776@qq.com

Pretium lorem primis lectus donec tortor fusce morbi risus curae. Dignissim lacus massa mauris enim mattis magnis senectus montes mollis taciti accumsan semper nullam dapibus netus blandit nibh aliquam metus morbi cras magna vivamus per risus.

Ollama + DeepSeek 本地大模型实现联网回答

Sa2VA别再用PS抠图了!字节跳动开源Sa2VA一句话自动分割视频,连头发丝都精准

发表评论