❤️斯坦福开源框架让AI学会「打配合」:人机协作竟比纯人类团队效率高27%?
你是否经历过这些团队噩梦?
- 👉 凌晨三点还在等海外同事的邮件确认
- 👉 需求文档改了18版,AI助手却只会机械执行
- 👉 敏捷开发会议上,智能体永远在「掉线」状态……
今天,我们来揭秘斯坦福与CMU联合研发的 Collaborative Gym,它彻底打破了人机协作的次元壁!这个支持异步实时交互的革命性框架,让人工智能真正学会「察言观色」——
- ✅ 会议纪要秒变项目甘特图,AI自动拆解任务并@责任人
- ✅ 跨时区协作无需等待,智能体夜间值守推进任务
- ✅ 私有笔记智能关联,你的碎片灵感自动补全知识图谱
已有团队实测:在旅行规划任务中,人机组合比纯人类团队效率提升27%!接下来,我们将拆解这个「最懂人性」的AI协作框架,手把手教你如何在本地部署智能协作者。
🚀 快速阅读
- Collaborative Gym简介:专注于人机协作的框架,支持异步交互和三方感知,让AI真正融入团队。
- 核心功能:支持异步交互、模拟真实协作模式、实时监控环境变化。
- 技术原理:采用通知协议和Redis服务器实现实时通信,支持公共和私有观测空间。
- 运行方式:提供详细的本地部署指南和实验脚本。
Collaborative Gym 是什么

Collaborative Gym(Co-Gym) 是一个专注于人机协作(Human-Agent Collaboration)的开源框架,支持人类与AI代理之间的实时交互与协作。它突破了传统多智能体框架中同步行动的限制,支持异步交互,并能处理代理、人类和任务环境之间的三方互动。
Co-Gym借鉴了OpenAI Gym的设计思路,针对人机协作进行了优化。它支持在观测空间中定义公共和私有部分:公共部分对所有参与者可见,私有部分仅对所有者可见,模拟了真实协作场景中共享信息和个人笔记的区别。
Collaborative Gym 的主要功能
- 支持异步交互:Co-Gym 突破传统多智能体框架中同步行动的限制,支持人类和AI代理在协作中灵活地发起行动,无需严格按顺序交互。更接近真实的人类协作模式。
- 任务环境设计:Co-Gym 将每个任务定义为部分可观测马尔可夫决策过程(POMDP),支持公共和私有观测空间。公共部分对所有参与者可见,私有部分仅对所有者可见,类似于人类团队中共享白板和个人笔记的区别。
- 评估框架:Co-Gym 关注任务完成的结果,重视协作过程本身。提供了综合评估框架,从协作质量和协作过程两个维度对代理进行评估。
- 模拟与真实条件:Co-Gym 支持模拟和真实两种实验条件。模拟条件使用预收集的任务实例和模拟人类行为,便于快速迭代开发;真实条件支持与真实人类在实际任务环境中协作,支持旅行规划、文献综述和表格分析等多种任务。
Collaborative Gym 的技术原理
- 协作驱动的环境设计:Co-Gym 支持在观测空间中定义公共和私有部分,公共部分对所有参与者可见,私有部分仅对所有者可见。模拟了真实协作场景中共享信息和个人笔记的区别。
- 异步交互:Co-Gym 支持异步交互,支持人类和代理在必要时独立行动,无需等待对方响应。为此,Co-Gym 引入了两种协作行为:发送消息(SendTeammateMessage)和等待对方继续(WaitTeammateContinue),采用通知协议实时通知参与者环境的变化。
- 通知协议:Co-Gym 通过 Redis 服务器实现通知协议,支持四种事件类型:共享观测更新、私有观测变化、新消息通知以及环境不活动超时通知。这支持代理实时监控环境变化,更好地与人类协作。
- 任务环境接口(CoEnv):Co-Gym 提供了灵活的任务环境接口,支持开发者轻松添加新的任务环境。开发者只需定义任务描述、动作空间和观测空间即可。Co-Gym 支持多种任务环境,如旅行规划、文献综述和表格数据分析。
如何运行 Collaborative Gym
1. 安装依赖包
conda create -n cogym python=3.11
conda activate cogym
pip install -r requirements.txt
2. 设置 API 密钥
复制 secrets.example.toml
文件并重命名为 secrets.toml
,根据文件中的注释填写所需的字段。
3. 构建 Docker 镜像(用于 Jupyter 执行器)
cd docker
docker build -f Dockerfile_cpu -t cogym-jupyter-cpu-image .
4. 启动 Redis 服务器
docker run -d --name redis-stack -p 6379:6379 -p 8001:8001 redis/redis-stack:latest
5. 运行实验
完全自主代理实验:
python -m scripts.fully_auto_agent_exp \\
--task {\"travel_planning\" or \"related_work\" or \"tabular_analysis\"} \\
--start-idx {start_idx_of_simualted_dataset} \\
--end-idx {end_idx_of_simulated_dataset} \\
--team-member-config-path {configs/teams/auto_agent_team_config_xxx.toml} \\
--result-dir-tag {result_dir_tag}
人类-代理协作实验:
python -m scripts.collaborative_agent_exp \\
--task {\"travel_planning\" or \"related_work\" or \"tabular_analysis\"} \\
--start-idx {start_idx_of_simualted_dataset} \\
--end-idx {end_idx_of_simulated_dataset} \\
--team-member-config-path {\"configs/teams/basic_coagent_simulated_user_team_config_xxx.toml\" or \"configs/teams/coagent_with_situational_planning_simulated_user_team_config_xxx.toml\"} \\
--result-dir-tag {result_dir_tag