首页 技术教程 正文阅读

1.6万 Star,AI Agent 赛道又杀出一匹黑马

emer 2026-05-19
2 0

用 Claude Code 干活,有个反复出现的摩擦点:每次开一个新对话,都要重新介绍一遍自己在做什么。"我在用 Rust 写一个异步任务调度服务","这个项目上周刚从 tokio 0.2 迁移过来","你上次建议我用这个方案的"……

说实话每次打这些东西,我都想骂人。Codex 也是这样,Cursor 也是这样,Gemini 2.5 Pro 也逃不掉——不是模型的错,是所有这些工具生来就是无状态的,你一关窗口,上下文就消失了。

OpenHuman 这个开源项目就是冲着这个缺口去的,开源短时间内收获1.6万 Star,AI Agent又一匹黑马诞生。

                  它是什么,一句话先讲清楚
                  ————————————

GitHub 描述写的是 "Your Personal AI super intelligence. Private, Simple and extremely powerful."。听起来像是产品页面的广告词,但我看完实现细节之后,觉得这话没夸大。

OpenHuman 是一个桌面端 AI Agent 框架,用 Rust + Tauri 写的,走 GNU GPL-3 协议开源。它的定位不是聊天机器人,更接近一个「常驻助手」:它在你电脑上跑着,主动去拉取你的数字生活数据,把这些东西整理成它自己的记忆库,然后你跟它对话的时候,它已经知道你是谁、在做什么、上周碰到了什么问题。

1.6万 Star,AI Agent 赛道又杀出一匹黑马 - 第 1 张图
怎么做 AI 记忆
————————
我有时候觉得,把 AI 记忆做对这件事比训练大模型本身还难。难在哪儿?难在怎么存、存什么、存完之后怎么检索用上。

OpenHuman 的解法叫 Memory Tree。

流程是这样的:你把 Gmail、Slack、GitHub、Notion 这些服务接进来之后,系统每 20 分钟自动把最新数据拉一次,过一条处理管道:先转成规范化的 Markdown 格式,再切成不超过 3000 token 的块,打分,最后折叠进层级化的摘要树里。整个东西存在你本地的 SQLite 数据库里,不会上传到任何服务器。

还有一个细节做的很好:这些 Markdown 文件会同步成一个 Obsidian 兼容的 vault。就是说你可以直接打开 Obsidian,翻看 AI 到底「知道」你什么。这个灵感来自 Andrej Karpathy 的 obsidian-wiki 工作流——对,就是那个前 OpenAI 联合创始人写的那套东西。

1.6万 Star,AI Agent 赛道又杀出一匹黑马 - 第 2 张图
官方文档有一句话我觉得说得挺直接:OpenHuman 把你连接的所有文档、邮件和聊天记录都摘要压缩,生成一个让 Agent 能记住你一切的记忆图谱。

一次同步完成之后,Agent 就有了你的收件箱、日历、代码仓库、文档、消息记录的完整压缩上下文。不需要训练期,不需要「先用几周再说」。

118+ 个集成,用 OAuth,不用 API Key:

很多 Agent 框架也号称支持接各种服务,但实际体验下来,往往是「你自己去申请 API Key,填进配置文件,自己处理鉴权失败」。对普通用户来说,这就是一道墙。

OpenHuman 走的是 OAuth 一键授权。你在设置界面点一下授权 Gmail,弹出 OAuth 窗口,确认一下,完事儿。它现在支持的服务包括 Gmail、Notion、GitHub、Slack、Stripe、Google Calendar、Google Drive、Linear、Jira,数字目前停在 118+,还在涨。

每个接入的服务都被封装成一个「类型化工具」暴露给 Agent。每 20 分钟 auto-fetch 一次,把新数据折进 Memory Tree。所以你早上打开电脑问它「昨天有什么重要的 GitHub PR 评论」,它不需要临时去查,因为昨晚它已经拉过了。

顺着这个再说一句:如果你已经在 Claude Code 或者 Codex 里用了 agentmemory 这个项目(rohitg00 做的那个),OpenHuman 支持接它作为 memory 后端——在 config.toml 里设置 memory.backend = "agentmemory",然后 Claude Code、Cursor、Codex、OpenHuman 就可以共享同一个持久化记忆存储。这个设计的方向我觉得是对的,「跨工具统一记忆」,而不是每个工具各搞一套。

TokenJuice:
这是一个很低调但很关键的设计

这个功能在文档里不算显眼,但我觉得它可能是整个项目里工程品位最高的一块。

问题是这样的:你接入了 Gmail,同步了半年的邮件,拿去喂大模型,光 token 费用就能把你喂穷。一个 600 条消息的邮件线程,一次 git status 的输出,一份 cargo build 日志……这些东西扔进上下文里,大量 token 都是纯噪声。

OpenHuman 在工具调用结果进模型之前,先过一层叫 TokenJuice 的压缩管道。处理策略包括:HTML 转 Markdown,长 URL 缩短,重复行去重,啰嗦的工具输出摘要化。针对 git、npm、cargo、docker、kubectl 这些命令各有预设规则,规则文件是 JSON 格式,你也可以自己写覆盖规则,放到 ~/.config/tokenjuice/rules/ 下就生效,不需要重新编译。

管道位置长这样:

1.6万 Star,AI Agent 赛道又杀出一匹黑马 - 第 3 张图
官方给的数据是能减少最多 80% 的 token 消耗。「用前沿模型扫你过去六个月的邮件,只需要个位数美元」,我没跑过这个数字,但机制是可信的,实现代码在 src/openhuman/tokenjuice/ 里,开放的,可以自己核查。

看看对比?

GitHub README 里有张对比表(原表用了一些内部代号,我稍微对应了一下):

1.6万 Star,AI Agent 赛道又杀出一匹黑马 - 第 4 张图
OpenClaw 的优势在消息渠道覆盖广,Hermes Agent 在复杂推理和自主编程这块比 OpenHuman 强,OpenHuman 的核心差异是它真的在帮你维护上下文,而不是等你来喂。

模型路由这块也值得单独说一下:OpenHuman 内置了自动路由逻辑,推理型任务送去前沿模型,快速问答走轻量模型,视觉任务走视觉模型,全在一个账号下,不需要你手动切。本地跑模型的话支持 Ollama 和 LM Studio,对隐私要求高的用户可以把敏感任务留在设备上。

不足之处
项目现在是 Early Beta 状态,README 里也坦白说了 "expect rough edges"。

权限范围很大。 它需要读你的 Gmail、GitHub、Calendar、Slack……为了做记忆,它必须摄入大量数据。数据存本地这一点我信,但接入这么多服务本身是一个不小的攻击面,安全意识强的人应该认真评估一下。

资源消耗不低。 在本地维护一个实时更新的记忆索引,加上一个常驻桌面 shell,老机器或者 16GB 以下内存的机器可能会感受到压力。

复杂推理目前不是它的主场。 它现在更擅长整理、记忆和主动获取,如果你要做那种需要深度逻辑推理的任务,直接开 Claude 3.7 Sonnet 可能更直接、更快。这不是说 OpenHuman 不行,是说它的定位本来就不在这里。

我自己也还在摸索这个工具,有些功能还没完全跑通,上面这几条是我觉得目前阶段最值得留意的。

怎么安装呢?

macOS / Linux:curl -fsSL 立即下载 | bash

Windows(PowerShell):irm 立即下载 | iex

或者直接去https://tinyhumans.ai/openhuman下载 DMG 或 EXE 安装包,图形界面装完就能用,不需要开终端。

想从源码跑的开发者需要准备:Node.js 24+、pnpm 10.10.0、Rust 1.93.0(带 rustfmt + clippy),还有 CMake、Ninja、ripgrep。pnpm dev 跑 web UI,pnpm --filter openhuman-app dev:app 跑桌面端。详细环境配置看官方文档。

写在最后我一直觉得,Agent 这个领域真正的门槛不是模型能力,是上下文管理。Claude 3.7 Sonnet 写代码已经相当能打了,但如果每次对话都要从零开始介绍「我是谁在做什么」,效率的天花板就摆在那儿。OpenHuman 在这方面做的不错,这也是它在众多 AI 产品冲杀出来的原因,值得研究一下。

GitHub 地址:立即下载

emer

emer

每天发现网络新鲜事

65140 文章
13 分类
9612.6k+ 访问

搜索

Zoomed Image