徐斌：从 AI 问书到YClaw：OpenClaw内部实践分享

04-30 23:56

齿轮啮合诗人

DTinsight导读：

本文来自知名互联网企业AI 算法研发负责人徐斌，在以『“解锁AI新增长”为主题的第三届AI企业应用落地场景峰会暨OpenClaw研讨会』上的主题演讲，包括以下精彩内容：

内容理解与故事创作逻辑
模态转换的理解
YClaw 实践

“AI问书核心是构建了一套基于Agent 的“规划-执行”框架。针对长文本理解中存在的上下文过长导致模型性能退化、幻觉频发等问题，系统通过精确的问题分解、多轮工具调用与自主反思，实现了对复杂知识体系的高准确率拆解，显著提升了下游IP开发效率。”

内容创作理解

知名互联网企业在AI领域的主要工作包括两大方向：B端领域，面向作家推出“作家助手妙语版”，提供创意辅助并提升写作效率；面向合作伙伴，利用AI技术实现百万字以上作品的全文理解，提升内容到IP的匹配率及开发效率，并推出“版权助手”“漫剧助手”等产品；在C端方面，则推出了“几点读书”的ASO书、TTS产品以及“AI沉浸式交流”等应用。

当前，大家对Agent和Workflow已有较深理解，Workflow逐渐演变为像Claude推出的标准Spears实践，而Spears本质上是对不同Workflow的封装，因此Workflow可视为Spears前一代的概念。Agent则像一个操作系统，不同的Spears对于Agent而言相当于不同的App或插件，使Agent能够自主调用各类工作流。

针对AI问书的理解需求，支持用户提出的具体问题。考虑到编辑或游戏开发者等用户对地点、等级等信息的全面梳理有极高的准确率要求，该系统的核心挑战在于克服AI幻觉，确保输出结果在准确性和全面性上达到专业标准。

上下文长度与模型准确率呈明显负相关，随着上下文内容增多，大模型能力会显著退化，即便顶尖模型在 200k 上下文时性能下降已十分明显。因此必须对输入大模型的上下文进行精准裁剪与筛选，通过高效的上下文工程，选择最有价值的信息而非无策略地堆砌内容，这是应用大模型的重要前提。

在对AI问书开展深度研究的基础上，依托其数据可实现多模态呈现，包括制作互动网页、构建设定体系等；同时高质量数据还能用于生成知识卡片，直观展示其架构体系与各类细节信息。在执行层面，AI 问书的底层架构经多版迭代后，最终采用Plan-the-Action结构，该架构先对复杂问题进行推理并制定执行计划，再依据计划分步调用工具、多轮尝试，直至获取完整信息后回复用户，更适配书籍理解这类多步骤、多过程的复杂问题。

该框架核心难点体现在几个方面：一是问题分解易遗漏要素、问题解决不够全面；二是搜索策略易产生无效步骤，Agent人物没有完成精准规划，信息关联、工具调用与自检反思。

故事创作理解与模态转换

在故事创作环节，AI 生成天马行空的创意并不困难，真正的难点在于，让创意符合大众对故事的普遍认知与审美期待，这也是当前内容生成的核心挑战。

不同时代的读者，其情绪偏好与兴趣点都存在清晰的现实锚点。当下流行的系统流、升级流、吞噬进化、物资积累类机械流等题材，本质上都是呼应了现实中人们渴望付出即有回报、追求成长感与确定性的心理，读者在故事中获得情绪满足与情感共鸣。通过现实偏好拆解为结构化的灵感库，先实现 AI 与大众喜好对齐，在此基础上进行内容生成。

在短篇内容赛道上，从一个核心梗出发，不断演化出多元方向，持续抓住用户兴趣并延长内容生命力。对应到 Agent 协作模式，故事创作需要建立完备的数据支撑，整合内部爆款、历史爆款及多渠道热门趋势信息，为 AI 提供可靠依据。

AI 在此基础上自主判断信息的调用时机与使用方式，再经过内容后处理与人工精细化运营，最终形成更贴合市场、可持续产出优质故事的完整创作体系。

今年漫剧赛道热度持续走高，尤其在 AI 真人相关技术升级后，整个行业正处于爆发前夕。在模态转换方面，基于内容理解与创作能力的基础，推出了漫剧助手产品。将AI 问书能力深度集成到漫剧助手中，能够快速对书籍进行结构化解析，自动生成基础信息、章节拆分、世界观设定、角色关系等内容。同时，产品还支持对书籍内容进行自由问答，尤其适合编辑快速定位不清晰的情节，获取初步解读并进行核对校验。

AI 问书的核心价值在于提供相对客观的书籍理解。同一本书不同人往往有不同的主观解读，对细节的把握也存在差异。而 AI 可以输出中立、统一的理解结果，帮助团队在信息粒度和内容认知上实现高效对齐。

YClaw 探索实践

OpenCloud之所以能迅速走红，根本原因在于它首次将Claude 4.6等最先进模型的编码能力，以一种极其平权且广泛的方式触达了普通用户。这种产品形态的根本改变，让大众无需复杂的配置或专业背景，就能方便地使用当前最顶尖的代码生成与理解能力。过去人们对“Coding”的理解往往局限于写代码本身，但实际上，编码能力的本质是通用API调用，其前提是写代码的过程，本质上就像在调用不同的工具、不同的API、不同的组件。

大模型具备了“编码式”的交互与调用能力，就意味着它能像人一样使用电脑上的各种工具与组件，这正是通用人工智能落地的重要方向。OpenCloud的火爆，正是因为它将这种工具调用与编排能力从专业开发者手中释放出来，打开了通用AI在电脑端应用的广阔前景。

在内部实践中，我们发现一个非常有意思的现象：离客户越近的人，使用AI产品的频率越高。过去，很多个人化的需求受限于研发投入产出比，企业不可能为一个员工单独定制软件。但有了OpenCloud等类型产品后，用户可以将自己所需的环境与数据全部搭建好，相当于“雇佣”了一个专属程序员来写代码、写工具、甚至完成最终的交互页面。围绕自己特定业务任务的需求，就可以被固化成一个专有的软件。对于直接扛着KPI、与营收转化紧密相关的一线业务人员，使用起来异常顺滑和高效。

在风控场景中验证AutoResearch，初始 F1 值只有 0.2，通过让 AI 自己进行策略搜索，第一轮就提升了两倍，持续迭代到第二十五、三十轮后，相比最初有了三倍左右的提升；到了第十轮以后，策略搜索的速度会放缓，但整体效果依然可观。通过实践证实，只要把问题定义清楚、数据要求、评估结果，模型自己探索策略，这件事已经变得可行且可验证。这便解释了各大模型厂商在做基座或后训练时，最核心的工作就是定义问题和设计评估方式。

一旦某个真实世界的问题被清晰地定义出来，并且能被准确评估，那么它的智能水平就能得到显著提升。后训练团队最主要的工作，正是把真实场景中的各种问题，转化为可被评估的信号。当这个信号被明确后，模型的智能程度就能获得质的飞跃。

第三届AI企业应用落地场景峰会暨OpenClaw研讨会，于2026年3月27日在上海圆满闭幕。本次峰会以“解锁AI新增长”为主题，由DTinsight中国数智发展研究中心主办，DT千川汇、TGO20组、作为智库支持，吸引来自智能制造、汽车、半导体、新能源、金融、消费、互联网、交通等泛行业，超100家头部企业CIO、CAIO、CTO、AI负责人等数字化领军者齐聚，探寻AI规模化落地路径，让AI真正成为驱动企业增长的确定性力量。

同时，大会发布了《AI大模型应用生态全景图鉴》，进行了“年度AI卓越创新实践”、“年度AI卓越解决方案”的颁奖盛典，两场【圆桌对话】探讨OpenClaw发展趋势，为AI落地把脉。