齿轮啮合诗人
DTinsight导读:
本文来自知名互联网企业AI 算法研发负责人徐斌,在以『“解锁AI新增长”为主题的第三届AI企业应用落地场景峰会暨OpenClaw研讨会』上的主题演讲,包括以下精彩内容:
内容理解与故事创作逻辑
模态转换的理解
YClaw 实践
“AI问书核心是构建了一套基于Agent 的“规划-执行”框架。针对长文本理解中存在的上下文过长导致模型性能退化、幻觉频发等问题,系统通过精确的问题分解、多轮工具调用与自主反思,实现了对复杂知识体系的高准确率拆解,显著提升了下游IP开发效率。”
内容创作理解
知名互联网企业在AI领域的主要工作包括两大方向:B端领域,面向作家推出“作家助手妙语版”,提供创意辅助并提升写作效率;面向合作伙伴,利用AI技术实现百万字以上作品的全文理解,提升内容到IP的匹配率及开发效率,并推出“版权助手”“漫剧助手”等产品;在C端方面,则推出了“几点读书”的ASO书、TTS产品以及“AI沉浸式交流”等应用。
当前,大家对Agent和Workflow已有较深理解,Workflow逐渐演变为像Claude推出的标准Spears实践,而Spears本质上是对不同Workflow的封装,因此Workflow可视为Spears前一代的概念。Agent则像一个操作系统,不同的Spears对于Agent而言相当于不同的App或插件,使Agent能够自主调用各类工作流。
针对AI问书的理解需求,支持用户提出的具体问题。考虑到编辑或游戏开发者等用户对地点、等级等信息的全面梳理有极高的准确率要求,该系统的核心挑战在于克服AI幻觉,确保输出结果在准确性和全面性上达到专业标准。
上下文长度与模型准确率呈明显负相关,随着上下文内容增多,大模型能力会显著退化,即便顶尖模型在 200k 上下文时性能下降已十分明显。因此必须对输入大模型的上下文进行精准裁剪与筛选,通过高效的上下文工程,选择最有价值的信息而非无策略地堆砌内容,这是应用大模型的重要前提。
在对AI问书开展深度研究的基础上,依托其数据可实现多模态呈现,包括制作互动网页、构建设定体系等;同时高质量数据还能用于生成知识卡片,直观展示其架构体系与各类细节信息。在执行层面,AI 问书的底层架构经多版迭代后,最终采用Plan-the-Action结构,该架构先对复杂问题进行推理并制定执行计划,再依据计划分步调用工具、多轮尝试,直至获取完整信息后回复用户,更适配书籍理解这类多步骤、多过程的复杂问题。
该框架核心难点体现在几个方面:一是问题分解易遗漏要素、问题解决不够全面;二是搜索策略易产生无效步骤,Agent人物没有完成精准规划,信息关联、工具调用与自检反思。
故事创作理解与模态转换
在故事创作环节,AI 生成天马行空的创意并不困难,真正的难点在于,让创意符合大众对故事的普遍认知与审美期待,这也是当前内容生成的核心挑战。
不同时代的读者,其情绪偏好与兴趣点都存在清晰的现实锚点。当下流行的系统流、升级流、吞噬进化、物资积累类机械流等题材,本质上都是呼应了现实中人们渴望付出即有回报、追求成长感与确定性的心理,读者在故事中获得情绪满足与情感共鸣。通过现实偏好拆解为结构化的灵感库,先实现 AI 与大众喜好对齐,在此基础上进行内容生成。
在短篇内容赛道上,从一个核心梗出发,不断演化出多元方向,持续抓住用户兴趣并延长内容生命力。对应到 Agent 协作模式,故事创作需要建立完备的数据支撑,整合内部爆款、历史爆款及多渠道热门趋势信息,为 AI 提供可靠依据。
AI 在此基础上自主判断信息的调用时机与使用方式,再经过内容后处理与人工精细化运营,最终形成更贴合市场、可持续产出优质故事的完整创作体系。
今年漫剧赛道热度持续走高,尤其在 AI 真人相关技术升级后,整个行业正处于爆发前夕。在模态转换方面,基于内容理解与创作能力的基础,推出了漫剧助手产品。将AI 问书能力深度集成到漫剧助手中,能够快速对书籍进行结构化解析,自动生成基础信息、章节拆分、世界观设定、角色关系等内容。同时,产品还支持对书籍内容进行自由问答,尤其适合编辑快速定位不清晰的情节,获取初步解读并进行核对校验。
AI 问书的核心价值在于提供相对客观的书籍理解。同一本书不同人往往有不同的主观解读,对细节的把握也存在差异。而 AI 可以输出中立、统一的理解结果,帮助团队在信息粒度和内容认知上实现高效对齐。
YClaw 探索实践
OpenCloud之所以能迅速走红,根本原因在于它首次将Claude 4.6等最先进模型的编码能力,以一种极其平权且广泛的方式触达了普通用户。这种产品形态的根本改变,让大众无需复杂的配置或专业背景,就能方便地使用当前最顶尖的代码生成与理解能力。过去人们对“Coding”的理解往往局限于写代码本身,但实际上,编码能力的本质是通用API调用,其前提是写代码的过程,本质上就像在调用不同的工具、不同的API、不同的组件。
大模型具备了“编码式”的交互与调用能力,就意味着它能像人一样使用电脑上的各种工具与组件,这正是通用人工智能落地的重要方向。OpenCloud的火爆,正是因为它将这种工具调用与编排能力从专业开发者手中释放出来,打开了通用AI在电脑端应用的广阔前景。
在内部实践中,我们发现一个非常有意思的现象:离客户越近的人,使用AI产品的频率越高。过去,很多个人化的需求受限于研发投入产出比,企业不可能为一个员工单独定制软件。但有了OpenCloud等类型产品后,用户可以将自己所需的环境与数据全部搭建好,相当于“雇佣”了一个专属程序员来写代码、写工具、甚至完成最终的交互页面。围绕自己特定业务任务的需求,就可以被固化成一个专有的软件。对于直接扛着KPI、与营收转化紧密相关的一线业务人员,使用起来异常顺滑和高效。
在风控场景中验证AutoResearch,初始 F1 值只有 0.2,通过让 AI 自己进行策略搜索,第一轮就提升了两倍,持续迭代到第二十五、三十轮后,相比最初有了三倍左右的提升;到了第十轮以后,策略搜索的速度会放缓,但整体效果依然可观。通过实践证实,只要把问题定义清楚、数据要求、评估结果,模型自己探索策略,这件事已经变得可行且可验证。这便解释了各大模型厂商在做基座或后训练时,最核心的工作就是定义问题和设计评估方式。
一旦某个真实世界的问题被清晰地定义出来,并且能被准确评估,那么它的智能水平就能得到显著提升。后训练团队最主要的工作,正是把真实场景中的各种问题,转化为可被评估的信号。当这个信号被明确后,模型的智能程度就能获得质的飞跃。

第三届AI企业应用落地场景峰会暨OpenClaw研讨会,于2026年3月27日在上海圆满闭幕。本次峰会以“解锁AI新增长”为主题,由DTinsight中国数智发展研究中心主办,DT千川汇、TGO20组、作为智库支持,吸引来自智能制造、汽车、半导体、新能源、金融、消费、互联网、交通等泛行业,超100家头部企业CIO、CAIO、CTO、AI负责人等数字化领军者齐聚,探寻AI规模化落地路径,让AI真正成为驱动企业增长的确定性力量。
同时,大会发布了《AI大模型应用生态全景图鉴》,进行了“年度AI卓越创新实践”、“年度AI卓越解决方案”的颁奖盛典,两场【圆桌对话】探讨OpenClaw发展趋势,为AI落地把脉。