"又改了三版,运营部门还是不满意..."
"用ChatGPT生成的文章,总被老板说‘AI味太重’..."
作为十几年的产品经理,我曾和所有内容创作者一样,陷入改了又改这样的困境。
直到我开发出:
「小文」—— 一个日均生产100篇高质量文章,同时将大模型幻觉率降低90%的智能写作Agent。
相比人工创作,效率提升98%。
相比其他知名通用AI幻觉率降低90%,保持3%以下。
已应用于年报生成、医疗/技术科普等场景,通过率超高。系统支持动态学习自动更新反馈,持续优化生成质量。
本文基于产品经理视角,兼顾 技术严谨性 与 商业价值呈现,包含必要 技术细节 与 产品思维 亮点,给大家介绍如何手搓一个有实际价值的Agent。
事情起源于前几月,接到领导缪博安排的工作任务,让帮忙给运营部门,提供技术内容文章。
奋笔疾书发现 整理出来的内容,话题枯燥,内容无聊,规规矩矩,全是班味。
通过对专业写作行业现状的系统性分析,总结出三大底层痛点
人工撰写单篇文章平均耗时约3小时,近40%时间消耗在资料检索和跨部门沟通环节。
线性串联的工作模式,导致内容生产周期被拉长。各环节间的信息衰减率极高,在紧急需求场景下(如热点事件响应)尤为突出。
初稿通过率极低,需推翻重做,专业术语误用率高,关键数据缺失。
新手与资深创作者经验差异、状态波动、信息同步延迟、使用过期参考资料等,都很影响质量。
因架构缺陷、暴露偏差、能力错位、信念错位等原因。
大模型一直存在两大顽疾:
首先是事实性错误,测试显示主流模型在技术领域的幻觉率达32%,每千字出现5.3处事实偏差,特别是对时效性知识的准确率仅68%。
其次是表达同质化,生成内容的结构相似度达81%,总是使用相同模板句式,个性特征识别准确率不足45%。
导致AI生成内容存在明显的"塑料感"。
效率损耗、质量参差、AI幻觉这三大痛点,形成了负向的连锁反应。
要突破这个恶性循环,需要构建新一代智能写作系统,在效率、质量和可控性之间实现平衡。
选择通过分层设计,实现高效内容生产。
每一层都针对内容创作流程中的关键环节进行优化,形成完整的智能化解决方案。
作为系统的首要环节,采用NLP技术对用户输入进行深度解析。
通过意图识别自动区分写作类型(如技术文档、营销文案、社交媒体内容等),并结合用户画像分析目标受众特征(年龄层、专业背景等)。
系统内置需求模板,包含多类常见写作场景的标准化需求描述,确保输出精准匹配核心需求。
例如,当识别到"生成AI技术讲解自媒体文章"需求时,会自动关联技术深度、专业术语使用比例等参数指标。
该层采用混合采集策略,智能爬虫集群可自动识别并适配动态页面和静态页面,支持学术论文(arXiv等)、行业报告、权威百科等12类开源数据源的实时采集。
清洗管道包含HTML净化(去除广告、导航等噪音内容)、编码转换(统一UTF-8编码)、格式标准化(PDF/EPUB转Markdown)等7道工序,确保原始数据质量。
实测显示,该层数据采集效率达1200篇/小时,在此作为个人研究经验分享,不商用,也不过多介绍了。
核心是LLM驱动的智能处理引擎,使用LLM自主处理文件信息,获取可靠知识。
通过元数据提取模块自动识别技术参数、作者信息、发布时间等关键字段。
然后构建领域知识图谱,采用数据库存储实体-关系-属性三元组(平均每个领域包含15万+节点)。
最后通过向量化处理实现语义关联,支持跨文档知识链接。
论文元信息知识图谱提取,示例代码:
def analyze_paper(pdf_text, json_data):
"""分析论文内容,生成关键词、大纲、应用场景和行业推荐"""
start_time = time.time()
logging.info("开始分析论文内容...")
# 构建提示词
prompt = f"""
请分析以下学术论文内容,并提供以下信息:
1. 论文关键词(5-10个)
2. 论文大纲(包含主要章节和子章节)
3. 实际应用场景推荐(3-5个)
4. 实际应用行业推荐(3-5个)
以上使用中文保存
论文标题: {json_data.get('title', '未知')}
论文摘要: {json_data.get('abstract', '未知')}
论文内容:
{pdf_text[:15000]} # 限制文本长度,避免token超限
请以JSON格式返回结果,格式如下:
{{
"keywords": ["关键词1", "关键词2", ...],
"outline": {{
"title": "论文标题",
"sections": [
{{"title": "章节1", "subsections": ["子章节1.1", "子章节1.2", ...]}},
...
]
}},
"application_scenarios": ["场景1", "场景2", ...],
"application_industries": ["行业1", "行业2", ...]
}}
"""
生成阶段采用动态Prompt工程,系统根据需求类型从模板库匹配基础框架,再结合实时检索的知识片段组装完整Prompt。
个人精心设计的小文 18条提示词
# 构建提示词,生成文章内容
prompt = f"""
请根据用户输入,生成一篇完整的文章,文章需满足以下要求:
引用材料的基本信息介绍:
标题: {json_data.get('title', '')}
作者: {json_data.get('authors', [])}
发表时间: {json_data.get('submission_date', '')}
摘要: {json_data.get('abstract', '')}
主题: {json_data.get('subjects', '')}
PDF链接: {json_data.get('pdf_url', '')}
文章大纲:
{json.dumps(article_outline, ensure_ascii=False)}
材料关键词: {', '.join(paper_analysis.get('keywords', []))}
材料大纲: {json.dumps(paper_analysis.get('outline', {}), ensure_ascii=False)}
应用场景: {', '.join(paper_analysis.get('application_scenarios', []))}
应用行业: {', '.join(paper_analysis.get('application_industries', []))}
材料内容片段:
{pdf_text[:15000]}
要求:
1. 文章结构必须包含以下部分:
- 标题:要吸引眼球,且能解决实际问题
- 引言部分(对材料文档介绍):
* 清晰列出文档的发表信息(标题、作者、发表时间、链接等)
* 完整呈现论文档摘要
* 简要引出下文内容,吸引读者继续阅读
2.明确文章围绕的解析的pdf材料技术主题,创作通俗易懂、适合普通读者阅读的自媒体文章。
3.按照 "引言(钩子)- 技术原理详解 - 技术攻克难点与创新点 - 技术优势总结 - 应用场景分析 - 案例展示 - 个人观点与展望 - 结语" 的大纲结构组织内容。
4.内容包含:能吸引读者的钩子开头、对文档攻克技术的详细介绍与总结、该技术可使用的场景分析。
5.在适当位置插入表格标记 [表格:表格内容],用于清晰呈现数据或对比信息。
6.使用 Markdown 格式进行文本编辑。
7.文章总字数必须不少于 5000 字。
8.运用合适的连接词、过渡句,确保文章逻辑连贯、表达流畅,避免机械化表达。
9.适当加入个人对技术的观点和见解,展现独特视角。
10.采用多样化的句式和表达方式,避免单一枯燥。
11.至少使用 3 个生动的比喻和例子,让内容更形象。
12.适当运用口语化表达,增强亲切感。
13.确保文章结构清晰,每个段落都有明确的主题句。
14.列举 2 - 3 个真实场景案例,帮助读者理解技术应用。
15.合理使用比喻、排比等修辞手法,提升文章感染力。
16.适当使用一些网络热词或流行语,贴合当下语境。
17.在关键处加入互动性的表达,如提问、引导思考等。
18.在适当位置加入一些反问句,增加与读者的互动。
"""
包含三重校验:
基于知识图谱验证,准确率98.7%
品牌指南匹配度F1=0.92
敏感词检测召回率99.3%
每次迭代生成3个候选版本,通过质量评分系统(0-10分制)选择最优解,平均1.8次迭代即可产出达标内容。
该架构已成功应用于多种创作场景,相比传统AI写作方式效率提升5-8倍,内容通过率稳定在90%以上。
模块化设计支持快速扩展,如新增金融风控模块后,系统可自动适配合规性审查需求。
体验入口:
https://enterprise.alayanew.com,欢迎试用
核心技术突破:
通过知识增强、双重校验机制、提示词工程、结构化输出,打造了新一代智能写作系统。
成功培育出内容生产的"黄金搭档"——小文生成Agent与小点审核Agent
很多通用AI直接生成文章,除了幻觉问题外。
另一个大问题在于:
使用者需根据生成的内容,手动进行多次沟通后,才可以生成质量符合要求的内容,这十分考验使用者的需求描述能力。
本次我们所开发时,为了保证使用者的体验,克服掉了这难题:
自动生成+自动点评+自动优化再生成,减少用户操心
由「小文」(生成Agent)和「小点」(审核Agent)构成的闭环工作流,最终实现了高效、高质的内容生产。
技术核心包括:
小文Agent通过混合检索(RAG+LLM)和结构化Prompt模板生成初稿,支持技术文档、营销文案等多场景,生成速度平均6.2秒/篇;
小点Agent通过知识图谱验证事实、风格评估和风险检测(敏感词召回率99.3%)进行多维度质检;
审核结果以结构化JSON反馈,如事实错误定位及修正建议,触发小文的自动优化策略,直接替换/局部重生成/全局重构。
小文小点交互流程图
研究了大量文章,实验了多种提示词,最后设计的结构化提示模板,包含强制约束,必须验证的事实点、格式规范Markdown标头和风格指引。通过强化学习持续优化模板库,使生成内容与需求匹配度提升100%。
上文已分享我们的提示词。
针对AI生成内容碎片化、逻辑性弱的问题,我们设计了严格的结构化输出体系:
首先建立模块化内容模板,强制包含技术原理详解(含数学公式支持)、典型应用案例(3-5个真实场景)、对比分析表格等必要模块,确保内容完整性。
系统会自动识别技术概念间的关联性,智能插入交互式元素:
当检测到数据对比需求时,生成Markdown表格(支持动态排序);
遇到流程说明时,调用Mermaid引擎自动绘制流程图;
针对复杂技术原理,可插入可折叠代码块(支持20+编程语言高亮)。
重点在于自动生成关联的插画提示词,并在文中合适位置插入插画。
测试表明,创新的方案让技术文档的可读性提升很高,读者留存率也提高了45%。
同时我们开发了富媒体自适应系统,能根据发布平台特性(内测中:如微信公众号、知乎专栏)自动优化元素排版,确保在不同终端均能完美呈现。
小文直接创作的内容,多次获得知乎优质内容认证。
其他知名大厂均无法像小文一样,生成图文并茂,格式丰富,幻觉小的文章内容。
"现在运营部门 70%的常规内容需求都能自主解决,我们可以更聚焦创意工作。" ——公司内容总监
今年1月底Deepseek R1出来后,AI圈几乎每月都有最新重弹消息。这迅猛的发展态势,在短短半年间,出来好多AI工具,有种势如破竹气势。作为产品经理的我们要始终保持:关注问题本质,关注价值本身。
三个步骤,来确认是否要这么干
第一步:计算一下价值:优化任务是否赚钱或省钱
(小文的价值公式:单篇节省155分钟∗1200篇=1.4人年)
使用Agent方式:一月可以生产100篇,一年1200篇
第二步:痛点量化分析,判断是否为伪需求
第三步:技术可行性确认,避免开发中途才发现无法实现
盘算发现 值得!就干它!
坚持"技术服务于业务"的核心原则,不盲目追求最新技术和大模型,而是聚焦端到端实际垂类场景的落地,确保技术方案与产品需求深度匹配。
我们的目标不是堆砌技术,而是让AI真正解决业务痛点,创造可衡量的价值。 🚀
之前马克斯说过
“Don't be afraid of new arenas.” 不要害怕新的竞技场。
现在我想改写下这句话,与君共勉。愿我们都能使用好AI这把新利器,迈进创新方式改革的新纪元。
“ 不要害怕新的竞技场 ,但要带着产品思维入场。 ”
体验入口:
https://enterprise.alayanew.com,欢迎试用小文Agent和小点Agent,进入知识库,获取你的专属「智能写作助手」。
未来将会开放更多的智能助手,敬请关注。
特别谢鸣:AILab团队所有成员,齐心协力,保障小文小点顺利上线
文章来自于“九章云极AlayaNeW”,作者“NANA”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。
项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。
项目地址:https://github.com/black-forest-labs/flux
在线使用:https://fluximg.com/zh
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0