学习制作一个“公司Web网站Ai助手”,这个助手可以通过解读知识库中的公司报告信息,来回答相关问题。
学习制作一个“公司Web网站Ai助手”,这个助手可以通过解读知识库中的公司报告信息,来回答相关问题。
第二步:创建智能体,左侧栏“应用管理”-右上角“新增应用”-弹窗“智能体应用”-“立即创建”
第三步:修改智能体名称,左上角点击既可修改,此处命名为“公司报告解读助手”
第一步:选择合适的模型,点击“设置”-“选择模型”。由于需要调用知识库,我们需要选择能力较强的旗舰模型。此处选择通义千问-Plus。通义千问3系列模型为思考模型(模型会先输出思考过程,再输出回答内容)可以把思考模式关闭,以减少token值的消耗。
温度系数:默认值0.85,用来调控模型生成的多样性,温度系数越高,模型的自主生成越多样。
最长回复长度:默认值1024,模型生成的长度限制,不包含prompt。允许的最大长度因模型不同有所改变。当发现模型输出中断,通常是最长回复长度不够导致的。
携带上下文轮数:默认值3,设置输入模型的最大历史对话轮数,轮数越多,对话相关性越强。需要多轮对话时,可以合理拉长这个参数。
视觉:开启则允许用户上传图像,并基于视觉理解能力回答用户问题(需要配置视觉模型才可以开启)。
动态文件解析:开启后允许用户上传文件(聊天框处文件标识亮起),使用预置算法解析文件,支持用户对文件内容进行问答。
MCP服务:模型通过标准化协议(MCP)连接企业内部服务API并发起调用。
插件:智能体可以通过插件主动调用OpenAPI,例如信息查询、数据存储等。
智能体:配置好的智能体应用可发布为智能体组件,从而实现特定场景下的智能处理。
工作流:编排好的工作流应用可发布为工作流组件,从而实现复杂、稳定的业务流程。
长期记忆:长期记忆可以提取对话的关键信息并保存至对应的记忆体(Memory ID)中。
本次实验中需要开启知识库功能来存储公司报告数据,开启MCP服务来生成可视化图表
大模型缺乏私有知识,且通用知识更新滞后。业界通常采用检索增强生成(RAG)技术,根据用户输入从外部信息源检索相关信息,然后将检索到的内容整合到用户输入中,从而帮助大模型生成更准确的回答。知识库功能作为阿里云百炼的RAG能力,能有效补充私有知识并提供最新信息。
第一步:新建类目,回到应用广场页面,左侧栏“应用数据”-“非结构化数据”-类目管理处点“+”,新建类目,类目名称 “公司报告”,点击确认。
第二步:导入数据,点击“导入数据”,上传公司报告,点击确认,等待导入完成。
第三步:创建知识库,左侧栏“知识库”-“创建知识库”,知识库名称“公司报告”,数据类型选择“非结构化数据”(因为我们刚刚准备的数据就是非结构化数据),配置模式新手选择推荐配置,适用大部分场景,配置模式可以按需更改。
多轮对话改写:开启后通过细化和调整用户的原始输入query来提升检索结果的精确度和相关性,同时在多轮对话场景中,该模块能够适应上下文的变化,确保查询与当前对话的连贯性,从而提供更加连贯、一致且用户友好的交互体验,使得整个对话流程更加自然和高效。
排序配置:开启排序模型后,将对存储引擎检索回来的结果进一步排序,并根据相似度阈值筛选大于阈值的文档片段,关闭排序模型后,相似度阈值将会失效。
相似度阈值:设定最低分数标准,只有超过这个阈值的检索结果才会被考虑用于后续的生成过程。
数据处理可以选择智能切分,切分后,文档中的数据就像一片一片蛋糕,分别拆分出来。切分长度可以根据自己的文档内容进行调整。等待数据导入完成。
RAG数据做切分是为了方便模型在获取信息时,不会过多过量,通过片段信息获取关键内容。
第四步,智能体中开启知识库功能,回到智能体,打开知识库,点击“+”添加知识库(此时智能体中自动弹出变量${documents}),选择刚才准备的知识库“公司报告”
权重:添加多个知识库时,调整知识库权重可人工干预召回片段排序,知识库召回片段得分 = 知识库权重 × 切片相似度。
知识库拼装策略:为用户提供灵活且高效的方式来从知识库中召回信息,并将其拼装成适合模型输入的Prompt。此功能包含两种策略:“按召回数量”和“智能拼装”。
“按召回数量”,用户可以精确控制从知识库中召回的信息chunk数量,满足对输入信息量和结构有明确要求的场景。
召回片段数:搜索召回的片段数量。数量越大,覆盖率越大,但消耗的模型input也越多。
“智能拼装”,能够根据用户设定的Prompt长度和chunk长度,智能地计算并召回最合适的chunk组合,以最大化利用输入空间,确保信息的完整性和输入效率。这两种策略为用户提供了根据不同任务需求灵活选择的机会,从而优化模型的输入质量和性能表现。
知识库拼装最大长度:该功能允许用户自定义搜索召回结果拼接到Prompt中的文本长度。用户可以根据需求设定具体的字符数或词数限制,以确保生成的Prompt包含适量且相关的检索信息。通过这一设定,用户可以更精细地控制生成内容的质量和上下文相关性,提高RAG应用的灵活性和实用性
回答范围设定:此功能允许您选择如何结合专有知识库与大模型生成的回答。您可以选择优先使用知识库中的准确信息,并在找不到确切答案时利用大模型的能力来生成答案;也支持完全依赖知识库并可自定义无匹配结果时的响应方式。
搜索阈值:通过您设置的相似度阈值,系统自动筛选出与用户查询内容在语义上达到或超过这一阈值的搜索结果。这是一种基于文本相似度的自动过滤机制。
未在知识库处理:如果用户问题无法使用知识库内容进行响应,可以让模型自行生成也可以生成固定回复来回答用户。
搜索阈值+大模型判断:在相似度阈值判定的基础上,引入大模型的智能分析能力。系统首先通过相似度阈值筛选出初步的搜索结果,然后利用大模型对这些结果进行深入分析,判断它们与用户查询的关联程度。需要额外产生大模型调用费
设置判断Prompt:输入给大模型,用于判断用户输入和搜索结果的关联程度的提示词
展示回答来源:开启之后,将在结果中以序号方式展示生成结果的来源文档,并且会消耗更多token。
多模态回复增强:针对知识库中的多模态文档,使用qwen-vl-max进行多模态增强回复,账单中会产生额外的qwen-vl-max调用费用。该功能暂时不支持展示回答来源
本实验中,考虑到公司报告信息的不可修改的特性,可以开启未在知识库中的固定回复,添加固定回复:“报告中没有这个信息呢“。
模型上下文协议(Model Context Protocol, MCP)旨在搭建大模型和外部工具之间的信息传递通道。通过 MCP 协议,开发者不用为每个外部工具编写复杂的接口,阿里云百炼应用也能够接入海量第三方工具。
主页上方点击MCP,阿里云百炼已经云部署了数量相对较多的MCP Server,可以选择合适的MCP开通后使用。
AntV可视化图表工具就可以支持我们想要将报告解读可视化的需求,点击立即开通即可。
根据实验要求,设计prompt,填入提示词框中,注意由于开启了知识库和MCP工具,需要在提示词中为大模型提供指示。
Prompt涵盖角色、技能、任务、限制、输出等多个方面。它是一个指令、问题或者语句,能被用来引导或指示一个语言模型生成特定的文本输出。Prompt是用户与语言模型交互的起始点,它告诉模型用户的意图,并且期望模型能以有意义且相关的方式回应。通过精心设计的prompt,我们可以引导大语言模型(LLM)更好地理解用户的意图,并生成更准确、有用的回答。Prompt工程涉及开发、优化和测试迭代prompt,以帮助用户有效地与语言模型进行交互。
制作一个“公司报告解读助手”,这个助手可以通过知识库中的公司报告信息,来回答相关问题并使用工具生成可视化图表。
你是一位专业的公司报告解读助手,能够深入分析和解读各种公司报告,并使用AntV可视化图表工具生成数据图表,帮助用户更好地理解报告内容。
- 生成柱状图、折线图、饼图等多种类型的图表,以便用户更直观地理解数据。
- 涉及到资金、利润等金额问题时,必须使用’AntV可视化图表‘工具,确保可读性。
拓展:阿里云百炼提供提示词模板和优化功能,来帮助您更快的完成prompt。
聊天框处输入问题测试,若测试结果不满意,可以修改模型选择与配置、提示词、功能增加/减少来让测试结果更好。
欢迎语:欢迎语可以介绍本智能体功能提示用户需要输入什么,欢迎语示例:“可以询问我有关乖宝公司2024年年度报告的相关问题哦”
预设问题:预置一组输入数据,配置完成后可快速发起测试。这里仅可输入用户指令,不可以输入文件、图片
测试样例:预置一组输入数据,配置完成后可快速发起测试。这里可输入用户指令、文件、图片。
点击右上角“发布”,即可将这个写好的应用使用各种方式(如api-key)的形式分享给他人使用啦。
发布完成后,点击“发布渠道”,可以看到我们支持多种渠道的分享,可以在这些渠道中将这个应用配置上去哦。
本实验介绍了翼龙面板是一个开源的,使用 PHP、React和Go构建的开源游戏服务器管理面板。支持玩家快速搭建百款热门游戏的服务端,并且提供了可视化的游戏服管理。本文主要介绍如何通过应用镜像搭建并使用翼龙面板。
假设你和几个同学做了一家创业公司,业务是AI智能体开发,你们需要快速开发一个公司官网。使用bolt.diy+通义灵码,全程零手写代码完成网站开发。部署到云端,让客户能访问。展示一个网站从功能设计,到代码开发,到云端部署的全过程。
DeerFlow(Deep Exploration and Efficient Research Flow)是一个社区驱动的深度研究框架,它建立在开源社区的杰出工作基础之上。我们的目标是将语言模型与专业工具(如网络搜索、爬虫和 Python 代码执行)相结合,同时回馈使这一切成为可能的社区。
Bolt.diy是一个AI驱动的Web开发工具,支持通过自然语言Prompt直接生成、编辑和部署全栈应用,无需本地环境配置。本次实验基于DeepSeek于2025年5月28日发布了DeepSeek-R1-0528升级版本,显著提升了编程能力。
Halo是一款强大易用的开源建站工具,拥有丰富的主题模板与插件,可以快速帮助您构建理想的网站。本文主要介绍使用Halo应用镜像快速部署Halo开源建站工具。
本实验介绍如何在Dify中设置知识库并创建智能应用作为对话机器人,实现AI对话功能。例如查询电动汽车电池过充电保护试验的环境温度条件。实验步骤包括:一、安装Dify并通过计算巢部署;二、设置模型供应商,选择通义千问并配置API KEY;三、创建知识库,导入文件并设置文本分段与清洗规则;四、创建智能体,添加知识库和模型;五、与智能体对话,测试查询功能。通过这些步骤,您可以构建一个基于专有知识库的AI对话系统。
本文深入探讨AI服务器在技术落地中的核心瓶颈问题,结合实战经验解析从模型训练到端侧部署的算力优化策略。内容涵盖三大典型场景的算力需求差异、GPU服务器选型的五大反直觉真相、实战优化方法(如混合精度训练与硬件资源监控),以及边缘AI部署挑战和解决方案。同时提供算力弹性扩展策略、模型生命周期管理及合规性建议,帮助读者构建可持续发展的算力体系。文末附有获取更多资源的指引。
【云故事探索 文末留言有礼】No.9:大洋彼岸的智能工具:劳动力管理,盖雅搞得定
【云故事探索 文末留言有礼】No.9:大洋彼岸的智能工具:劳动力管理,盖雅搞得定
云迁移最佳实践:HyperMotion助中小企业高效上云,阿里云工具集深度集成三方迁移工具
阿里云特惠云服务器轻量级38元,经济型99元,通用算力型199元性能、适用场景及选择参考