在人工智能迅猛发展的领域中,“搜索”的定义正经历深刻变革。不再仅局限于简单关键词匹配,企业搜索正转向在对话界面中对数据进行理解和推理,最终赋能自主 AI 代理,以重新塑造组织内部的工作方式。这一变革——由向量搜索、知识图谱和代理推理等创新驱动——正重塑企业如何访问、理解及利用海量信息。
数据挑战:赋能 AI 代理访问全企业数据
如今,企业在庞大且零散的数据环境中举步维艰。企业收集的数据通常以三种形式存在 —— 结构化、半结构化和非结构化。企业产生了大量非结构化内容 —— 如通话记录、正式文件、 Slack 消息和电子邮件,这些内容蕴含巨大价值,却常常被低估利用。由于格式不一致、数据质量欠佳以及日益严格的隐私和安全要求,充分利用这些内容面临不小挑战。
而随着可互操作 AI 代理的出现,这些挑战只会更为严峻。这些代理不仅需要识别准确信息,还必须在确保信任、隐私及合规防护措施的前提下,自主且安全地处理数据。
要真正发挥效能,AI 代理需要实时访问全面、准确且富有情境信息的数据 —— 尤其是关于客户的资料。通常,它们无法快速识别出解决客户问题或采取主动措施所需的洞见。例如,关于客户忠诚历史或家庭状况的数据可能散落于各系统中,甚至妨碍了诸如为家庭友好型度假村促销发送个性化推送通知等简单自主操作。
当数据被孤立、分散或充满噪音时,AI 代理只能凭猜测运行,导致输出结果不可靠。这使得众多首席信息官深陷“垃圾输入 - 垃圾输出”的循环。简单来说,糟糕的数据等于糟糕的 AI。
搜索的演进:从关键词到语义
传统搜索引擎高度依赖关键词匹配。如果某份文档未包含您所寻找的确切短语,您可能会错过关键信息。由 AI 驱动的搜索首个重大突破出现在向量搜索领域。当查询常以口语或自然语言表达时,系统必须理解词语背后的含义。向量搜索将数据和查询转换为数值表示 ( vectors ),使系统能够基于语义相似性而非仅凭字面匹配进行搜索。这意味着,诸如“关于产品 XYZ 的客户情绪”这样的查询,即便相关文档没有明确出现“情绪”一词,而是讨论客户意见、评论或感受,也能被准确检索出来。
然而,企业数据的复杂性要求我们做得更多。虽然向量搜索是一个强有力的起步,但内容格式的多样性及对更深层情境理解的需求催生了增强索引技术。在这一过程中,AI 更进一步,首先理解数据并构建类似图谱的本体论。可将此视为将凌乱的非结构化数据 ( fact: 现今 80% 的企业数据均为非结构化 ) —— 包括文档、电子邮件、演示文稿 —— 整理成一个涵盖谁、什么、何处、何时以及为何的结构化网络。这种“知识图谱”为搜索响应提供了关键情境,从而带来更深刻、准确的结果。
弥合鸿沟:非结构化、结构化与深度搜索的统一
企业不仅面临非结构化文档的问题,大量关键数据还存储在结构化数据库中。为实现真正统一的搜索体验,自然语言转 SQL ( NL2SQL ) 技术应运而生。这一创新使用户能够用简明英语 ( e.g., “Show me sales figures for Q1 in California for product A” ) 对结构化数据提问,AI 系统会自动将其转译为 SQL 代码以进行数据检索。它与向量搜索相辅相成,共同构建了一种既能查询非结构化信息又能查询结构化数据的整体方法。
在 Salesforce,我们致力于在 Data Cloud 中优化搜索与检索增强生成 ( RAG ) 技术,以提升生成式 AI 应用的性能和准确性,特别是为像 Agentforce 这样的 AI 代理提供支持。Salesforce 采用混合搜索方式,将向量搜索与关键词搜索相结合,从而弥补单一模型的局限 —— 实现更为一致、准确的结果。此外,Salesforce 正在采用将额外元数据嵌入文档和索引的方法,使 AI 模型在生成回答前能获取结构化情境,从而帮助防止大语言模型因处理部分或模糊数据而编造答案。
为大语言模型提供基础以提升自主可信度
大语言模型 ( LLMs ) 作为驱动生成式 AI 的强大引擎,彻底改变了我们与技术的互动方式。它们不仅能应对复杂问题、创作原创内容,甚至还能以惊人的流畅度编写代码。然而,企业很快便遇到了瓶颈:大语言模型仅受限于其训练数据,而这些数据往往是静态的,并不包含企业特有、即时或专有的信息。
这正是检索增强生成 ( RAG ) 显得不可或缺的原因。RAG 充当关键桥梁,使企业能够将其独特内部数据安全地直接连接到大语言模型上。这种连接转变了 AI 对企业的潜力,使得回答不仅更可信、更贴切,而且能够做到实时准确。
设想一下:借助 RAG 无缝将大语言模型连接至您的内部知识库,一个自主 AI 代理能够即时提供充分考虑客户整个互动历史的客服响应,或生成与最新品牌指南及营销活动数据完全契合的营销简报。这正是普通 AI 与深度掌握企业实时数据之智能系统之间的巨大差异。
若要在整个组织内实现无与伦比的效率与成功,您需要通过 RAG 将大语言模型、基于云的数据引擎、您的 CRM 与对话式 AI 的力量整合在一起。这一强大组合将使您能够部署一系列性能卓越的代理,每个代理都针对各部门独特需求量身定制,深度融入工作流程,并不断刷新信息以推动业务成果。
前行之路:企业智能与自主代理
终极愿景无疑是由自主 AI 代理驱动的企业智能。试想企业内部的 AI 代理能够独立访问并搜索全企业信息,以执行复杂任务。这可能意味着一个 AI 代理负责研究市场趋势,另一个整理竞争情报,或者还有一个通过自主从各内部系统收集数据来解决客户服务问题。然而,实现这一愿景也面临诸多重大实施挑战。关键难题包括:
数据整合: 连接并整合多样化数据系统,同时严格遵守权限要求
数据质量: 确保输入数据干净、一致且高质量 —— 因为推理引擎的表现仅取决于其所消耗的数据
本体构建: 构建准确反映企业信息细微差异的企业级知识图谱和本体是一项复杂任务
性能: 在处理海量数据集和复杂推理过程时,对搜索速度和效率有着至关重要的要求
尽管面临这些挑战,发展轨迹已然明朗。企业搜索的未来将是智能化、互联互通且日益自主。通过采纳向量搜索和知识图谱等创新技术,企业有望开启前所未有的洞察力和运营效率,彻底转变信息在整个组织中如何驱动决策。