图片来源:WisdomAI
Rubrik 联合创始人 Soham Mazumdar 于 2023 年离职后,创立了一家名为 WisdomAI 的新数据初创公司。
该公司提供 AI 数据分析服务,能够从结构化、非结构化甚至“脏”数据(即未清除拼写错误或错误的数据)中提取商业洞察。
直接处理原始数据的位置和方式,这本质上是企业商业智能软件的终极追求,也是Coatue 领投高达 2300 万美元巨额种子轮融资的原因。Madrona、GTM Capital、Anthology Fund 等机构也参与了本轮融资。
业务经理无需再要求数据分析团队生成报告,而是可以直接向WisdomAI 提问并深入挖掘细节。Mazumdar 举例说明,比如营收主管想知道“我该如何完成本季度目标?”,WisdomAI 的答案会提供团队应重点关注的待完成交易清单,以及每笔交易延误的具体原因,例如客户正在等待解决的问题列表。
“通过我们的平台,首席风险官只需敲击五次键盘,就能直观查看到这一最末级的细节层面,而传统流程则需要五位人员(包括一些分析师)参与,耗费大量时间。”Mazumdar 表示。
这只是WisdomAI 希望解答的众多问题类型中的一个例子。
另一位早期客户是一家石油天然气公司,其数千名现场员工正使用WisdomAI 就生产问题提问,数据来源涵盖从存档文件到遥测技术的方方面面。
显然,现有所有商业分析工具,以及众多初创公司都已提供基于人工智能的自然语言提示功能。
WisdomAI 因其创始团队的卓越背景而脱颖而出——他们此前均与 Mazumdar 在 Rubrik 共事。 Mazumdar 表示,该平台的超强之处在于其准确性,即使面对杂乱数据也能应对自如。它能在数据库等结构化数据及文件中存储的非结构化数据中精准找到答案。
同样重要的是,WisdomAI 不会产生幻觉性输出。
大多数企业正通过聚焦于训练AI 模型的数据、模型规模、提示工程以及可能采用的实时检索技术(如检索增强生成 RAG)来提升 AI 应用的准确性。然而,它们仍面临答案捏造的风险。
WisdomAI 将 GenAI 用于查询构建环节,而非答案生成。"归根结底,GenAI 可能出现幻觉。我们利用 GenAI 编写小型程序来查询这些不同的系统,"Mazumdar 解释道。
因此,如果WisdomAI 的模型产生幻觉,它所做的不过是编写一个无法检索数据的虚假查询。数据本身——即问题的答案不会被捏造。
WisdomAI 宣称康菲石油、思科和 Descope 是其早期客户,并拥有与 Snowflake、谷歌 BigQuery、亚马逊 Redshift、Databricks 和 Postgres 等主要云数据存储服务合作的客户。Mazumdar 表示,它可以通过分析查询日志和其他来源学习查询语言,从而在任何数据存储系统上进行训练。
参考资料
https://techcrunch.com/2025/05/07/ai-data-startup-wisdomai-nabs-23m-with-a-smart-way-to-avoid-hallucinations/
编译:ChatGPT
文章来自于“Z Potentials”,作者“techcrunch”。
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI