前百度大佬“放下”AI搜索,转做Agent浏览器,评分超越Manus

关注
一次自我革命的转型,能成吗?

编者按:本文来自微信公众号 “鲸选AI”,作者:杨晓鹤,创业邦经授权转载。

前百度集团副总裁、小度科技CEO景鲲离职创业的GenSpark,最近从AI搜索向AI Agent转型,看来是想脱离AI搜索的竞争红海,向更智能的Agents服务领域进发,推特上很多网友评价,此次新产品比较有看点。

他们宣称Genspark Super Agent是一个综合性的AI助手(AI Search+Browse+Agents ),可以协调多个AI工具执行各项任务。鲸哥测试下来,GenSpark在AI搜索、Agent、Deepsearch几方面,都做了比较好的融合。

有多厉害呢, 在“GAIA Benchmark”(通用人工智能基准测试 )图表中,Genspark在三个不同级别(Level 1、Level 2、Level 3 )测试中的表现,都超越了Manus、OpenAI Deep Research 等产品。

但对于刚刚正式海外上线的Manus而言,GenSpark显然并没有瞄准它作为竞争对手,而是选择Perplexity、秘塔AI以及过去的自己,颠覆AI搜索显然是个更大的市场。

如今的AI搜索有几个痛点:

1、问题思考的时长,回答的长短不好控制,受限于模型能力,回答效果也不一定。这点很影响用户体验,等了半天回答的不尽如人意,那用户可能用一次就走。

2、没有多维信息处理,也没有Agent能力,这意味着想法到工具服务的路径没法打通。这个是百度多少年的梦想,搜索始终局限在文字信息中心。

3、没有Deep Research能力,很多深度思考的问题,只是调用AI回答了,不够深入。

Manus一定程度上,解决了2、3问题。但是也付出了代价,就是程序比较重,内置虚拟机操作浏览器,结合AI大模型深度处理问题,结果在VSC中查看,给出的效果确实不错。

也造成大家日常问题不能麻烦Manus,毕竟没有网页服务可随时用,只能下载端侧应用,而且一思考就20分钟,还十分消耗Tokens,费时费钱。更具难度的问题,还是ChatGPT的DeepResearch更靠谱。

GenSpark使用门槛比较低,但是每次使用感觉尚可。

这源于它的解决思路,是在日常和中等任务这段区域,快速回答问题,并且完成度不错。

在官网上,GenSpark给出了典型问题『去哪旅游』的回答Case。

可以看到GenSpark搜集了衣食住行的各项问题,比较惊喜的是,它还搜索了图片等多维信息,调用了地图等工具。

而且还在最后,给出了餐厅等预订链接,你可以直接点击打电话预订。

GenSpark还有个打电话功能,和豆包通话是AI对话能力不同,你对他说“预订明天晚上7点在西餐厅的两人座位”,Genspark 就会拨打电话并完成预订。

这个功能比较西方化,国内好多人用APP习惯了,电话都不怎么打了,我们是大众点评团购是主要服务场景。

相比智谱等AutoGLM等直接实现了点咖啡,GenSpark确实还没Agent到这一地步。但从使用效果而言,一句话直接买咖啡场景,适合的环境需要非常理想的环境,以及你要全部授权调用能力给AI。

简单说发布会看看就得了,实际操作很难落地。

而GenSpark选择调用Agent但是不全部执行的策略,查看了很多网页以及工具,涉及到购买等步骤就停止了,最后一公里不只是技术问题,还是隐私保护等问题。当下阶段不去触碰,还是挺明智。

官方给出的案例很多有滤镜,以下是我测试的第一个问题,也是我近期在思考的AI兼职创业问题,大家可以看看效果几何。

设计下如何利用Gen-4、GPT-4o、Trae等最新工具,做AI短剧、AI表情包、AI海报以及AI PPT(AI Coding 生成SVGPPT)爆款出圈。 然后分析哪个技术实现了行业转折点能力的突破,构建月入百万的实现路径,分析下哪个路径好!

GenSpark深度分析了几个领域目前的进展,捋顺了行业从生产到售卖的过程,并提出了优劣分析。以下是其中AI短剧一个领域的分析截图,制作流程的分解,收益模式的分析,盈利数据的预测等等,挺面面俱到分析。

最优秀的是,他直接生成了比较精美的PPT。而且这个PPT不是套模板,很多分布图和逻辑图,都是按照生成的内容配比。

一份相当具有可用性的分析报告,一度让我十分惊艳。

当然,相比Deep Research来说,他的思考水平还是有一点差距,我调用O3-mini-high模型的Deep Research同样做了这份分析报告。

Deep Research没有生成更容易浏览的PPT,但是内容更深刻点,每个项目需要的工具,以及启动成本,还有潜在收益估算,都有贴近实际的分析和呈现。(报告链接:https://chatgpt.com/share/67ee1d0c-d7f8-8005-af20-4cff30eb6fbe)

在第二个测试中,我测试了电商购买场景中的思考问题:

帮我比较电商渠道的两款产品:

我在考虑购买<Mac M4芯片版本> 和 <华为鸿蒙最新款>。

需求:- 我经常出差,需要<影视剪辑>、<AI软件适配><续航长>的笔记本,也关注<不要太重>。

请从性价比、生态产品服务、用户评价等方面比较A和B,列出各自的优缺点,并根据我的需求给出推荐国内外等电商渠道的购买链接。

从生成的报告看,并仅用了三四十秒钟就完成了。而且查看了电商品台的网页,给出了购买链接,将一些国补等优惠信息也分析了出来。这就有点实用了。

实现以上能力,他们提到了GenSpark产品背后的几项技术突破。

1、世界上第一个混合代理系统,利用最佳模型、工具和数据集来完成不同的任务

它的LLM可以使用 o 1、o3-mini-high、Claude 3. 7。图像生成可以使用 FLUX、ogram、Recraft,视频可以用 Kling 和 Luma。

不知GenSpark是不是利用CoE(Collaboration-of-Experts,专家协同)架构,实现了思维链+多系统协同,每个问题能找最适合的大模型回答。这个GenSpark不算是第一个实现。

2、内部构建的各种可靠的工具集,经过精心构建和测试,以确保效率和稳健性

调用工具集是否顺畅,Google genmini有先天优势,它在移动互联网时代做了比较多的工具。

现在AI时代,预计MCP协议有助于让大模型调用工具更顺畅。这点短期有差距,长期大家应该都能顺畅使用很多工具。

3、内部构建的各种可靠数据集,预先构建并从网络上提取,以确保质量、新鲜度和数量。

估计这是Genspark对传统搜索更理解的优势所在,自己从头清洗数据。从生成的内容看,鲸哥认为比目前的AI搜索效果更好一些。

当然,也不是说Genspark没有劣势。目前来说Genspark也是套壳应用,它卡在AI搜索和纯粹Agent应用两种形态中间,大家是否会习惯这种AI形态,就比较难说。

而且在AI搜索市场并未建立起优势,就彻底转变为Agent形态,还好是大厂高管背景出身,刚刚融资了1亿美金,作为初创企业有一定的容错率。

这里不得不提到ARC浏览器,最近转型比Genspark转型还激烈。ARC浏览器本身有一定的市场知名度,但是背后的企业The Browser Company ,宣布ARC以后只维持,企业另起炉灶重新做了面向AI时代的Agent浏览器——Dia(还未发布)。

Dia看起来极简,实际也是在走夸克的『超级搜索框』思路,AI对搜索的内容分析精细度和彻底融入了Agent能力方面,都号称更强。

相比Dia,Genspark没这么AI Native,它更像是Chatbot形态的AI浏览器。比Dia更易用,未来潜力也许比不过。

从使用成本来看,Genspark也只是比Manus略低,每个月24.99美元。当下阶段,对内容有深入要求的用户,可能付费ChatGPT的DeepResearch更有效果。

当然,Genspark还有AI图片、AI视频等功能,公告说正在自己训练模型。这样看每个月25美金还值得。

目前,Genspark也支持制作解释烹饪食谱的视频或根据新闻主题制作简短的动画视频。AI会自动处理从脚本创建、视频生成到语音合成的所有事情。

鲸哥看效果并不出众,这些流程没必要Agent化。视频肯定是效果有限,不是效率优先。

客观说,Genspark这次转型还比较有眼光,如果沿着AI搜索的路径走,大概率下轮融资也比较难,且不说ChatGPT和Perplexity这些巨头对其威胁,Google这些掌握搜索数据的企业,还有底层模型的优势,未来等AI搜索的产品形态稳定,想超越也是分分钟的事情。

Genspark向着更Agent能力发展,就走出了差异化竞争路线,有助于培养用户的新AI使用习惯,提升付费率。

作为初创企业,也许给自己找到了短期活下去的出路。长期竞争还是很难,Agent浏览器预计是2025年最受关注的AI应用赛道,大厂预计都会下场竞争。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅