Why Nostr? What is Njump?
2025-04-05 02:57:49
in reply to

f6XF on Nostr: #动手能力成为AI分水岭# 智谱发布了最新Agent产品 AutoGLM ...

#动手能力成为AI分水岭#
智谱发布了最新Agent产品 AutoGLM 沉思,恰逢公司要组织去意大利旅游,因为人数足够,可以定制出行,我就问了智谱GLM沉思 一个超级复杂的旅游设计问题,给到途牛旅行网帮助定制落地(包括人数,预算,旅游想法,团队年龄结构等,问题和解答详见:网页链接 )。

通过这个例子发现几个特点。
1)思考的时间实在是太长了,大概8分钟,这个绝对是目前所有大模型产品中最长的,这个搞法感觉厂商要亏钱啊,不能什么小问题都用沉思版,大问题才可以。这么长时间算力消耗出来的结果是真好。

2)这个思维链过程中,切分了很多步骤,每个步骤都要通过联网搜索的方式证实方案是否靠谱,比如这个方案是否满足用户预算,不想去多个地方,有奥莱购物的旅游约数条件,而不是想到哪里说到哪里,真是每一步都要通过联网搜索获得可靠证据,才进行推荐。这个问题就进行了9次搜索,比如搜索了 "意大利三星酒店平均价格", "佛罗伦萨 酒店 可以 容纳 大型 团体"等 。按照一次联网搜索7厘价钱的市场价格,这个提问仅搜索就消耗了6.3分啊 [笑脸] 。Open AI上的Deep Research每月订阅费用为 200 美元,智谱深度研究免费,真是给大家省钱了。

3)最后的方案还非常具体,比如2.5万的人均预算,住宿费多少,交通费多少,都非常清晰,选定的3个城市佛罗伦萨,罗马和那不勒斯的旅游安排也非常具体,大家都很满意,虽然威尼斯这次没考虑,但是确实很难兼顾所有,留点遗憾下次再来吧。

就目前智谱发布的这个最新AutoGLM沉思效果,做旅游定制这么复杂的任务,完全在其强大的思维链掌控之中,考虑到我厂也在抓紧研发联网搜索,深知其中的不易,希望能够进一步努力,降低联网搜索成本,提高联网搜索的效果,努力吧。
#AutoGLM沉思#



https://postimg.cc/gallery/qgbbLNV




Author Public Key
npub19ymyv276scfw9y83wgclmh9f5evtgungpjmxrdfhkyfp6keadqasy8djan