最近刷科技新闻,一个感受特别强烈:AI圈的速度,已经快得让人有点喘不过气了。
前脚还在惊叹Claude 3.5的代码能力,后脚GPT-4o的多模态交互又刷新了认知;Sora的视频生成还没完全开放,国内可灵、即梦们的镜头语言已经追了上来。大模型仿佛进入了”无限内卷”模式,每个月都有新王登基,每季度都有参数纪录被打破。
但说实话,作为普通用户,我的”惊艳阈值”正在被不断拉低。现在看到某个模型又提升了几个百分点的评测分数,第一反应不再是”哇塞”,而是”哦,然后呢?”
因为我们都慢慢明白了一个道理:**会聊天的AI是玩具,能干活的AI才是工具。**
所以今年年底最让我兴奋的,不是某个模型的 benchmark 又破了纪录,而是AI Agent(智能体)的集体爆发。从Anthropic的Computer Use到智谱的AutoGLM,再到各类RPA+AI的落地产品,AI正在从”给你答案”进化到”帮你操作”。
这个转变非常关键。它意味着AI开始从内容生产的外围,渗透到工作流的核心。以前你问AI”怎么写周报”,它给你一段文字;现在你告诉AI”把本周销售数据整理成周报,发邮件给张总,并订好下周的会议室”,它真的能一连串执行下去。
当然,现在的Agent还像是一个”实习期的小白”——能干活,但得盯着,时不时还会把表格搞乱。但方向是对的。**大模型的天花板正在从”智商测试”转向”动手能力的培养”。**
另一个值得玩味的热点是视频生成。Sora的登场确实像一颗炸弹,但半年过去,大家发现”电影级AI视频”和”抖音级AI视频”之间,隔着一道叫做”可控性”的鸿沟。创作者真正需要的不是AI生成一段不知所云的唯美画面,而是让主角在第八秒准确地掏出手机,背景里恰好走过一只黑猫。这种精细控制,目前的技术还做不到。
这也引出了一个更深层的问题:AI的技术曲线和商业化曲线,正在出现错位。技术越炫酷,落地时碰到的细节就越繁琐。
说到底,2024年底的AI圈,正在经历从”技术崇拜”到”应用务实”的拐点。资本和市场都不再单纯为参数买单,大家开始问那个最古老也最关键的问题:**这玩意儿到底能帮谁赚多少钱,或者省多少时间?**
我的观点很简单:**模型大战已经审美疲劳,Agent竞赛才是下一个主战场。** 而当AI真正学会”干活”而不是只是”说话”的时候,我们面对的变革,可能比过去两年加起来还要大。
只不过这一次,别再只顾着沸腾了。让AI先把那个周报发了再说。



暂无评论内容