最近AI圈有点“退烧”,但这反而是件好事。
过去两年,我们习惯了每隔几个月就被一个新模型“震撼”一次。但今年明显感觉到,**大模型本身正在从“秀肌肉”进入“拼耐力”的阶段**。GPT-4o的实时交互、o1的慢思考能力确实更强了,但那种“...
朋友们,AI圈最近又整活了。
先是OpenAI的o1/o3把**“慢思考”**推上台面,证明大模型光靠堆参数已经不够,会推理才是新护城河;Google Gemini、Anthropic Claude紧追不舍,国内DeepSeek则以极致性价比杀出重围,把大模型的...
AI最近有点“卷”,但终于开始像回事了。
最近AI圈的热点,一句话总结:**国外秀肌肉,国内拼价格,大家比落地。** 先看国外。OpenAI的o1模型把“推理能力”抬到了新高度,做数学题、写复杂代码、甚至辅助科研都强了一截。这说明大模型...
**AI正在从”炫技”走向”搬砖”**
说实话,最近AI圈最显著的一个变化是:大家终于不再只盯着参数表和 benchmark 刷榜了。 OpenAI 扔出 o1,重点秀了一把'慢思考'的推理能力,说明 Scaling Law 这事儿还远没到头。但普通用户其实...
AI没有”冷静期”:近期热点杂谈
推理模型的'慢思考'革命 如果说去年的大模型竞赛比的是参数规模和知识储备,那么今年的焦点明显转向了推理能力。OpenAI发布的o1系列模型,用'思维链'(Chain-of-Thought)的方式展示了什么叫'三...
最近AI圈明显换了个气氛——**魔法少了,工程多了。**
基础大模型这边,OpenAI o1的推理能力、Claude 3.5的编程表现确实硬核,但坦白说,单纯'更大更强'的叙事已经开始让观众疲劳。行业共识越来越清晰:**模型能力不再是瓶颈,怎么塞进真实工作流才...
最近AI圈又进入了一年一度的“集中喷发期”,话题多到我这种日更博主都快追不过来。简单挑三个最值得聊的聊聊。
**第一,推理模型的崛起。** OpenAI的o1、o3把“让AI多想想”变成了现实,从快思考切换到慢思考,做题能力确实肉眼可见地提升。但这事没必要过度神化——它本质上是Scaling Law在推理侧的一次延...
**AI正在从”做题家”变成”办事员”**
最近AI圈的热闹,可以用一句话概括:模型卷不动了,开始卷'干活'了。 OpenAI的o1把'推理'做成了显学,各大厂纷纷跟进。这释放了一个明确信号:AI不再满足于做秒回话的'快嘴',而是要学会'慢思考...
**AI这一年:从”哇塞”到”然后呢?”**
最近打开科技新闻,满屏还是AI,但味儿有点变了。 上半年大家还在疯狂卷参数、卷多模态,GPT-4o的实时语音演示惊艳了一把,Sora的视频生成让好莱坞编剧提心吊胆。但到了下半年,风气明显从'秀肌...
AI中场战事:从炫技到落地,2024年的冷静与狂热
多模态不再是噱头 当GPT-4o用近乎实时的语音交互再次惊艳全场,当Gemini Live试图让手机成为一个真正的对话伙伴,多模态已经从PPT里的技术名词,变成了用户每天都能摸到的产品功能。但问题也随...


