新闻动态
你的位置:8bet体育 > 新闻动态 > 美团也搞起了高科技? 两个月连发4款ai模型, 开源免费人人可玩
美团也搞起了高科技? 两个月连发4款ai模型, 开源免费人人可玩

发布日期:2025-11-24 00:59    点击次数:89

美团是彻底不满足于送外卖了!刚两个月连发四款AI模型,11月3日又甩出个LongCat-Flash-Omni,直接支持全模态不说,还开源免费让大家玩。

作为天天点美团外卖的打工人,我第一时间就下载App实测了,这体验真有点超出预期。

打开LongCatApp,首页就能看到文字和语音两种输入方式,还能语音通话,视频通话功能据说很快就上。

Web端更方便,能直接上传图片和文件。

我先试了最近很火的“数羊哄睡”功能,本来以为就是简单数数,没想到模型还会偷懒。

数到三就直接跳到十,还找借口说是小羊跑太快,这拟人化的小细节,一下子就让交互变得有意思起来。

接着我拿了个用光的香水瓶测试视频通话功能,接连问了好几个问题。

这是什么东西、瓶身上的字是什么意思、能不能带上飞机。

模型都一一解答,思路很清晰,完全没有卡顿。

本来以为开源模型在实时交互上会打折扣,没想到反应这么快,和平时跟人聊天差不多流畅。

文字输入测试里,我抛了个物理题,让它模拟球在旋转的六边形内弹跳,还要考虑重力和摩擦力。

没过多久,模型就给出了详细的代码和可视化方案。

我试着跑了一下,效果确实符合预期,看来它对物理世界的规则理解也很到位。

最让我惊喜的是图片理解,我找了张“鸭岁钱”的梗图,自己还在琢磨笑点,模型已经秒出答案,连网络热梗都能精准捕捉,这适配度真的没话说。

语音测试我特意找了段复杂环境下的骑手送餐录音,里面有BGM和环境噪音。

本以为识别率会受影响,结果模型不仅准确识别出了人声,还给出了针对性建议。

如此看来,不管是日常聊天、专业问题还是复杂场景的语音识别,这款模型都能轻松hold住。

实测封神:这AI不仅快,还啥都会

这款模型能有这么好的表现,核心离不开它的硬件配置和技术优化。

模型总参数量达到560B,但激活参数只有27B,这种“大总参小激活”的设计,让它既能保持强大的知识储备,又能实现高效推理。

在权威的全模态基准测试中,它超越了Qwen3-Omni、Gemini-2.5-Flash等多款竞品,达到开源领域的顶尖水平,甚至能和闭源的Gemini-2.5-Pro掰掰手腕。

更难得的是,它没有出现“全模态就降智”的问题,文本、图像、音频、视频等单项能力都排在开源模型前列。

它的响应速度更是一大亮点,从输入指令到生成第一个结果的时间非常短,是目前首个能实现全模态实时交互的开源模型。

这种“快”的基因,和美团在外卖领域追求的高效配送逻辑不谋而合。

把做外卖的优化思路用到AI模型上,美团这波跨界玩得确实聪明。

不过公测阶段也不是没有小问题,我在上传jpg格式图片时就遇到了上传错误的情况,后来看官方交流群说这是暂时的bug,后续会修复。

安卓用户还要注意,官方11月3日中午修复了联网搜索的问题,需要卸载重装才能正常使用。

这些小插曲不影响整体体验,毕竟是刚上线的产品,后续优化完善就好。

聊完实测和性能,咱们再深挖一下,美团到底是怎么把AI模型做得又快又全的。

全模态模型的训练一直有不少难题,不同类型的数据结构差异大,很难融合好,而且实时交互和离线理解很难兼顾,训练效率也容易受影响。

美团的解决方案很有针对性,它采用了渐进式的训练方式,先从纯文本预训练开始,再慢慢引入音频和视觉数据,逐步建立跨模态的理解能力。

这种循序渐进的方式,让模型的基础更扎实,不会出现顾此失彼的情况。

架构上它用了ScMoE混合专家架构,还加入了零计算专家,能根据内容的重要性动态分配计算资源。

简单说就是让模型把力气用在刀刃上,不重要的内容少花点精力,重要的内容多投入算力,这样既保证了效果又提高了效率。

为了提升训练效率,美团还搞了模态解耦并行策略,把大模型和各个编码器分开优化,各自匹配最合适的硬件资源。

这样一来,多模态训练的效率几乎能赶上纯文本训练,大大缩短了迭代周期。

不止快和全:美团的AI野心藏着大棋

如果以为美团只是单纯想做个AI模型,那可就小看它了。

这款LongCat-Flash-Omni的发布,只是美团AI战略的冰山一角。

从今年7月开始,美团就动作频频,领投了它石智航、星海图等具身智能企业,其中它石智航还创下了具身智能行业天使轮融资纪录。

除了投资,美团自己也在深耕硬件领域。

它的无人机配送已经在深圳、北京等多个城市落地,累计完成的商业订单超过67万单,比谷歌旗下的无人机配送公司还多。

现在还开通了夜间配送服务,借助城市灯光和传感器,能实现厘米级的精准降落。

无人车配送也不遑多让,在深圳已经实现全无人运营,累计订单突破500万单,覆盖了100多个居民社区。

这些无人机和无人车,就是美团AI模型的“手脚”,负责把虚拟世界的决策落实到物理世界。

以前觉得美团就是个外卖平台,现在才发现,它早就开始布局“数字世界+物理世界”的连接了。

AI模型是“大脑”,负责理解需求、做出决策;机器人、无人机是“手脚”,负责执行任务、完成配送。

这种“脑手协同”的模式,正好契合了美团“连接线下业务和线上世界”的定位。

美团副总裁毛一年在机器人学术年会上也明确说了,未来5到10年,具身智能是核心技术范式。

美团的目标很清晰,就是用技术驱动零售行业变革,让无人化服务覆盖更多场景。

从外卖配送的智能调度,到现在的AI模型和机器人,美团一直在用科技提升效率。

美团用做外卖的“快稳”逻辑做AI,确实走对了路子。

开源免费让更多人能体验到好用的AI模型,既积累了用户反馈,又提升了品牌影响力。

技术上不搞花架子,聚焦用户真实需求,把实时交互、多模态理解这些核心功能做扎实。

再加上背后布局的具身智能和硬件产品,美团已经构建起了一套从AI模型到落地场景的完整生态。

未来,当LongCat系列模型的能力和无人机、无人车深度融合,可能会给本地生活服务带来全新的变化。

虽然现在AI赛道竞争激烈,大厂纷纷入局,但美团凭借自己的场景优势和技术积累,已经占据了一席之地。

这款LongCat-Flash-Omni的表现,让大家看到了外卖巨头的科技实力。

至于它能不能一直领跑开源赛道,还有待时间检验,但至少现在,这款免费又好用的全模态模型,已经足够让用户为它买单了。