1.软银3.75亿美元收购富士康俄亥俄州工厂,助力AI数据项目;
2.聆动通用机器人完成数亿元天使轮融资;
3.达摩院开源具身智能“三大件” 机器人上下文协议首次开源;
4.“最强模型”GPT-5发布后评价褒贬不一,奥特曼回应
1.软银3.75亿美元收购富士康俄亥俄州工厂,助力AI数据项目
8月10日,多家媒体报道称,软银集团通过其壳公司Crescent DuneLLC以3.75亿美元(约合人民币27亿元)的价格,收购了富士康位于美国俄亥俄州的电动车工厂。
这座工厂始建于1966年,最初由通用汽车建造,后于2022年被富士康收购,旨在打造北美电动汽车生产基地。值得注意的是,该工厂拥有数据中心专用土地资质及完善的基础设施,是特朗普政府时期规划的项目之一。
报道指出,此次收购是软银为推动其与Open AI、甲骨文合作的5000亿美元“星际之门”AI数据中心项目的重要举措。此前,该项目在融资和选址方面遭遇诸多挑战,导致项目进展停滞。为此,软银曾与富士康接洽,希望富士康能够参与全美数据中心及相关设施的建设工作。
另据彭博社报道,收购完成后,富士康将负责该工厂的运营工作,并计划将其转型为AI服务器制造基地或直接用作数据中心。
资料显示,自2019年宣布进军电动汽车设计和生产以来,富士康一直为中国台湾汽车制造商供应汽车,但其海外业务举步维艰,面临着与其合作的美国电动汽车初创企业失败等问题。
今年5月,日本三菱汽车寻求开拓新的市场,将从富士康采购电动汽车,用于在大洋洲市场销售。根据计划,这些电动汽车将由富士康(又名“鸿海精密工业”)以原始设备制造商(OEM)的方式供应,这是这家中国台湾制造商首次与日本汽车制造商达成此类协议。该电动汽车预计将于2026年下半年开始销售。
2.聆动通用机器人完成数亿元天使轮融资
近日,安徽聆动通用机器人科技有限公司(简称“聆动通用”)完成数亿元人民币天使轮融资。由元禾璞华战略领投,讯飞创投持续战略加码,投资方涵盖优势资本、盈科投资、天智投资、合肥高投等头部市场化及地方国资机构。本轮融资主要用于加速公司行业级具身VLA大模型和具身通用机器人的研发及产业化。
公开资料显示,聆动通用成立于2024年12月,是一家“讯飞系”具身智能通用机器人公司,是安徽省首家“大脑-小脑-本体”全链路自主可控的硬科技初创企业。公司核心团队来自中科大、中科院、哈工大、港中文、马普所、卡尔斯鲁厄等国内外顶级高校及科研院所,能力横跨大模型、感知、规控、运控、仿生机构等具身关键技术栈领域,同时具备国内最早一批在医院、银行、商超等场景批量应用大型服务机器人并实现商业闭环的实践经验,且拥有车规级产品研发背景及体系能力。依托讯飞星火认知大模型底层能力,致力于将具身大模型和通用机器人本体深度耦合,构建软硬件一体化行业级解决方案和标准产品,让具身机器人能理解会思考能干活,打造新一代生产力。
聆动通用致力于打造高泛化性的具身大模型和通用鲁棒的机器人本体,在技术路线上采取全栈自研的“多模态通用大模型基座+行业级Linden_VLM具身基础模型+Linden_VLA技能操作模型”分层端到端架构,实现具身机器人真正意义上从“大脑”高层级感知认知智能,到“小脑”面向规划层级的柔性泛化操作的运动智能全链路打通。结合类人型的具身通用机器人本体,实现多模态具身数据-跨任务技能泛化-仿人形态本体的高效迁移部署全流程闭环,并与客户侧业务系统的无缝衔接,让具身机器人可以在真实任务场景中快速实现技能学习和部署应用。
此前,聆动通用LDT系列具身智能采训推一体机已亮相,该产品可满足市面上大部分机器人的数据采集(需二次开发适配)和模型训练推理工作,是行业级通用数据采集设备,也是行业领先的具身智能模型训练平台,方便后续与不同品牌机器人适配实现真机部署。目前该产品已在多个具身智能数据采集训练场(公共)、企业私有化训练场、高校科研机构落地使用,助力泛制造业、科研探索等领域。
3.达摩院开源具身智能“三大件” 机器人上下文协议首次开源
8月11日消息,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型RynnVLA-001-7B、世界理解模型RynnEC、以及机器人上下文协议RynnRCP,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。
具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。达摩院将MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。达摩院打造了名为RynnRCP的一套完整的机器人服务协议和框架,能够打通从传感器数据采集、模型推理到机器人动作执行的完整工作流,帮助用户根据自身场景轻松适配。RynnRCP现已经支持Pi0、GR00T N1.5等多款热门模型以及SO-100、SO-101等多种机械臂,正持续拓展。
具体而言,RynnRCP包括RCP框架和RobotMotion两个主要模块。RCP框架旨在建立机器人本体与传感器的连接,提供标准化能力接口,并实现不同的传输层和模型服务之间的兼容。RobotMotion则是具身大模型与机器人本体控制之间的桥梁,能将离散的低频推理命令实时转换为高频的连续控制信号,实现平滑、符合物理约束的机器人运动。同时,RobotMotion还提供了一体化仿真-真机控制工具,帮助开发者快速上手,支持任务规控、仿真同步、数据采集与回放、轨迹可视化等功能,降低策略迁移难度。
大会上,达摩院还宣布开源两款具身智能大模型。RynnVLA-001是达摩院自主研发的基于视频生成和人体轨迹预训练的视觉-语言-动作模型,其特点是能够从第一人称视角的视频中学习人类的操作技能,隐式迁移到机器人手臂的操控上,从而让机械臂操控更加连贯、平滑,更接近于人类动作。
世界理解模型RynnEC将多模态大语言模型引入具身世界,赋予了大模型理解物理世界的能力。该模型能够从位置、功能、数量等11个维度全面解析场景中的物体,并在复杂的室内环境中精准定位和分割目标物体。无需3D模型,该模型仅靠视频序列就能建立连续的空间感知,还支持灵活交互。
此外,达摩院还在上月开源了WorldVLA模型,首次将世界模型与动作模型融合,提升了图像与动作的理解与生成能力。相比传统模型,该模型抓取成功率提高4%,视频生成质量显著改善,展现了较好的协同性和准确性。
开源链接:
·机器人上下文协议RynnRCP
https://github.com/alibaba-damo-academy/RynnRCP
·视觉-语言-动作模型 RynnVLA-001
https://github.com/alibaba-damo-academy/RynnVLA-001
·世界理解模型 RynnEC
https://github.com/alibaba-damo-academy/RynnEC
·WorldVLA模型
https://github.com/alibaba-damo-academy/WorldVLA
4.“最强模型”GPT-5发布后评价褒贬不一,奥特曼回应
GPT-5褒贬不一
凤凰网科技讯 北京时间8月9日,据彭博社报道,几个月来,OpenAI CEO萨姆·奥特曼(Sam Altman)一直在大力宣传GPT-5的性能,把它的发布描绘成了公司历史上的关键时刻。但是在GPT-5发布后的24小时内,这款新模型收到了褒贬不一的评价。
在周四的发布会上,OpenAI声称GPT-5在编程和处理复杂问题的推理能力方面更胜一筹,并表示它已先进到足以让聊天机器人ChatGPT达到“博士级专家”的水平。
令人失望
虽然一些早期使用者称赞了该模型,但也保留了意见。开发者西蒙·威利森(Simon Willison)在博客文章中写道,“它是我目前最喜欢的新模型”,称其“性能出众”,“偶尔令人惊艳”,“但与之前的版本相比并没有重大飞跃”。
在各大社交媒体平台上,ChatGPT用户对GPT-5持续存在编造信息、搞错基础数学和拼写问题的情况表示失望。本特利大学数学系副教授诺亚·詹西拉库萨(Noah Giansiracusa)认为,这次升级“令人失望”。他指出,虽然GPT-5“确实有些改进”,但“改进幅度比我期望的要小得多”。
奥特曼
部分用户的负面反应,或许源于他们对技术底层运作机制的误解。与OpenAI此前发布的模型不同,GPT-5会根据查询内容自动切换不同复杂程度的模型。这种设计虽然能优化公司的计算资源配置,但也意味着用户并不总能调用到最强大的技术版本。
例如,在一次测试中,当被问及单词“blueberry”中字母“b”出现了多少次时,GPT-5最初给出了“三次”的错误答案。但当被提示“仔细想一想”后,GPT-5似乎切换到了更高级的推理模型,给出了正确答案。
奥特曼:系统出故障
周五,奥特曼对部分用户反馈作出恢复,承认系统存在技术故障。“从今天开始,GPT-5会显得更聪明些,”他表示,“昨天自动切换器出现故障,大半天都无法正常工作,导致GPT-5表现得异常迟钝。”
此次升级对OpenAI至关重要。OpenAI正在努力保持领先地位,应对来自美国和中国竞争对手日益激烈的竞争。同时,它还要说服企业用户和个人用户为其付费服务买单,以抵消其在人才、芯片和数据中心等方面的巨额投入,维持AI研发。
随着AI系统的不断进步,想要明确评判各类服务的优劣变得越来越困难。截至周五中午,GPT-5已在LMArena(基于用户评分的热门AI模型排行榜)上登顶多个类别的榜首。但另一个基准测试ARC-AGI-2则显示,GPT-5落后于埃隆·马斯克(Elon Musk)旗下xAI的最新版Grok。
一些用户认为GPT-5写作更差
在缺乏更明确评估标准的情况下,模型之争有时更多靠感觉来判断。如今每周有近7亿人使用ChatGPT,难免会有人对模型的表现感受不一。要评估一个新AI系统对个人生活与工作的价值,短短一天时间远远不够。
宾夕法尼亚大学沃顿商学院教授伊桑·莫利克(Ethan Mollick)经常试用各类AI模型,他对GPT-5的研究能力、机智的文字应答以及编程简化功能(即便是对新手)赞叹不已。
“GPT-5会自主完成各种任务,常常是超凡的任务,有时是奇怪的任务,有时则是非常AI式的任务,”他在博客中写道,“而这正是它最迷人的地方。”
然而,在社交论坛Reddit上,用户的反应却截然不同。在周五的“有问必答”活动中,奥特曼面对了一些用户的质疑。这些用户对自己无法掌控和了解具体由哪个模型响应查询感到不满。奥特曼表示,OpenAI将采取措施解决这些抱怨,包括提高系统的“透明度”。
在活动中,奥特曼曾回应一位Reddit用户的问题。他指出,OpenAI认为GPT-5的某个版本在“写作质量”上优于GPT-4.5。随后他问道:“你觉得它更差吗?”接着,用户们立刻接二连三地回答说:“是的。”(文章来源:凤凰网)