【反超】谷歌如何凭借Gemini 3实现反超对手
1 天前 / 阅读约16分钟
来源:集微网
LG电子向诺基亚出售298项美国专利;谷歌发布Gemini 3,超越ChatGPT;同济大学成立人工智能语言研究院;清华大学团队为稀土纳米晶设计能量转换外衣;上海交大课题组在多模态柔性传感领域取得进展。

1.LG电子向诺基亚出售298项美国专利

2.谷歌如何凭借Gemini 3实现反超对手

3.同济大学人工智能语言研究院揭牌成立,推动人文与智能融合创新

4.清华大学科研团队为稀土穿上“能量转换外衣”

5.上海交大郭益平课题组在多模态柔性传感领域取得新进展


1.LG电子向诺基亚出售298项美国专利

据报道,LG电子于今年6月将其在美国注册的298项与视频编解码器相关的专利出售给了诺基亚。美国专利商标局于9月公布了这一信息。

这些专利均为标准编码专利,与LG电子今年1月出售给小米的59项专利相同。

视频编解码器用于压缩和恢复视频,或对视频进行编码和解码,它们用于使视频能够在智能手机和电视上播放。

诺基亚于2014年退出了手机业务。2024年,诺基亚192亿欧元的总收入中,有151亿欧元来自电信设备,另有19亿欧元来自专利许可费。

迄今为止,LG电子已将其大部分美国专利出售给了中国智能手机制造商。2023年至2024年间,LG电子向OPPO出售了55项专利。 2024年初,LG电子向TCL出售了14项专利,同年年底又向vivo出售了47项。

据消息人士透露,LG电子在2021年停止手机业务时,拥有约24000项标准专利。考虑到如此庞大的数量,LG电子仅小批量出售专利,这很可能是因为此类出售需要获得韩国政府的批准。然而,LG电子在2022年注册成为一家专利许可公司,同年从该业务中获得了8900亿韩元的利润。据悉,LG电子已将其专利授权给了苹果公司和另一家未具名的公司。


2.谷歌如何凭借Gemini 3实现反超对手

随着上周第三代Gemini大语言模型发布,谷歌(Google)的这款模型在业界公认的基准测试中超越了ChatGPT和其他竞争者,被评为当前能力最强的AI聊天机器人。

这一成绩令谷歌员工获得公开肯定,许多员工数月来一直在亲自测试该模型,让它讲笑话、用数学问题“刁难”它,并愈发确信他们握有终会使公司在大语言模型领域占据优势的筹码。

Gemini产品管理高级总监图尔西·多希(Tulsee Doshi)在进行她的一次“直觉测试”(vibe checks)时,要求该模型用古吉拉特语写作。这是一种在印度广泛使用但在互联网上并不特别普及的语言。测试结果远胜早期模型。

“我称之为生命迹象,对吧?”她说。“人们纷纷反馈说,‘我感觉到了,我想我们有了重大发现。’”

云内容管理公司Box的首席执行官亚伦·莱维(Aaron Levie)在本月中旬、也就是模型发布几天前,拿到了Gemini 3的早期使用权。该公司在周末对模型进行了内部评估,以了解其分析大量复杂文档的能力如何。

“起初我们还有点不敢相信,心想‘会不会是我们的评测出问题了?’因为性能提升幅度太大了,”他说。“但我们每次测试,它总是以两位数优势胜出。”

Gemini 3的推出为谷歌赢得了一场来之不易的胜利:多年来,谷歌首次在AI开发竞赛中大幅领先。

上周发布的这款最新AI模型令用户赞叹不已,他们称赞其智能、准确且具创造力。谷歌上周四表示,Gemini 3将为新版Nano Banana提供支持。这是一款热门的图像生成工具,今年已推动Gemini使用量快速增长。

Gemini 3的成功对OpenAI、Anthropic以及其他争夺AI主导地位的初创公司构成重大挑战。Gemini 3在十余项衡量不同智能类别的基准测试中全面领先竞争对手模型。

“他们是AI领域的赢家,这一点非常明确,”MoffettNathanson的分析师迈克尔·内桑森(Michael Nathanson)说。“我现在对他们手里的牌相当有信心。”

OpenAI的ChatGPT目前仍是最受欢迎的AI聊天机器人,热门程度遥遥领先于其他对手。OpenAI本月表示,ChatGPT每周活跃用户数量已达8亿,而Gemini的月活用户数为6.5亿。Anthropic的Claude则被广泛视为编程领域的领先模型之一。但有用户和分析师表示,Gemini 3的进步有可能巩固其作为处理各种任务的首选工具的地位。

自ChatGPT三年前面世以来,谷歌一直在奋力寻求在AI竞赛中占据优势。ChatGPT的横空出世令投资者更加担心谷歌标志性的搜索引擎会因聊天机器人而失去大量流量。谷歌数月来都难以取得进展。

据员工称,首席执行官桑达尔·皮查伊(Sundar Pichai)和其他高管此后一直致力于改革公司的AI发展战略,包括打破内部壁垒、精简领导层以及整合模型方面的工作。谷歌联合创始人之一谢尔盖·布林(Sergey Brin)已重返公司担任日常职务,协助监督公司的AI开发工作。

在今年5月份的年度开发者大会上,谷歌发布了一套先进的AI产品和其经典搜索引擎的改进版,该版本具有AI Mode功能,能以聊天机器人式的对话方式回答搜索查询。内桑森说,这让部分投资者重拾信心,认为谷歌正在卷土重来,不过,今年夏天公司股价仍然萎靡不振。

他说:“华尔街当时还在争论这些公司是否会成为AI浪潮下的牺牲品。”

随后在8月份,Nano Banana的首次亮相助推Gemini的使用量以史上最快速度增长。Gemini月活用户数从7月的4.5亿跃升至6.5亿。

9月,谷歌又取得一项重要胜利:此前有联邦法官认定该公司在搜索市场维持非法垄断地位,但该法官最终拒绝对该公司处以严厉惩罚。这位法官表示,市场的竞争动态已经发生变化,主要归因于AI。

谷歌母公司Alphabet上月公布了创纪录的季度收入,主要得益于云计算和广告业务的增长。该公司股价今年以来累计上涨50%以上,自夏季以来上涨逾60%。上周其市值达到3.6万亿美元,七年来首次超过微软(Microsoft)。

谷歌开发Gemini 3的目标是在AI最具挑战的领域实现突破。该公司的工程师和研究人员希望提升该模型对文本、图像、音频、视频和代码等多类内容的感知、分析与生成能力。与此同时,他们还希望增强思考与推理能力,从而打造更出色的个人助理,改进包括编程在内的任务表现。

Gemini 3发布后,一张显示该模型在20项基准测试中得分的表格在网上广为流传。在涉及专家级知识、逻辑谜题、数学问题和图像识别的测试中,该模型得分明显高于ChatGPT和Anthropic的最新模型。在唯一一项与编程相关的基准测试中,Gemini 3仅次于Anthropic的Claude Sonnet 4.5,位居第二。

谷歌内部进行了一些测试,其余测试由其他公司完成。在发布前的那个周末,员工们翘首以待分数回传,其中一些结果远超预期。

多希说,最大的惊喜是Gemini 3在名为Vending Bench的评测中表现出色。该评估通过要求模型操作一台自动售货机来测试其随时间推移进行思考和行动的能力。在模拟中,模型必须跟踪库存、下订单和设定价格,才能实现盈利。

“Vending Bench反映了我们希望通过这个模型真正转变和推动的事情之一,那就是改进工具使用和规划能力,”她说。

作为此次发布的一部分,谷歌开始向订阅用户提供在AI Mode下使用Gemini 3的机会,这是该公司首次在模型发布当天就将其整合进搜索中。该公司计划很快向美国所有用户推广该功能。

搜索产品副总裁罗比·斯坦(Robby Stein)说,他与Gemini团队合作了几个月,研究这款新模型如何优化搜索结果的呈现。在他的一次直觉测试中,他使用AI Mode请求帮助向他7岁的儿子解释飞机升力的概念。

他原以为会收到一段书面说明,结果是一个互动模拟:画面显示气流如何掠过机翼,并提供滑块让他移动机翼、改变气流,从而让飞机升空。

“我当时就想,‘哇,它确实能根据问题以最佳方式呈现信息’,”他说。“那是我对这款产品主要的‘顿悟’时刻。”


3.同济大学人工智能语言研究院揭牌成立,推动人文与智能融合创新

11月15日,同济大学人工智能语言研究院揭牌仪式举行,同期举办“语言、认知与智能——数智时代的语言与认知科学对话”国际前沿研究论坛,来自德国图宾根大学、比利时荷语鲁汶大学、香港理工大学、南京师范大学等国内外知名高校的专家学者出席活动。



揭牌仪式上,同济大学文科建设处负责人表示,人工智能正深刻重塑人文社科研究范式,语言作为认知与智能的核心载体,其与AI技术的深度交叉是时代发展的必然趋势,学校前瞻性布局“人工智能+哲学社会科学”战略,人工智能语言研究院的成立是推动新文科建设、服务国家重大需求的关键举措,标志着同济大学在人文与智能交叉创新领域实现重要突破。外国语学院负责人详细介绍了研究院的核心定位与发展规划,聚焦两大核心使命:一是以自然语言处理、深度学习和计算建模等技术革新语言学研究范式,推动研究从定性描述向量化、机制化和实验化转型;二是让语言学、人文和社会科学反哺AI发展,强化人工智能的语言理解、文化适应与人文价值导向。未来,研究院将重点建设多语种、多模态语料与知识图谱体系,开发模型能力评估框架和语言智能基准,为大模型的语义理解、语用推理、文化共情等维度提供科学测评支撑;在教育领域将推进“教学研评管数智一体化”,研发智能写作批改、口语陪练与综合测评系统,探索“AI+语言+认知”融合的创新教学模式。



作为研究院揭牌后的首场学术盛会,国际前沿研究论坛通过主旨报告、分论坛研讨、青年学者论坛、国际认知语言学主编论坛等多元形式,搭建了高水平学术交流平台。在主旨报告环节,国内外顶尖学者围绕语言认知与智能技术融合展开深度探讨。南京师范大学张辉教授通过眼跳实验证实汉语句法结构的方向性心理模拟机制,为认知语言学提供实证支撑。比利时荷语鲁汶大学Benedikt Szmrecsanyi教授挑战传统假设,提出语言多样性是优化交际效率的适应性设计。上海外国语大学谭业升教授呼吁AI文本生成融入具身认知与文化语境,实现“智能向善”。四川外国语大学李恒教授剖析大模型的双刃剑效应,倡导建立跨学科伦理评估体系。德国图宾根大学Harald Baayen教授展示词向量技术在认知语言学中的创新应用。上海外国语大学雷蕾教授发布汉语词汇复杂度分析工具AlphaLex系列。同济大学孙坤教授构建多模态语义计算模型,为类人智能系统提供理论支撑。

论坛设置的六大分论坛及青年学者论坛,覆盖人工智能技术与认知语言学、智能语言教育、跨文化传播等多个方向。华东理工大学黄嫣副教授、同济大学李夷博士等青年学者分享了最新研究成果,彰显了交叉领域的创新活力。在主编对谈环节,国际期刊专家围绕选题趋势、投稿指南等内容与师生深度交流。

外国语学院负责人表示,此次人工智能语言研究院的揭牌,是学院推进学科交叉融合的重要举措。未来,学院将以研究院为核心,持续深化“语言+AI”创新研究,汇聚全球学术资源,为服务国家战略需求、构建人类语言智能共同体贡献同济力量。


4.清华大学科研团队为稀土穿上“能量转换外衣”

清华大学深圳国际研究生院韩三阳副教授团队联合黑龙江大学、新加坡国立大学科研力量,为稀土纳米晶设计了一件独特的“能量转换外衣”,可高效传递能量,为其在现代光电技术中的产业化应用扫清了关键障碍。相关成果以“捕获电生激子实现可调谐的稀土纳米晶电致发光”为题,在线发表于国际期刊《自然》。

稀土纳米晶因发光颜色可调、谱线窄、稳定性高等优势,被视为电致发光领域“潜力股”。但该材料的绝缘特性导致电流无法直接注入,使其无法像半导体材料那样被电流直接高效点亮,难以应用于LED(发光二极管)、OLED(有机发光二极管)等现代直流电致发光器件,陷入“穿着棉袄跑步”的技术困境。

针对这一核心瓶颈,联合团队创新性提出有机—无机杂化策略,通过表面修饰为稀土纳米晶穿上“能量转换外衣”。这件“外衣”可精确调控能级结构,将激子能量高效传递给稀土离子发光体,成功解决了电致发光中激子产生、输运和注入的关键难题,实现高色纯度、光谱可调的高效电致发光。

早在2020年,韩三阳团队就在《自然》发表稀土材料光致发光相关成果。此次研究进一步构建起从光驱动到电驱动的完整技术链条。该成果无需大幅改动器件结构,仅通过调控稀土离子即可实现多色发光,在高分辨率显示、近红外技术等领域应用潜力显著,未来有望拓展至人体健康监测、无创检测、农作物补光等场景。


5.上海交大郭益平课题组在多模态柔性传感领域取得新进展

近日,上海交通大学材料科学与工程学院金属基复合材料全国重点实验室郭益平教授课题组在柔性压电传感领域再获重要进展。其最新研究成果以 “Auxetic-Assisted Decoupling Strategy for High-Sensitivity Multimodal Sensing of Temperature and Strain” 为题,正式发表于国际著名材料期刊《Advanced Functional Materials》。

本项研究创新提出基于“旋转-方块”负泊松比结构的应变–温度双参量解耦策略,实现了在强热-力耦合环境下的高精度多模态感知,突破了传统传感器在多物理场耦合下易产生信号干扰的技术瓶颈。研究成果展现出在复杂、多参量工况中稳定运行的卓越性能,为未来新一代智能化、环境自适应传感系统的发展提供了重要技术支撑。



随着新能源汽车、可穿戴设备和大型储能电站的快速发展,锂离子电池的安全监测成为亟待解决的关键问题。电池在工作过程中会经历显著的热–力耦合变化,如热量堆积、气体析出引起的鼓胀、电极结构形变等,这些早期迹象往往预示着潜在的热失控风险。因此,需要一种能够同步监测温度与形变的多模态传感技术,实现电池健康状态的实时评估。然而,现有柔性传感器在双参量检测中普遍存在信号串扰,并在高温环境下易失效。为实现有效解耦,目前不少方案依赖复杂的电路补偿或机器学习算法,但随之带来能耗高、硬件体积大等问题,难以满足电池系统对长期稳定性和低功耗的严格要求。

本研究提出了一种基于模量异质“旋转-方块”负泊松比结构的创新解耦策略,实现了温度与应变传感单元在器件层面的垂直隔离,从源头上几乎完全消除了热–力信号的串扰。该结构在拉伸时,其刚性单元会发生旋转,从而使温度敏感模块免受形变影响;而柔性单元则产生全向扩张,显著增强钾钠铌酸盐(KNN)无铅压电层的面内应变,有效补偿其固有 d31 系数较低的缺陷。得益于这一结构设计,温度传感单元在 25–130 °C 范围内均保持高度稳定与完全独立的响应,温度分辨率可达 0.1 °C。同时,首次开发的 KNN 架构压电单元可实现 100% 拉伸,并能在无热干扰的情况下识别微至 5 μm 的表面鼓包。当应用于软包锂电池时,该传感阵列可同时监测过热与胀气起鼓等失效迹象,为复杂环境下的结构健康监测提供了一种紧凑而可靠的双参量感知解决方案。



图 1 多模态传感器的结构设计与应用(a)器件结构示意图。(b)拉伸前器件状态俯视结构示意图;(c)拉伸后器件状态俯视结构示意图。(d)该多模态器件可应用于软包电池的安全监测。

论文第一作者为上海交通大学材料科学与工程学院2021级直博生殷淏,上海交通大学材料科学与工程学院郭益平教授为论文的通讯作者。该项工作得到了国家重点研发计划(No.2022YFA1205300 and No.2022YFA1205304)的资助。

论文链接:https://doi.org/10.1002/adfm.202525166、