初创公司Starcloud完成史上首次“太空轨道大模型训练”
1 天前

轨道数据中心初创公司Starcloud上月中旬发射了一颗搭载英伟达H100芯片的卫星,成功实现了人类首次在太空中训练大语言模型的尝试。目前,该卫星正运行基于谷歌开源模型Gemma的应用,并使用莎士比亚全集对LLM NanoGPT进行了训练。Starcloud计划建造一个5吉瓦的轨道数据中心,旨在使轨道数据中心的能源成本比地面数据中心低10倍。通过Starcloud - 1的在轨运行,该公司将验证构建太空数据中心的可行性。选择将英伟达芯片送上太空,是因为地面电力容量有限,而太空数据中心可以利用太阳能供电。目前,“太空算力卫星”已开始处理商业服务,能够实现实时情报处理。Starcloud计划于2026年10月发射的卫星将搭载多块英伟达H100芯片及新一代Blackwell平台,明年发射的卫星则将配备云平台模块。Starcloud - 1还将验证轨道算力卫星的运营风险,其卫星寿命约为5年。尽管面临诸多不确定性,但众多科技公司仍在积极推动太空数据中心的发展,谷歌计划发射自研TPU到太空运行,Lonestar Data Holdings则着眼于在月球建立商用数据中心。