AI开展不克不及只靠“力年夜砖飞”
发表时间:2025年02月28日浏览量:
【国际科技·论谈】◎胡定坤在航空范畴,有个说法叫“力年夜砖飞”,每每用来描述某种战役机气动形状计划个别,依附强盛的动员机推力取得较好的飞翔机能。克日,马斯克旗下人工智能企业xAI推出Grok 3系列年夜模子,称其在数学、迷信跟编码等范畴击败了Open AI的GPT-4o,以及深度摸索公司的DeepSeek V3等“先辈”。马斯克称Grok 3为“地球上最聪慧的AI”。Grok 3在练习中应用了20万张高机能GPU,远超GPT-4的2.5万张跟DeepSeek的2048张。有报道称,Grok 3应用的算力是GPT-4的20倍、DeepSeek的263倍。岂非说,AI的开展趋向将要浮现为“算力年夜”而“模子飞”吗?毫无疑难,算力是推进AI开展最要害的推进力之一。DeepSeek经由过程翻新算法年夜幅节俭算力令人冷艳,但算力的主要性不该因而被贬斥。2月初,美国兰德智库在批评中写道,假如DeepSeek能够应用更多的芯片,它就能够练习出更强盛的AI模子,更早地做出某些发明。 Grok 3应用了更庞杂的推理模子,练习时长到达2亿GPU小时,但练习却只用了8个月,重要归功于其史无前例的算力支持。更强的算力既可能满意更庞杂模子、更大批数据的练习需要,又能够放慢盘算速率、收缩练习时光,增进AI模子的疾速迭代跟提高。然而,AI的开展也不该完整依附算力,纯真走“力年夜砖飞”的技巧道路。对Grok 3的一些对照测试发明,算力上风仿佛不带来碾压式的机能上风。2月19日,号称“印度最年夜的数据迷信社区”的Analytics Vidhya宣布文章称,对照应用Grok 3跟DeepSeek-R1处置Python代码编程等五个特定成绩时发明,DeepSeek-R1对四个成绩的答复优于Grok 3。独一无二,专门研讨ChatGPT等AI东西应用技能、网名“Alex Prompter”的X用户也应用Grok 3、DeepSeek-R1跟ChatGPT o3-mini处置五个特定成绩,成果Grok 3仅在两个成绩中得胜。更值得存眷的是,算力在推进AI提高的同时,支持算力的芯片产能跟保持算力的动力耗费也开端碰到壁垒。AI开展趋向研讨机构EpochAI统计发明,2019年至今,用于AI模子练习的算力约每6个月翻一番,每年增加4—5倍,而同期英伟达出货的GPU芯片盘算才能10个月才干翻一番。往年1月,兰德智库猜测,到2028年,单个数据核心AI练习耗电量可能到达1吉瓦,须要一座核电站供电;到2030年,则须要8座核电站。芯片产能跟电力需要正在成为制约算力晋升的瓶颈成绩。AI开展的汗青也标明,即便在算力发达开展的近10年,算法的奉献也功弗成没。EpochAI跟MIT FutureTech的结合研讨以为,从2014年到2023年,在对AI机能晋升的奉献中,算力约占65%、算法占35%,这仍是DeepSeek宣布前的成果。研讨还发明,算法的改良平日存在弗成猜测性跟间歇性,有可能临时研讨不成果,也有可能一个灵感带来AI机能的年夜幅晋升。客岁8月,EpochAI宣布讲演指出,在芯片、电力等制约下,到2030年,美国的AI模子算力仍有潜力晋升10000倍,但须要数千亿美元的投入。偶合的是,特朗普下台伊始就发布了“星际之门”打算,投资5000亿美元建立人工智能基本设备。因而,在一段时光内,算力堆砌不会结束,也很可能还是AI开展的主要引擎,毫不能疏忽。然而,DeepSeek的横空降生也足以告知人们,在AI算法范畴,同样须要增强投入,并且要保持不懈地探索,哪怕阅历漫长的缄默。