国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 新聞 > 科技 > 正文

工程院院士與DeepSeek過了一招 探討AI發展路徑問題

2025-03-03 10:09:51
字體:
來源:轉載
供稿:網友
近日,DeepSeek的出現引發了全球科技領域的廣泛關注和深入討論。中國科協會刊《科技導報》2025年第3期刊發了中國計算機學會原理事長李國杰院士的文章《DeepSeek引發的AI發展路徑思考》,探討了DeepSeek背后所蘊含的AI發展路徑問題。

李國杰是中國工程院院士、發展中國家科學院(TWAS)院士,研究方向涵蓋計算機體系結構、并行算法、人工智能等多個領域。

DeepSeek的橫空出世是人工智能發展史上的標志性事件。短短7天內,用戶增長超過1億,打破了用戶增長速度的世界紀錄。與此同時,英偉達股價單日暴跌17%,市值縮水5890億美元,創下美國上市公司單日最大損失紀錄。這表明,高算力和高投入不再是發展人工智能的唯一途徑,集成電路制程優勢也不再等于人工智能技術霸權。DeepSeek引領行業進入以算法和模型架構優化為主的新時期,同時高度重視數據質量和規模,并理性提高算力。此外,DeepSeek標志著中國科技公司從“追趕者”變為“規則改寫者”,在全球人工智能領域展現出顛覆性創新。

全球人工智能龍頭企業紛紛擁抱DeepSeek,微軟最早宣布將其R1模型添加到Azure AI Foundry,亞馬遜云科技(AWS)、英偉達、超威半導體(AMD)等也相繼部署DeepSeek V3和R1模型。上億用戶和眾多大公司根據性價比和親身體驗主動融入DeepSeek生態。DeepSeek推出的高效率、低成本推理模型和開源商業模式,引領了人工智能行業新潮流。

V3和R1模型受歡迎的原因在于其在模型算法和系統軟件層次的重大創新。V3模型參數量高達6710億,但采用混合專家模型(MoE)架構后,每次調用僅激活約370億個參數,顯著降低了訓練計算成本。改進的多頭潛在注意力機制(MLA)減少了鍵值緩存開銷,將顯存占用降至其他大模型的5%~13%,提升了運行效率。R1模型摒棄傳統監督微調(SFT),提出群組相對策略優化(GRPO),通過強化學習激發推理能力,簡化了訓練流程。這些發明雖非首次提出,但DeepSeek通過努力將技術做到極致,在前人成果基礎上登上新的技術高峰。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 信阳市| 湘阴县| 洞头县| 徐闻县| 宁都县| 昌邑市| 孝义市| 八宿县| 巫山县| 建宁县| 饶阳县| 乐安县| 台北市| 盱眙县| 兴山县| 乌兰察布市| 佳木斯市| 哈尔滨市| 合作市| 泸水县| 淄博市| 兴仁县| 瑞丽市| 金平| 乌兰察布市| 甘洛县| 阳朔县| 昌吉市| 沁源县| 淮安市| 克什克腾旗| 通许县| 溆浦县| 岳西县| 神农架林区| 青川县| 华亭县| 广丰县| 崇阳县| 田阳县| 阿坝|