IT之家 2 月 13 日音讯,科大讯飞今晚发布了最新的投资者关系行径纪录表,主要针对 DeepSeek 方面的问题进行解答。
科大讯飞暗示,飞正在检修的纯国产算力的星火 X1 新版块瞻望在 3 月内完成,预期不错结束数学答题和进程想维链才气全濒临标甚而逾越 OpenAI o1。
此外,科大讯飞还暗示他们正在将 X1 深度推理模子进一步勾通与中国教科院等诸多熟谙大家的互助,通过专科常识反想及长想维链强化学习勾通,生成相宜熟谙教学需求的“教学想维链”,提高复杂场景推理的逻辑正确性、专科性、可阐扬性,并将率先用于教师助手、删改、辅学等全系产物翻新,瞻望在 2025 世界数字熟谙大会时间发布熟谙专属大模子和翻新应用。
IT之家摘选部分重心信息如下:
DeepSeek R1 快速对标 o1 的主要翻新是其苛刻并结束的 R1-Zero 强化学习检修决策,即平直在 DeepSeek-V3-base 预检修模子上进行大限度强化学习检修,可在数学、代码等推理任务上得到接近 o1 模子的效果,而不依赖任何有监督微调(SFT),这是面前国表里公开已知的、在大限度任务上得回告成效果的首个发布效果,之前学术界已有联系征询,但因为预检修基座模子不够好而使得强化学习的收益不好,这一效果具有较强的翻新性,大大减少了数学、代码等任务检修对东说念主工标注推理进程数据的需求。
DeepSeek R1 并不是惟一高水平的国产深度推理大模子。2024 年 9 月 OpenAI o1-preview 发布以后,国内工夫率先的大模子厂商也在快速跟进。科大讯飞基于此前在考语模子、强化学习方面的积蓄,在 2024 年 10 月就结束了蒙特卡洛树搜索(MCTS)等算法翻新并跑通了深度推理模子检修算法,因为只可使用国产算力,咱们荒芜奢华 2 个月完成华为昇腾 910B 算力的适配和优化并大幅提高检修效劳(检修效劳比较 A100 从 55% 提高到 85%),于本年 1 月 15 日完成了星火深度推理模子 X1 的检修和发布。天然面前 X1 模子很小(仅 130 亿参数),但依靠咱们算法和数据上风,星火 X1 已达到不错和 OpenAI o1-preview 对看法水平;跟着国产算力的慢慢到位,模子参数加多后,咱们十足有信心结束数学答题和进程想维链才气全濒临标甚而逾越 OpenAI o1。此外,勾通与中国教科院等诸多熟谙大家的互助效果,咱们将使得 X1 的想维链设施愈加相宜熟谙教学的专科条目,在熟谙、医疗等边界结束更大的应用赋能价值。
DeepSeek 团队围绕 DeepSeek V3 和 R1 的检修和推理降本,结束了多个有用的软硬件勾通深度工程优化翻新,包括 MLA(通过低秩矩阵对 KV 矩阵进行压缩权贵缩短 GPU 显存的消耗)、MTP(通过多帧预测提高数据诳骗率及检修效果和推理效劳)、DualPipe(通过更底层的 PTX 教导优化英伟达 GPU 操办和通讯的并行)、FP8 夹杂精度检修(业界初度使用 8Bit 量化浮点数花式结束超大限度模子的检修,以往齐是使用 16Bit 量化),最终 DeepSeek 基于 2048 张英伟达 H800 卡,约 560 万好意思元就能完成 V3 模子的一次齐全预检修。另外,DeepSeek R1 因为触及基于大批数据的强化学习迭代检修,其资本未公布。
和 DeepSeek 不异,科大讯飞受限于有限的算力资源,曩昔几年对于星火大模子检修和推理资本效劳的捏续优化也作念了大批插足,和 DeepSeek 平直使用英伟达 H800 卡上开展的各式工程优化不同,科大讯飞选择了更难的天下产算力门路。从 2023 年 5 月起科大讯飞就合并华为先后攻克了万卡高速互联组网、操办通讯荫藏、检修推理强交互、高浑沌推理优化以及国产算子优化等一系列困难,将通用大模子、类 o1 的深度推理模子等的检修效劳对标 A100 均从最初的 30%-50% 优化达到了 85%-95% 以上;以 DeepSeek 绝顶垂青的万卡蚁合通讯带宽的诳骗率为例,DeepSeek 报说念的是 93%,而讯飞星火作念到了 95%。检修资本亦然讯飞星火大模子的竞争上风,咱们单次检修资本和 DeepSeek V3 在一个端倪,而且后头优化旅途也很明确,现在以昇腾 910B 为代表的国产硬件还不赞助 FP8 精度检修以及 DualPipe 的结束,跟着国产算力在底层才气上进一步提高,讯飞星火的检修资本还有较大的下落空间。
需要越过阐述的是,大模子对算力的需求为检修和推理两个方面,而检修结束的难度深广于推理。这等于天然接续有公司秘书不错在国产算力平台上提供 DeepSeek 在内等大模子的推理工作,但仍只好讯飞星火一家是检修和推理均在国产算力上进行的,而且仅用 1 万张 910B 国产算力卡,科大讯飞不仅用比友商少一个数目级的算力取得了大模子研发上的第一梯队效果,而且作念了大批国产算力平台上的无东说念主区的适配和效劳优化,追求国产算力的极致效劳,这比在英伟达上的结束更需要工夫实力和政策勇气。
面前总共全民下载的通用大模子 App 中, 只好讯飞星火一家是检修和推理均在国产算力上进行的欧洲杯体育,仅用 1 万张 910B 国产算力卡,科大讯飞不仅用比友商少一个量级的算力取得了大模子研发上的一系列效果,而且作念了大批国产算力平台上的无东说念主区的适配和效劳优化。天然接续有公司秘书不错在国产算力平台上提供 DeepSeek 在内等大模子的推理工作,但现在仍只好讯飞星火一家是检修和推理均在国产算力上进行的。
告白声明:文内含有的对外跳转勾通(包括不限于超勾通、二维码、口令等款式),用于传递更多信息,从简甄选时间,设施仅供参考,IT之家总共著述均包含本声明。 ]article_adlist--> 声明:新浪网独家稿件,未经授权讳饰转载。 -->