加载中...

加载中...

图片
头像
主题 0 成员 0
加入
提示:
请先关注智造圈~
头像
扭矩泰坦
10-12 20:33 · 江苏
千亿美金涌入中国科技股!“DeepSeek时刻”引爆价值重估
中国工业报 吴晨 王珊珊近日,一只由美国锐联投资研究发行的中国科技股ETF(交易型开放式指数基金)在纳斯达克上市,其前十大重
查看全文
头像
设备诊疗
10-12 18:21 · 未知
DeepSeek、宇树入选《时代》年度300大发明;马斯克:解决AI用电需求的关键是储能电池丨AIG
1.【《时代》公布年度300大发明榜单:DeepSeek、宇树入选年度300大发明】北京时间10月10日,美国《时代》杂志公布了2025年度最佳发明榜单,共有300款产品上榜,其中包括宇树科技、DeepSeek、华为、比亚迪、苹果公司的产品。在机器人领域,宇树科技
查看全文
头像
展闻天下
10-11 22:18 · 江苏
DeepSeek苦练1T,清华只用5B?InfLLM-V2把稀疏注意力玩明白了
引言长序列高效处理已成为大模型应用的关键。传统稠密注意力在序列变长时计算开销极速增长,直接限制了产品可用性与成本可控性。为解决这一痛点,清华与 OpenBMB 提出 InfLLM-V2:一种零额外参数、训练高效的原生稀疏注意力框架。
查看全文
头像
技术拓荒录
10-11 17:04 · 江苏
刚刚,DeepSeek 又更新了
刚刚,DeepSeek 又更新了赶在假期前夕,DeepSeek 刚刚正式发布 DeepSeek-V3.2-Exp 模型。顾名思义,这是一款实验性(Experimental)版本,用于探索下一代架构的可能性。那这款模型有什么亮点呢?官方原话是这么说的:「作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基
查看全文
头像
齿轮学者
10-11 13:04 · 江苏
国产AI软硬协同加速:DeepSeek新模型上线 一众芯片厂商官宣Day 0适配
9月29日晚间,国产人工智能(AI)技术厂商深度求索(DeepSeek)宣布正式发布DeepSeek-V3.2-Exp模型,正如其名称所示的那样,这是一个基于V3.2实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,Deepseek V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀
查看全文
头像
齿轮学者
10-11 12:22 · 江苏
像专家一样运用DeepSeek的心法和技法
下面从 “心法”、“技法” 和 “实战” 三个层面,带你成为DeepSeek的使用专家,像专家一样不仅仅会提问,更是能掌握一套工作流程和思维模式。一、 核心心法:像搭档一样思考专家和普通用户的根本区别在于
查看全文
头像
扭矩泰坦
10-04 11:10 · 江苏
科普丨DeepSeek怎么用?这些策略超实用!
为了更好地利用DeepSeek,以下是一些实用的策略和建议:
查看全文
头像
设备诊疗
10-01 21:22 · 未知
DeepSeek突然拥抱国产GPU语言!TileLang对标CUDA替代Triton,华为昇腾Day
DeepSeek v3.2有一个新改动,在论文里完全没提,只在官方公告中出现一次,却引起墙裂关注。开源TileLang版本算子,其受关注程度甚至超过新稀疏注意力机制DSA,从画线转发的数量就可以看出来。
查看全文
头像
熵增定律
10-01 21:17 · 江苏
真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强
好好好,都赶着国庆节之前开卷是吧。前脚DeepSeek更新到了V3.2,现在智谱又更新了——正式推出GLM-4.6,代码能力直接推到了国内最强。
查看全文
头像
全栈 007
09-30 17:17 · 江苏
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
刚发V3.1“最终版”,DeepSeek最新模型又来了!DeepSeek-V3.2-Exp刚刚官宣上线,不仅引入了新的注意力机制——DeepSeek Sparse Attention。还开源了更高效的TileLang版本GPU算子!
查看全文