1周前
深度学习十年不变的老零件,终于被中国团队换掉了
2015年何恺明提出的残差连接,通过让信息跳过中间层直接传递,解决了深度神经网络的梯度消失问题,此后成为AI模型的标配。2025年DeepSeek团队推出mHC(流形约束超连接),成功突破了这个沿用十年的架构。mHC将单通道升级为多通道设计,并引入双随机矩阵约束,确保信号在不同通道间公平分配,避免了超连接中信号失控的问题。实验显示,60层叠加后信号放大倍数从3000倍降至1.6倍。通过合并操作等工程优化,DeepSeek解决了多通道带来的内存访问量激增问题,为深度学习架构创新提供了新方向。
1周前
免费提供沉浸式翻译 ai 模型
沉浸式翻译是一款免费浏览器插件,支持Chrome/Edge/Safari等主流浏览器。其核心功能是双语对照翻译网页,将译文直接显示在原文下方,方便对照阅读和学习。插件集成了DeepL、ChatGPT、Claude、Google Gemini等顶级AI翻译引擎,用户可自由选择或对比使用。支持网页、PDF文档、电子书、YouTube视频字幕等多种场景翻译,保持原格式不变。文章提供了免费的腾讯开源翻译模型配置方案,包括API地址、Key和模型信息,让用户无需付费即可体验高质量的AI翻译服务。