|
- 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现上更加友好的量化方法对于训练稳定性的影响会有多大。
- 有必要自己将deepseek部署到本地吗? - 知乎
顺带教大家如何在10分钟内零基础地完全本地化部署DeepSeek-R1模型。 1 为什么要自己部署DeepSeek? 最近DeepSeek非常火爆! 它不仅能撰写文案和进行研究,还能联网实时回答问题,堪称智能助理界的“小钢炮”! 不过,官网常常出现以下问题: 1 高峰期排队让人
- 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决?
1)DeepSeek官网 网址: chat deepseek com 直接上官网或者下载官方APP是最靠谱的用法了。 记得用的时候一定要把"深度思考 (R1)"这个模式打开,不然就跑的是V3模型。 虽然就差一个版本,但这两个模型的差距可不是一般的大。 不过官网最近白天几乎处于持续崩溃的
- 使用Deepseek需要付费的吗? - 知乎
2、阿里云百炼新人可领取百万token3: bailian console aliyun com 此外,DeepSeek还为企业提供定制化的解决方案,这类服务通常需要根据具体需求协商价格。 所以,普通用户可以免费使用 DeepSeek Chat 的基础功能,而更高级的 API 服务和企业解决方案则需要付费。
- 国内目前使用的AI智能问答软件,豆包、通义千问、元宝、kimi、deepseek,哪个好用? - 知乎
DeepSeek的搜索是比较拉胯的,搜索生态没有建设好,也没有针对性的深度微调。 DeepSeek的改写能力比豆包要好一点,豆包的语言能力还是要比DeepSeek和Gemini Flash要薄脆一点。 Qwen和Kimi现在主要是Coding方面做得不错,在Chatbot优化方面,现在还是豆包和DeepSeek做得更好。
- DeepSeek深度思考和联网搜索有什么区别? - 知乎
DeepSeek为大家提供了:深度思考R1和联网搜索,两个功能强悍的按钮,但,在和知乎网友的交流过程中,我发现有很多人,不知道这两个强悍的工具如何搭配使用。今天就好好聊聊这个问题。 深度思考模式详解 深度思考模式就像是一个“超级大脑”,当你遇到复杂问题时,它会帮你仔细分析、多角度
- DeepSeek-V3. 2-Exp版本更新,有哪些信息值得关注? - 知乎
DeepSeek V3 2,可以说是算法同学最想要、最符合直觉的top 2048 token的sparse attention了,然而,经历过这场适配才能知道,背后有多少infra的坑要踩。 太不容易了,三个时区的同学连轴转一个多礼拜,在DeepSeek提供了很多帮助的情况下,才把hopper kernel集成完了。
- 如何评价DeepSeek和豆包的回复能力、准确度和学术水平?
DeepSeek: 优势:结构化输出能力强(如分步骤解题、论文大纲生成),支持Markdown代码块和公式排版,适合技术文档撰写。 局限:娱乐性交互相对生硬,对网络流行语的响应较少。 2 准确度 豆包:
|
|
|