What Is Theater

About 141,000,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
现在这些大模型，哪个在代码编写上表现的最好呀 ...
数据都不太一样，当然清华大学的是2024年11月的榜deepseek还是2.5的版本，但整体的数据还是相差不少。不过也能说明一个问题就是现阶段全球比较顶尖的AI模型中在编程能力方面比较 …
reddit.com
https://www.reddit.com › DeepSeek
DeepSeek - Reddit
Subreddit for the DeepSeek Coder Language Model
zhihu.com
https://www.zhihu.com › question
求问deepseek出现这种情况怎么办啊？ - 知乎
Jan 31, 2025 · DeepSeek 不是告诉你原因和解法了嘛。原因：当前对话已超出深度思考的最大长度限制解法：开启一个新对话继续思考吧至于具体解释，得看这几个参数，DeepSeek R1 的 …
zhihu.com
https://www.zhihu.com › question
有必要自己将deepseek部署到本地吗？ - 知乎
所以我认为，deepseek部署有可行性就够了，至于有没有必要性，很多人没那么重要。大家听到openai训练ai需要几千亿美元，让ai推理需要十块H100 (一块280万人民币)，部署满 …
zhihu.com
https://www.zhihu.com › question
DeepSeek深度思考和联网搜索有什么区别？ - 知乎
Feb 5, 2025 · DeepSeek为大家提供了：深度思考R1和联网搜索，两个功能强悍的按钮，但，在和知乎网友的交流过程中，我发现有很多人，不知道这两个强悍的工具如何搭配使用。今天就好 …
zhihu.com
https://www.zhihu.com › question
deepseek和chatgpt有什么区别？哪个更好用？ - 知乎
deepseek怎么样？DeepSeek是中式思维，Chatgpt则拥有典型的西方文化偏向； DeepSeek先进是低推理成本，Chatgpt先进是语言能力。从研究两者的训练数据等方面，我们可以知道： …
zhihu.com
https://www.zhihu.com › question
普通人怎样用好Deepseek? - 知乎
DeepSeek-R1则专门是为了代码生成+数学问题解决而设计，整体速度极快，精确度实测后非常高，推理能力一流。适合需要快速实现技术需求的场景，比如程序员、理工科学生等。
zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 的 DeepSeek-V3 模型？ - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性，论文中并没有给出对应的FP8矩阵乘法的算子效率。另外，论文中缺乏per-token加per-channel量化的讨论，不清楚 …
zhihu.com
https://www.zhihu.com › question
怎么分辨在用的deepseek是不是满血版啊？ - 知乎
大家好，我是吾鳴。现在很多的互联网大厂都开始接入DeepSeek-R1大模型了，每个公司都宣称自己接入的是DeepSeek-R1满血模型，那究竟怎么区分到底是不是满血模型呢？
zhihu.com
https://www.zhihu.com › question
都说接入的DeepSeek是满血版，为什么感觉还是官方的好 ...
都说接入的DeepSeek是满血版，为什么感觉还是官方的好用？接入DeepSeek的腾讯元宝，纳米，秘塔都说是满血版，但是同一个问题，我感觉解答总是不如官网细致合理，上下文联系也差 …

Pagination
- 1
- 2
- 3
- Next