8 個(gè)問(wèn)題和答案帶你全方位了解DeepSeek

資訊頻道 - 觀(guān)點(diǎn)·話(huà)題 來(lái)源:數(shù)字生命卡茲克 作者:dayue 2025-02-11

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

這兩天,DeepSeek-R1 火的飛起,在中日美三個(gè) Appstore 榜上登頂。

還直接干崩英偉達(dá),盤(pán)前先死 13 個(gè)點(diǎn),連帶著臺(tái)積電一起。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

幾乎一夜之間,所有人都在關(guān)注 DeepSeek,甚至我在老家,完全沒(méi)用過(guò) AI 的七大姑八大姨,都在問(wèn)我,DeepSeek 是什么,怎么用。

還有一些人體驗(yàn)了一下后,拿著 8.11 和 8.9 誰(shuí)大誰(shuí)小的截圖跟我說(shuō),這玩意也不行啊。

感覺(jué)市面上,關(guān)于 DeepSeek 的信息還是很亂。

所以,今天我想用 8 個(gè)問(wèn)題和答案,來(lái)讓大家詳細(xì)的了解,DeepSeek-R1 這個(gè)模型,是什么,以及,提示詞應(yīng)該怎么寫(xiě),到底怎么用。

話(huà)不多說(shuō),開(kāi)始。

一、DeepSeek 是什么?


DeepSeek,是一家在 2023 年 7 月 17 日成立的公司深度求索所開(kāi)發(fā)的大模型名稱(chēng)。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

2024 年 1 月 5 日,他們正式發(fā)布 DeepSeek LLM,這是深度求索第一個(gè)發(fā)布的 AI 大模型。

2024 年 5 月 7 日,他們發(fā)布 DeepSeek-V2,正式打響中國(guó)大模型價(jià)格戰(zhàn),當(dāng)時(shí)新發(fā)布的 DeepSeek-V2 的 API 價(jià)格只有 GPT-4o 的 2.7%,隨后一周時(shí)間,國(guó)產(chǎn)廠(chǎng)商全部跟進(jìn),字節(jié)、阿里、百度、騰訊全部降價(jià)。

2024 年 12 月 26 日,DeepSeek-V3 正式發(fā)布且直接開(kāi)源,而且訓(xùn)練成本僅為 557.6 萬(wàn)美元,剔除掉 Meta、OpenAI 等大廠(chǎng)的前期探索成本,大概是別人的三分之一,并且整體模型評(píng)測(cè)能力媲美閉源模型,震驚海外,自此,東方的神秘力量徹底坐實(shí)。

2025 年 1 月 20 日,全新的推理模型 DeepSeek-R1 發(fā)布,同樣發(fā)布并開(kāi)源,效果媲美 OpenAI o1,同時(shí) API 價(jià)格僅為 OpenAI o1 的 3.7%,再一次震驚海外,讓 Meta 連夜成立四個(gè)研究小組,讓全球算力暴跌,英偉達(dá)的神話(huà)都岌岌可危。

就是這么一家公司,而深度求索的背后,是著名量化私募幻方基金,而基金的盈利模式非常簡(jiǎn)單,跟管理規(guī)模綁定,固定收取管理規(guī)模的管理費(fèi)和收益部分的提成資金,無(wú)論基金漲跌都能賺錢(qián),真正的旱澇保收的行業(yè)。

所以,幻方不缺錢(qián),當(dāng)年賺了錢(qián),在英偉達(dá)還沒(méi)向中國(guó)禁售的時(shí)候,幻方直接能掏錢(qián)搭一個(gè)萬(wàn)卡 A100 集群。

這也讓深度求索,讓 DeepSeek,不以盈利為導(dǎo)向,目標(biāo),就是 AI 的星辰大海。

二、DeepSeek-R1 是什么?


DeepSeek-R1,就是最近爆火的主角了。

也是直接讓各路美國(guó) AI 大佬破防的始作俑者。

給奧特曼都在 X 上開(kāi)始陰陽(yáng)了。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

很多人拿 DeepSeek-R1 和 GPT4o 比,其實(shí)是不對(duì)的。

首先,GPT4o 是個(gè)多模態(tài)通用模型,可以理解圖片、語(yǔ)音、視頻,也可以輸出語(yǔ)音。多模態(tài)往后做,更像 Gemini 2,是一個(gè)多模態(tài)大一統(tǒng)模型,可以理解一切模態(tài),也可以輸出一切模態(tài)。

而 DeepSeek-R1 是一個(gè)深度推理模型,對(duì)標(biāo) OpenAI 的應(yīng)該是 OpenAI o1,而不是 GPT4o,關(guān)于 OpenAI o1 曾經(jīng)我首發(fā)寫(xiě)過(guò)一篇文章,可以去看,就不過(guò)多贅述了:OpenAI 全新發(fā)布 o1 模型 - 我們正式邁入了下一個(gè)時(shí)代。

現(xiàn)在回頭看,當(dāng)時(shí)這個(gè)副標(biāo)題,還是很有前瞻性的。

我也讓 DeepSeek 列個(gè)了 4o 和 o1 的對(duì)比表格,大家應(yīng)該也能一目了然。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

而 R1,可以直接類(lèi)比 o1,兩者在跑分上,幾乎相同。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

并且已經(jīng)開(kāi)源。

HuggingFace 鏈接: https://huggingface.co/deepseek-ai

論文鏈接: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

三、DeepSeek-R1 在哪用?


DeepSeek-R1 除了面向開(kāi)發(fā)者的開(kāi)源模型和 API,也有面向普通用戶(hù)的 C 端版本。

網(wǎng)頁(yè)版: https://chat.deepseek.com/

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

當(dāng)你勾上深度思考功能,此時(shí)就是使用 R1 模型,當(dāng)你不勾的時(shí)候,使用的是類(lèi) GPT4o 的 v3 模型。

當(dāng)然他們也有 APP 版本,你直接在應(yīng)用商店搜索 DeepSeek 就好。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

跟網(wǎng)頁(yè)端交互基本一致。目前免費(fèi),就是用戶(hù)增速過(guò)快,所以偶爾會(huì)有崩潰斷網(wǎng)連不上問(wèn)題,你可以在這個(gè)地方,來(lái)看 DeepSeek 的服務(wù)器狀態(tài)。

網(wǎng)址:https://status.deepseek.com/

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

四、應(yīng)該怎么跟 R1 對(duì)話(huà)?


首先,我想明確一點(diǎn)的是,DeepSeek-R1 是推理模型,不是通用模型。

在幾個(gè)月前 OpenAI o1 剛剛發(fā)布時(shí),我用通用模型的方式跟 o1 對(duì)話(huà),寫(xiě)了一堆的結(jié)構(gòu)化提示詞,得到了極差的效果,那時(shí)候我一度覺(jué)得這玩意是個(gè)垃圾。

而后面,我才發(fā)現(xiàn),其實(shí)是我自己的思維慣性,這玩意跟 4o 不一樣,這不是一個(gè)很傻的聊天模型。

這是一個(gè)能力很牛逼但不知道你想要什么的真實(shí)員工。

今年 1 月也有一篇海外的文章很火,叫《o1 isn’t a chat model (and that’s the point)》。

跟我是完全一樣的看法。

所以,有一個(gè)點(diǎn)一定要注意,明確你的目標(biāo),而不是給模型任務(wù)。

例如我們以前在寫(xiě) prompt 的時(shí)候,總是會(huì)寫(xiě)你是一個(gè) XXX,現(xiàn)在我的任務(wù)是 XXX,你要按照 1、2、3 步來(lái)給我執(zhí)行 balabala。

但是現(xiàn)在,請(qǐng)拋棄那些寫(xiě)法。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

把你的一切,交給 AI,讓它去進(jìn)行自我推理,效果會(huì)更好。AI 會(huì)自動(dòng)填上那些你沒(méi)說(shuō)出口的話(huà),會(huì)給你想出可能更好的解決方案。

有一個(gè)不得不承認(rèn)的事實(shí)是,我是一個(gè)很普通的普通人,而像我一樣的很多普通人們,現(xiàn)在大概率是不如 AI 博學(xué)和聰明的。

所以,不如說(shuō)出你的目標(biāo),把他當(dāng)作一個(gè)很牛逼的員工,讓他,放手去做。
比如這個(gè) case。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

只需要表達(dá)你是誰(shuí)+你的目標(biāo)就 OK。

特別是你是誰(shuí)這個(gè)背景信息,非常非常的有用。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

所以請(qǐng)拋棄掉一起過(guò)往所學(xué)習(xí)的結(jié)構(gòu)化框架,如果真的需要有一個(gè)萬(wàn)能 Prompt 模板,那就是:

你是誰(shuí) + 背景信息 + 你的目標(biāo)

背景信息給的越多越能讓 R1 理解你的需求幫助你更好的完成任務(wù)。

時(shí)刻把他當(dāng)成:

這是一個(gè)能力很牛逼但不知道你想要什么的員工。

最牛逼的提示詞技巧,就是沒(méi)有技巧。

大道至簡(jiǎn),重劍無(wú)鋒。

所以,千言萬(wàn)語(yǔ)匯聚成一句話(huà)就是:用人話(huà)清晰的表達(dá)出你的需求,這就夠了。

五、R1 輸出的內(nèi)容看不懂?


很多人在用“說(shuō)人話(huà)”這三個(gè)字,來(lái)表達(dá)推理模型和通用模型不一樣,這其實(shí)有點(diǎn)奇怪。

不過(guò)從實(shí)用角度來(lái)說(shuō),這確實(shí)是一個(gè)能讓普通人看懂 AI 輸出專(zhuān)業(yè)內(nèi)容的小技巧。

不過(guò)這并不是一個(gè)推理模型才有的技巧,因?yàn)橐恢本痛嬖,本質(zhì)上就是對(duì)方不知道你是誰(shuí),不知道你的理解能力和你的學(xué)識(shí)能力是什么水平。

所以我也想分享一個(gè)我自己這兩年跟 AI 對(duì)話(huà)時(shí)用的最多的一個(gè)小技巧,也是我自己最常用的“人話(huà)”prompt:

我是一個(gè)小學(xué)生。

當(dāng)你在跟 AI 對(duì)話(huà)時(shí),把這句話(huà)往前一擺,自降身位,你就會(huì)發(fā)現(xiàn),一切都通了,一切都能看的懂了。

比如我想讓 R1 給我解釋一下什么叫大模型中的 RL 用法。

如果不用這句話(huà)的話(huà),就會(huì)得到這樣的解釋。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

我相信你看到一定腦殼疼。你就是不懂才需要讓它給你解釋?zhuān)Y(jié)果解釋了個(gè)這。

但是,如果把那個(gè)神句加上呢?

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

反正我是一下子能看了,舒服了多了,可能我就真的是個(gè)小學(xué)生的水平。。。

當(dāng)然如果你想稍微進(jìn)階一點(diǎn),就可以說(shuō),我是一個(gè)初中生,或者,我是一個(gè)高中生,一點(diǎn)一點(diǎn)的可控升級(jí)。

我用了兩年,非常好用,推薦給大家。

六、R1 的寫(xiě)作很強(qiáng)嗎?


R1 除了能非常好的做常規(guī)推理模型都能做的數(shù)學(xué)題、代碼等等,這次有一個(gè)非常非常特別的點(diǎn)是:

中文寫(xiě)作能力強(qiáng)到爆炸。

過(guò)往,大家都說(shuō),在寫(xiě)作能力上幾乎所有的大模型都是眾生平等的一坨屎,唯有 Claude 超出了一坨之外,獨(dú)立于三界之上。

而這一次,DeepSeek-R1 在中文寫(xiě)作和文筆上,已經(jīng)是獨(dú)一檔的領(lǐng)先了。

而且對(duì)于文風(fēng)的模擬,效果極佳。

比如我非常非常喜歡知乎上一個(gè)大 V 叫大師兄朱炫的文筆。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

我甚至都不需要跟 DeepSeek-R1 說(shuō)朱炫的文筆是什么樣的,直接就說(shuō)一句話(huà):

以知乎大 V 朱炫的文風(fēng),來(lái)銳評(píng)一下愛(ài)情的求而不得,告訴大家,總會(huì)有人在等你。

來(lái)給大家看看成文:

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

雖然達(dá)不到朱炫那百分百的功力,達(dá)不到他那種多智而近妖的文筆,但是已經(jīng)非常非常強(qiáng)了。

畢竟,只需要一句話(huà)而已。

再寫(xiě)一首,李煜風(fēng)格的詩(shī)詞。

“以李煜的詩(shī)詞風(fēng)格,來(lái)寫(xiě)一首我回老家沒(méi)有朋友玩的感覺(jué)”

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

《虞美人·歸鄉(xiāng)感懷》

故園舊巷行人少,空有榆錢(qián)老。

秋千院落鎖蒼苔,偶見(jiàn)鄰家黃犬過(guò)階來(lái)。

重游往日嬉春處,蛛網(wǎng)斜陽(yáng)駐。

笑談聲遠(yuǎn)柳風(fēng)涼,唯剩一庭明月照空廊。

對(duì)仗、押韻全都到位了。

真的,非常的強(qiáng)。

七、R1 可以聯(lián)網(wǎng)嗎?


眾人皆知推理模型好,但是推理模型,幾乎都不聯(lián)網(wǎng)。

典型如 OpenAI o1。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

這給我?guī)?lái)了非常的多的困擾,要知道,OpenAI o1 的知識(shí)庫(kù)還是 24 年,很多東西都不知道,更別提一些所謂的實(shí)事了,你想用它來(lái)梳理分析一些最近的數(shù)據(jù),比如美元指數(shù)、比如最近的財(cái)報(bào)等等,它完全不知道,甚至還傳不了 PDF,就非常的 der 比。

而 DeepSeek,是為數(shù)不多的,推理+聯(lián)網(wǎng)的。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

我們來(lái)試試這句話(huà):我想用魯迅的文風(fēng)寫(xiě)一篇 2000 字的公眾號(hào)文章,分析一下 2025 春節(jié)檔哪幾部電影能爆,不要結(jié)構(gòu)化。

DeepSeek 去網(wǎng)上搜了 50 個(gè)網(wǎng)頁(yè),然后思考了半天。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

用魯迅的文風(fēng),成了一篇文。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

效果非常好。

雖然整體測(cè)下來(lái),在聯(lián)網(wǎng)資料的 RAG 層面還有一些問(wèn)題和不盡如意,但是已經(jīng)非常強(qiáng)了,至少,能聽(tīng)懂我的話(huà),知道我想要的是魯迅風(fēng)格。

再給一些時(shí)間。

八、算力神話(huà)崩盤(pán)了嗎?


最后,我想說(shuō)一下算力的問(wèn)題。

昨天,A 股算力和美股算力都崩了,大家?guī)缀醵及言驓w結(jié)到 DeepSeek 很便宜,所以未來(lái)不需要那么多算力,算力神話(huà)崩塌了。

但是我覺(jué)得這個(gè)思路不太對(duì)。

在第一次工業(yè)革命的時(shí)候,有一個(gè)經(jīng)濟(jì)學(xué)里面非常著名的悖論,是由威廉·斯坦利·杰文斯提出來(lái)的,叫做 Jevons 悖論。

當(dāng)時(shí),英國(guó)的工業(yè)革命正在加速發(fā)展,蒸汽機(jī)的效率也在不斷提高。人們普遍認(rèn)為,蒸汽機(jī)會(huì)越來(lái)越節(jié)能,也越來(lái)越會(huì)減少煤炭消耗。
但實(shí)際情況卻打了所有人的臉。

因?yàn),更高效的蒸汽機(jī)降低了使用煤炭的成本,結(jié)果導(dǎo)致蒸汽機(jī)被更廣泛應(yīng)用,煤炭消耗總量反而大幅增加。

原因大概是這樣的:

假設(shè)新技術(shù)讓汽車(chē)的燃油效率提高了 50%(比如每加侖能跑 30 公里變成 45 公里)。照理來(lái)說(shuō),這應(yīng)該減少燃油總消耗,但現(xiàn)實(shí)可能是:

由于油耗更低,開(kāi)車(chē)的成本下降,人們更愿意開(kāi)車(chē),開(kāi)車(chē)?yán)锍淘黾印?/span>

購(gòu)車(chē)門(mén)檻降低,更多人買(mǎi)車(chē)。

物流成本下降,商家擴(kuò)大運(yùn)輸量。

最終,油耗效率提高后,燃油消耗的總量可能不降反升。

跟現(xiàn)在算力邏輯是一摸一樣,如果你要把 DeepSeek 對(duì)與算力的影響帶入的話(huà),那其實(shí)就會(huì)導(dǎo)致:

因?yàn)榇竽P托枰挠?xùn)練和推理算力成本下降,反而會(huì)推動(dòng) AI 應(yīng)用和生態(tài)的繁榮,端側(cè)、個(gè)人級(jí)別大模型逐漸成熟,算力的總需求反而越來(lái)越大。

至于股市算力崩盤(pán),我想說(shuō)的是,漲多了就是原罪。

而且美元指數(shù)都崩成什么樣了,直接破了 60 日均線(xiàn),納斯達(dá)克和英偉達(dá)不崩才奇怪好吧。

重磅好文!8個(gè)章節(jié)帶你全方位了解DeepSeek

只能說(shuō),DeepSeek 有短期驅(qū)動(dòng)效應(yīng),但是核心還是內(nèi)身問(wèn)題,DeepSeek 踩中了這個(gè)節(jié)點(diǎn),天時(shí)地利人和。

此刻的 DeepSeek,就是眾望所歸的,天命人。

寫(xiě)在最后


昨天,馮驥的微博說(shuō),DeepSeek 是國(guó)運(yùn)。

我想說(shuō),是,也不是。

國(guó)運(yùn)不是單一的點(diǎn),而是一群點(diǎn)而連成的面。

流浪地球、新能源車(chē)、黑神話(huà)悟空、六代機(jī)、TikTok、DeepSeek 等等等等。

這些點(diǎn)連起來(lái)的面,才是真正的國(guó)運(yùn)。

泱泱中華五千年。

無(wú)論多少風(fēng)雨。

未來(lái)也必定。

國(guó)運(yùn)昌隆。


作者的微信公眾號(hào):數(shù)字生命卡茲克

聲明:站內(nèi)網(wǎng)友所發(fā)表的所有內(nèi)容及言論僅代表其本人,并不反映任何網(wǎng)站意見(jiàn)及觀(guān)點(diǎn)。

全部評(píng)論

暫無(wú)相關(guān)推薦