來源:雪球App,作者: 三少爺炒股養(yǎng)家,(https://xueqiu.com/9414675356/318496930)
幻方量化旗下ai大模型低成本挑戰(zhàn)GPT-4o,下周算力板塊可能下跌,注意風險最近,國產AI大模型DeepSeek-V3版本正式發(fā)布,其性能相當強悍,已經和海外領軍的閉源模型GPT-4o不分伯仲了。報道稱,DeepSeek-V3在Aider多語言測試排行榜中,以48.4分排名第二,僅次于OpenAI o1的61分。而在LiveBench的測評中,DeepSeek v3是最強的開源大語言模型,并在非推理模型中,排名第二。
DeepSeek-V3不僅性能匹敵 Openai最先進的GPT-4o,更厲害的是,DeepSeek-V3的訓練成本僅556萬美元 。
最重要的是它不僅便宜,而且完全開源,僅需2000張GPU計算卡,兩個月的訓練時間就匹敵了美國頂級科技公司花費數(shù)百倍成本的最先進AI大模型 。
更令人震驚的是,如此厲害的大模型,竟然不是互聯(lián)網科技巨頭研發(fā)的,而是來自金融領域的頭部量化——幻方量化。值得一提的是,幻方量化曾是中國首家突破千億私募的量化大廠。
所以,這里的問題就是,用更少的的差的GPU和更少的時間就能訓練出比Llama3更好的大模型,然后推倒出一個結論,是不是就不需要卷算力了?