【禁闻】专访杜奕瑾:DeepSeek被炒作过头

【新唐人北京时间2025年02月04日讯】中国初创公司DeepSeek声称用600万美元研发出媲美OpenAI的AI模型,一度引发美股暴跌。不过,舆论很快开始反转。多个研究机构发现DeepSeek背后存在诸多问题。我们就此专访了台湾人工智慧实验室(Taiwan AI Labs)创办人杜奕瑾

台湾人工智慧实验室创办人杜奕瑾分析,DeepSeek宣传的特别之处在于:一是在小年夜,二是可以观察到许多讯息操作。

台湾人工智慧实验室创办人杜奕瑾:“我们在看DeepSeek相关的这个讯息里面,第一个就是官媒主导的这个成分是比例是占的非常的高。那再来就是这个网路上,你如果说在微博,或者是在Facebook你都可以看到,很多这种不是属于真正使用者的这个账号,就开始非常的活跃。它并不是真的人,那其实平常也没有什么订户,那它就是用人工智慧的方法去做这个AI的这个短影音,不断地在放大‘美股下跌’的这个消息,‘中美科技竞争中国赢了’这个消息。把一个很简单的这个开源的这个成果,变成一个拉到这种国家层级去做这种科技竞争的这个炒作,那从官媒、从微博、以及从这个网络上面的操作,这个从我们的感觉,就是蛮像以前中国跟俄罗斯在国家主导一些议题上面,它炒作的这种方式。”

有研究机构发现,在1月27日美股暴跌前夕,大量中共网军在美国社交媒体炒作DeepSeek的消息。而杜奕瑾发现,“DeepSeek出世导致美股下跌”是一种因果颠倒的说法。

杜奕瑾:“它有点就是从讯息的导向,造成Pre-Market(盘前交易)的市场的下跌,因为Pre-Market相对来讲是比较好操作的,那在这藉由放大Pre-Market市场的下跌,再去影响到这个正常交易时间的这个市场的这个结果。那正常交易市场的结果,那就可以放大造成美国股票这种大量下跌是因为DeepSeek的推出,这其实有点反因为果。我们看到的是,有很大量的讯息操作造成交易市场的Pre-Market下跌之后,那交易市场的Pre-Market之后大家才去注意到,DeepSeek这个东西是什么东西?然后再去讨论这个东西。而不是去讨论这DeepSeek这个东西,而造成市场的这个下降。”

中共官方如此操作,目的是什么呢?

杜奕瑾:“它藉由这个的操作,那它其实可以展现的就是,其实中国并不需要靠这种最高算力的模型芯片,也可以把模型做得很好,我想展示的是这个讯息。”

不过,情况真是这样吗?开发ChatGPT的美国科技公司OpenAI已经表示,有证据显示DeepSeek可能通过“蒸馏”技术(distillation)接触到了他们的数据,盗用其模型进行开发。

杜奕瑾解释,模型“蒸馏”技术是把大模型的知识提取出来之后,再交给小模型去做训练,本来是业内为了降低成本的常见的做法,但DeepSeek可能利用它来建立自己的竞争模型,这违反了OpenAI 的服务条款。

杜奕瑾:“其实它(DeepSeek)原始码里面就有一段就是写到,它其实是有用到这个OpenAI开放的这个模型蒸馏的这种方式,那我相信其实他们在做资料训练的时候,是有使用OpenAI的模型蒸馏方式去提取很多相关的资料来做训练,那这个可能在OpenAI它原本的这个授权是不允许的,那所以OpenAI就把它(DeepSeek)的这个账号做关闭。”

DeepSeek声称使用更少算力更低成本,性能媲美ChatGPT。杜奕瑾表示,根据过往AI开发的经验,一旦在某一个领域有一个衡量标准出现,中国都会想办法把自己模型的跑分结果调到超过美国模型。他比喻这就像一个“很会考试的模型”。

杜奕瑾:“科技公司在训练这个模型的时候,我们会希望从广泛的知识里面去学到这个技能,那以这个技能再去参加考试,那再从这个考试结果知道,我们训练的结果是怎么样,这是一般的美国的大科技公司大概是这样子来做。那其实中国擅长的就是,当我们知道这些考试题目是什么之后,那我们就是可以依照这些考试题目去,调整模型在它的这个Performance(表现),在它的这个分数上面就可以跑到比较好,那就是训练一个‘非常会考试的’这个模型。但实际上只要离开这个领域,因为它模型相对来讲它的参数没有那么多,没有那么聪明也没有那么有经验,那所以它只要离开这个领域,它的成果就会下降很多,那这个也是非常常见。”

杜奕瑾认为,DeepSeek有一点被炒作过头,国家力量在背后推动,导致很多不是资讯专业的评语加入讨论,让原本简单的科技发展变得很复杂。

编辑/尚燕 采访/易如 后制/陈建铭

相关文章
评论
新版即将上线。评论功能暂时关闭。请见谅!