◎林修民
人工智慧(AI)近年來成為科技界最火熱的議題,產業界或是投資如果沒有跟上這個議題,彷彿就像類比錄音帶一樣會被淘汰,但隨著議題的火紅,相關的爭議也不斷出現,例如與AI相關的詐騙議題就如雨後春筍一樣的冒出。
AI會不會造假? 例如利用AI製造假的影片,或是利用AI生成假帳號回復假訊息。或是相反的方式造假的AI,例如誇大不實的宣稱AI的功能,藉以在投資獲利? 不管上述哪種都對目前人類的生活造成重大的影響,因為人們會因為AI的進步,陷入一種不知道到底什麼是真的迷惑。
因此、筆者想跟大家推薦一本新書-「AI造假」,英文原名FAKING IT : artificial intelligence in a human world, Toby Walsh/托比、沃爾許著,一卷文化出版。
作者托比、沃爾許是長期專注於人工智慧的學者,大學專注於理論數學與物理,研究所與博士則專攻於人工智慧,最後獲得愛丁堡人工智慧博士,著作等身,本身為澳洲新南威爾斯大學AI講座教授、並為澳大利亞科學院院士。
本書作者為長期浸淫在AI的專業人士,跳開艱澀難懂的演算法公式,以產業角度、白話文的方式說明從過去到現在所有與AI有關的欺騙方式,除了歷史縱深外,也以水平方式檢視所有AI相關欺騙方式在目前的各行各業。
AI既然為高速計算的一種,本身就是計算史的一環,本書最早從人類計算的歷史開始,甚至以電腦史必定會提到的自動下棋機器的騙局。
在18世紀後期曾經出現一個會號稱會自動下棋的機器,名稱為機械式土耳其人。它在1770年首度公開亮相,並曾經在歐洲和美洲巡迴過,也曾經到奧地利王室哈布斯堡表演過,當然、就如讀者猜想的,那是一個不折不扣的騙局,真相是一個真人躲在機器人內。
這世界上永遠不缺騙子
在18世紀的土耳其機器人之後的一世紀,19世紀的1876年又有一個號稱下棋打敗人類的梅菲斯托機器人,只是它的技術進化,不需要真人躲在機器裡面,而是用機電連結,由真人在另一個房間指揮。
時間來到21世紀
計算的演進史從那時的機械運算(類比式分差機)到真空管又到了現在的電晶體世代,計算能力越來越強,運算能力也越來越接近人類大腦,但詐騙沒有減少,反而越來越多,假訊息、假影片,假聲音,科技帶給人類的挑戰越來越大。
除了使用AI來造假外,本書也討論了許多公司,特別是新創公司利用誇大不實的AI產品吸金的故事,在第九章企業造假部分,作者詳細說明了企業曾經用誇大不實的AI產品來向一般的投資大眾吸金,甚至許多部份已經踩到了公司治理的紅線,非常值得投資大眾一讀。
台灣過年最大的AI新聞
2025年農曆過年最大的新聞就是有一個中國公司的AI產品,而其新聞不只在中國國內成為戰狼之光,甚至還引起整個華爾街震撼,輝達的股價最高曾下跌超過10%,所有AI晶片股包括Broadcom(博通),甚至台積電ADR都大跌。
最主要引起華爾街震撼的不是其開發了開源的演算法(因為臉書Meta早就開發出來了),而是其宣稱他只用了2000張H800的晶片,就達到不輸美國任何一個開源AI,甚至某些測試項目還可以超越生成式AI的開創者ChatGPT。
此一產品從過年前2個禮拜筆者就在許多傳統替中國吹捧的媒體中看到,其目的當然不只是要說明其AI軟體效能多好,最後最主要目的無非是要宣揚中國AI已經彎道超車,美國晶片圍堵無用論,歐美日應該趕快放棄目前的晶片政策。
本文是要用檢驗太多過去如上述造假的AI案例一樣,多方思考廠商說詞,避免掉入詐騙的陷阱。
首先,該公司創辦人曾經在2021年接受媒體訪問表示: 在美國還沒有禁止輝達A100進入中國前,就已經預先囤積了一萬張A100。
問題是其目前最強大也是最紅的產品卻只使用當時合規的H800來訓練開發,筆者不禁好奇,輝達的A100當時將近台幣100萬,而A100卡並不具備傳統HDMI或是DISPORT PORT介面不能拿來玩遊戲,而這一萬張總價100億新台幣的資產在開發AI的公司不做事,只是要放在倉庫等新的H100/B200問世來貶值嗎?
事實上,根據SemiAnalysis的估算,光是伺服器成本,DeepSeek就已經花了16億美元,相當台幣500億元,所謂低價低算力達到美國一流AI的標準,恐怕言過其實。
其次,包括OPENAI在內還有網路上許多使用者都已經證明了使用一個新的大型論文,同時放入ChatGPT和該產品,輸出結果居然一模一樣,懷疑該產品使用了ChatGPT或是其他開源產品的蒸餾技術。
所謂的蒸餾技術,就是使用現有已經花費大量訓練資源的模型,例如ChatGPT,來幫忙訓練新的模型。如果換成白話文來說,就是DeepSeek請了類似ChatGPT的老師來教導它如何從大量資料中消化資訊,更白話的例子就是其實DeepSeek是有請一個名校的指導教授發表論文,但其論文卻直接宣稱它是低成本的自學,沒有利用到高成本名校名師的資源。
其實站在巨人的肩膀上不是問題,類似著作權一樣、只要註明合理引用就可以,目前許多與論也是用這理由替該產品解釋。但筆者合理推測,其不願意公開引用註明的原因非不能也而是不願也。
因為如果註明其是站在別人的肩膀上,就會戳破其只要極低硬體運算力就可以追上美國的AI這句話,而、這就是整個產品最關鍵,最引起華爾街震撼的一句話,因為華爾街晶片股大地震的原因是投資人以為中國AI可以靠低算力晶片「獨立」站的跟美國一樣高,而不是站在美國肩膀上比美國高。
現在的詐騙不會全部都是假的,現在幾乎已經進化到除了騙你的錢是假的外,其他都是真的,例如弄一個真的存在網站(介面超像真的),真的名人Line圖片群組…花招真的是五花八門….
平心而論、該產品在AI開源模型有沒有創新貢獻之處? 答案是有。但就跟該產品論文內標榜的強化式學習、混和專家模型(Mixture of Experts/MoE)..一樣,全球研究這些技術有創新的論文多如過江之鯽,光在台灣的全國碩博士論文網搜尋MoE就可以找到很多篇碩博士論文,全球更是數以千計的創新論文在討論這些主題。
既然這些同樣創新的技術論文產品這麼多? 為何只有該產品會引發華爾街大地震? 甚至包含美國總統在內的多國政要都對這發表看法? 答案很簡單,上述那些創新只是煙霧彈,用來掩護最關鍵的一句話: 「只要極低硬體運算力就可以追上美國的AI」。
上述就跟有檢察官打電話跟你說你涉及詐騙,需要你轉帳解除一樣,以前的檢察官口音可能是中國口音,但現在已經進化到台灣口音,連背景聲音都會弄得跟地檢署一樣,不管所有環境背景多真,目的就是要掩護最後要你轉帳的最後目的。
由於目前世界上詐騙橫行,而且詐騙都會隨著科技進步,近幾年科技主題又是圍繞著AI,這本托比、沃爾許著的「AI造假」說明了過去到現在,甚至各種不同AI的造假,非常值得關心科技甚至投資的讀者們一讀,在此推薦。
(作者為科技專欄作家)