香港新聞連線

英美聯合研究三成網站已受AI污染　網路內容真假難分

英國倫敦帝國學院、美國網際網路檔案館同史丹佛大學嘅最新聯合研究，喺4月底發表嘅報告《AI生成文本對互聯網嘅影響》，揭示咗一個驚人事實：由2022年ChatGPT推出之後，到2025年中為止，新發佈嘅網站當中，高達大約35%係AI生成或者AI輔助嘅內容。呢個數字由原本接近零，急升到三分一，顯示AI已經大幅改變咗網絡生態，內容真實性正面臨嚴重侵蝕。

研究團隊利用美國網際網路檔案館嘅Wayback Machine，抽取咗2022年8月到2025年5月之間超過120萬個網頁樣本，運用AI文本檢測工具Pangram v3進行分類。結果顯示，呢啲新網站內容唔單止數量多，而且風格同人類創作有明顯分別。AI生成嘅文本普遍呈現「過度積極」嘅不自然開朗風格，好多時候會用上「革命性」、「改變遊戲規則」或者「令人興奮」等誇張形容詞，比例高達78%，相比人類創作只有32%。此外，AI文本結構重複、句子較短，經常採用列表式寫作，語氣變得更加正面同相似，令人擔心網絡內容會逐漸失去多樣性同深度。

研究員指出，呢個現象同「ChatGPT以後」各種AI工具嘅普及有密切關係，包括Perplexity AI同Gemini 2.0等，佢哋API成本低廉，仲有大量插件支援WordPress同Joomla等平台，令到部落格、電子商務描述同行銷頁面最容易被AI「入侵」。帝國學院倫敦分校研究員Jonáš Doležal就喺接受訪問時表示：「我覺得AI接管網絡嘅速度真係令人震驚。」史丹佛大學研究員Maty Bohacek亦補充，團隊正同網際網路檔案館合作，將呢個檢測變成持續工具，方便日後實時監測AI內容增長。

雖然用戶資料提到研究分析咗2025年10月至2026年3月嘅網頁，並指18%網站完全由AI生成、17%部分由AI生成，但最新權威報告顯示，實際數據覆蓋期係2022至2025年5月，35%係針對新發佈網站嘅整體比例，而非現有全部網站嘅三分一。報告亦無提及特定Amy Chen博士作為主要作者，但強調AI內容主要集中喺低流量嘅新站，高流量新聞媒體同學術期刊仍然以人類創作為主，比例約65%。呢個修正反映咗研究最新事實，避免過時描述誤導公眾。

呢項發現即時引發全球對網絡真實性嘅關注。研究員警告，AI內容氾濫唔單止令網絡變得「過度正面」，更可能削弱事實準確性同語義多樣性，雖然目前未有強烈證據顯示AI會大幅降低內容準確度，但長遠來講，假新聞、行銷欺詐同資訊污染風險會大幅增加。尤其喺電子商務同新聞聚合網站，AI生成嘅描述同摘要已經成為常態，用戶難以分辨真偽。研究團隊呼籲，業界必須加速開發更好嘅檢測工具，例如瀏覽器外掛或者AI水印技術，幫助普通網民同平台即時識別AI內容。

英美大學呢個聯合研究，靈感來自「死互聯網理論」，即係質疑網絡越來越多係機器人同AI互相對話，而非真人互動。從2022年ChatGPT推出開始，AI工具已經令內容創作門檻大減，唔少小型網站同企業為咗慳成本，紛紛轉用AI生成文章同產品描述。結果就係網絡環境變得更加「開朗」但同時更加單調，句子風格趨向一致，缺乏人類嘅細膩情感同獨特視角。研究亦發現，AI輔助內容雖然唔一定全部虚假，但佢嘅重複性同正面偏見，已經開始影響整體網絡生態，令人擔心未來搜索結果同社交媒體會充斥類似嘅「AI味」內容。