
英國倫敦帝國學院、美國網際網路檔案館同史丹佛大學嘅最新聯合研究,喺4月底發表嘅報告《AI生成文本對互聯網嘅影響》,揭示咗一個驚人事實:由2022年ChatGPT推出之後,到2025年中為止,新發佈嘅網站當中,高達大約35%係AI生成或者AI輔助嘅內容。呢個數字由原本接近零,急升到三分一,顯示AI已經大幅改變咗網絡生態,內容真實性正面臨嚴重侵蝕。
研究團隊利用美國網際網路檔案館嘅Wayback Machine,抽取咗2022年8月到2025年5月之間超過120萬個網頁樣本,運用AI文本檢測工具Pangram v3進行分類。結果顯示,呢啲新網站內容唔單止數量多,而且風格同人類創作有明顯分別。AI生成嘅文本普遍呈現「過度積極」嘅不自然開朗風格,好多時候會用上「革命性」、「改變遊戲規則」或者「令人興奮」等誇張形容詞,比例高達78%,相比人類創作只有32%。此外,AI文本結構重複、句子較短,經常採用列表式寫作,語氣變得更加正面同相似,令人擔心網絡內容會逐漸失去多樣性同深度。
研究員指出,呢個現象同「ChatGPT以後」各種AI工具嘅普及有密切關係,包括Perplexity AI同Gemini 2.0等,佢哋API成本低廉,仲有大量插件支援WordPress同Joomla等平台,令到部落格、電子商務描述同行銷頁面最容易被AI「入侵」。帝國學院倫敦分校研究員Jonáš Doležal就喺接受訪問時表示:「我覺得AI接管網絡嘅速度真係令人震驚。」史丹佛大學研究員Maty Bohacek亦補充,團隊正同網際網路檔案館合作,將呢個檢測變成持續工具,方便日後實時監測AI內容增長。
雖然用戶資料提到研究分析咗2025年10月至2026年3月嘅網頁,並指18%網站完全由AI生成、17%部分由AI生成,但最新權威報告顯示,實際數據覆蓋期係2022至2025年5月,35%係針對新發佈網站嘅整體比例,而非現有全部網站嘅三分一。報告亦無提及特定Amy Chen博士作為主要作者,但強調AI內容主要集中喺低流量嘅新站,高流量新聞媒體同學術期刊仍然以人類創作為主,比例約65%。呢個修正反映咗研究最新事實,避免過時描述誤導公眾。
呢項發現即時引發全球對網絡真實性嘅關注。研究員警告,AI內容氾濫唔單止令網絡變得「過度正面」,更可能削弱事實準確性同語義多樣性,雖然目前未有強烈證據顯示AI會大幅降低內容準確度,但長遠來講,假新聞、行銷欺詐同資訊污染風險會大幅增加。尤其喺電子商務同新聞聚合網站,AI生成嘅描述同摘要已經成為常態,用戶難以分辨真偽。研究團隊呼籲,業界必須加速開發更好嘅檢測工具,例如瀏覽器外掛或者AI水印技術,幫助普通網民同平台即時識別AI內容。
英美大學呢個聯合研究,靈感來自「死互聯網理論」,即係質疑網絡越來越多係機器人同AI互相對話,而非真人互動。從2022年ChatGPT推出開始,AI工具已經令內容創作門檻大減,唔少小型網站同企業為咗慳成本,紛紛轉用AI生成文章同產品描述。結果就係網絡環境變得更加「開朗」但同時更加單調,句子風格趨向一致,缺乏人類嘅細膩情感同獨特視角。研究亦發現,AI輔助內容雖然唔一定全部虚假,但佢嘅重複性同正面偏見,已經開始影響整體網絡生態,令人擔心未來搜索結果同社交媒體會充斥類似嘅「AI味」內容。