畢業(yè)論文寫完那天,王子依進行第一次AIGC率(人工智能生成內(nèi)容比例,以下簡稱AI率)檢測。結果給了她重重一擊:論文被系統(tǒng)判定70%為AI生成。


過去兩年,湖北大學、福州大學、中國人民大學、中國傳媒大學等多所高校將畢業(yè)論文的AI率納入畢業(yè)答辯流程,并設置比率紅線。


但許多學生發(fā)現(xiàn),AI率檢測結果并不穩(wěn)定:不同平臺差別大,有時甚至相互矛盾。寫得越規(guī)范、用詞越準確,AI率反而越高。有人引用公式、法條、經(jīng)典文章被判“AI生成”,有人連致謝也被標紅。


一邊是學生想盡辦法“降AI率”“向AI證明自己不是AI”才能參與答辯。模糊的判定標準下,還催生出一條隱秘的灰色產(chǎn)業(yè)鏈。


另一邊是教師在教學中如何感知和把握AI“介入”。查還是不查、用還是不用、在哪個階段使用算“作弊”?這些問題沒有統(tǒng)一答案。


這一學術監(jiān)管難題,正在困擾全球教育系統(tǒng)。AI率檢測似乎在幫助識別“人”與“機器”的邊界,但已有不少教師開始反思,當論文寫作正好落入AI最擅長的范圍時,當前的考核,是否已經(jīng)悖離了教育的初衷?


即將畢業(yè)的大學生們在拍照留念。圖源ic

降AI率,比寫論文還難?


直到答辯前一周,王子依仍深陷AI率的困擾。


她就讀于小學教育專業(yè),畢業(yè)論文研究主題是“小學游戲化教學”。早在實習期間,她便完成問卷發(fā)放和數(shù)據(jù)收集的工作,原以為只需打磨內(nèi)容、順利答辯即可畢業(yè)。


今年年初學校發(fā)布新規(guī),論文除查重外,還需接受知網(wǎng)“AI率”檢測,并由個人在答辯前提交檢測報告。檢測結果原則上不得超過40%,若超出可能被認定為學術不端,將可能給予重寫或延畢。


王子依坦言自己在數(shù)據(jù)分析部分使用過AI工具,進行樣本獨立性檢驗。但她發(fā)現(xiàn),AI檢測報告標出的多是一些格式規(guī)范,“其一”“其二”等分點闡述和名詞解釋被大面積標記,甚至連致謝中引用的一句歌詞也未能幸免。


王子依嘗試修改被標記的句子,但AI率始終在50%上下徘徊。她在社交媒體上發(fā)帖求助,很快涌來上百條評論。王子依注意到,最近一個月,常常會在凌晨兩三點收到新的評論和收藏。


有學生稱自己的論文在不同平臺的AI率相差懸殊,免費網(wǎng)站查詢60%,付費網(wǎng)站查詢只有10%;有學生引用的古詩詞被標注;有學生越改AI率越高;還有學生稱自己將論文里的句號全部改成逗號,AI率降低了20%。


評論區(qū)里還有很多降AI率攻略。使用翻譯軟件,將中文內(nèi)容轉(zhuǎn)譯為其他語種后再譯回,結果語句生硬、邏輯錯亂,連作者自己都讀不下去。有人說可以添加“啊”“呢”“哦”之類的語氣詞。


甚至“魔法對轟”——“用AI降AI率”。王子依采用了這種方法,論文中原本結構清晰的教學設計,被轉(zhuǎn)化成了口語化的“老師說什么、學生怎么回應”的對話體,她說,讀起來像是一本兒童繪本。


新京報記者在評論區(qū)看到,也有學生質(zhì)疑,“憑什么讓AI定義我是不是AI”。來自一所高校首飾設計專業(yè)的趙霖有同樣的疑惑,她的論文是作品說明的一部分,但學校規(guī)定AI率必須低于10%。她原本用AI幫忙潤色語句,系統(tǒng)判定90%的內(nèi)容是AI生成。


“我們是先做出作品,再寫出想法,AI只是順了順語言。”她說,結果系統(tǒng)只看“像不像AI寫的”,卻完全無視思考過程。在她眼中,“抄襲”和“使用AI潤色”是兩回事。前者意味著沒有貢獻,后者則是一種輔助。但在AI率檢測面前,這兩者往往被同等對待。


在一遍一遍的修改和檢測后,王子依覺得自己的論文“千瘡百孔”,而她自己也像個被檢測結果支配的AI。老師建議她先專注于內(nèi)容,不必過分糾結檢測。但她擔心影響答辯,只能不斷刪減被標紅的段落。


早在2024年6月,華東師范大學與北京師范大學聯(lián)合推出《生成式人工智能學生使用指南》,要求確保AI生成內(nèi)容不超過全文的20%;天津科技大學2024年的要求是AIGC檢測不得超過40%;福州大學要求學生答辯前、答辯后進行兩次AIGC檢測,檢測結果將作為成績評定和優(yōu)秀畢業(yè)論文評選的參考依據(jù)。今年以來,又有多所高校加入檢測隊伍。


許多學生開始緊盯每一次檢測后的“數(shù)字”。多位學生表示,他們真正擔憂的,是在一個模糊的系統(tǒng)面前,要想盡辦法通過檢測數(shù)字上的“達標”,才能獲得參加答辯的資格。


王子依社交平臺上收藏的降AI率的“攻略”。 受訪者供圖

“像不像AI”誰說了算?


經(jīng)過大半個月的努力,王子依提交了知網(wǎng)檢測AI率為20%的檢測報告。但她卻始終搞不懂AI率到底是怎么計算出來的。


北京航空航天大學法學院教授、數(shù)字正義研究中心執(zhí)行主任裴煒分析,目前多數(shù)AI率檢測系統(tǒng)是基于“語言預測”:通過分析大量AI生成文本,歸納出AI的語言習慣,比如一個詞組后面通常會跟著哪些詞等。再將其與學生論文進行比對,如果發(fā)現(xiàn)與AI生成文本的特征高度相似,就可能判定某段文字為“AI生成”。


然而,人類本來也會使用規(guī)范、重復的表達,尤其在學術寫作、技術報告等規(guī)范性文本中。“AI生成”不是“AI原創(chuàng)”,而是AI基于人類創(chuàng)作的語料,模仿人類思考表達模式的產(chǎn)物?!皳Q句話說,沒有AI,人也可能做出類似的語詞聯(lián)系和表達”。


裴煒提到,當前AI率的判斷技術本身存在不確定性。她試用過一些AI檢測工具,發(fā)現(xiàn)“容易誤傷”,直接使用和認定有可能錯判學生的真實勞動成果。


另外,不同檢測網(wǎng)站的原始數(shù)據(jù)庫不同,也會造成檢測結果的不同。一位人工智能方向的從業(yè)人員向新京報記者解釋,由于大模型的算法內(nèi)部機制和決策過程是黑箱式的,無法解釋為什么這段話被判斷為AI生成,只能給出一個結果,比如“AIGC率為73%”。


此前Open AI也在2023年1月發(fā)布一款AI文本檢測工具“AI Classifier”,旨在確定文本是不是人工智能生成的,但由于準確率只有26%,于當年7月宣布停止。


而即便是人類的語言學專家,也很難分辨二者區(qū)別。


2023年,美國南佛羅里達大學的一項研究,邀請語言學專家區(qū)分AI生成的文字內(nèi)容和人類寫的內(nèi)容,72名專家的正確率為39%。


新京報記者也注意到,多個檢測網(wǎng)站都標注了“免責說明”。“AI生成可能性及被標注的文本,僅表示具有AI生成文本的部分特征,并不確定為AI生成,結果僅供參考?!薄坝捎贏I模型的差異性,檢測結果可能存在誤差?!边€有“AI特征值與論文質(zhì)量無關,檢測結果僅供參考”。


盡管AIGC檢測的原理和準確性是模糊的,但學生們的焦慮很真實。


新京報記者在多個社交平臺上發(fā)現(xiàn)“代降AI率”的廣告,有的是利用AI網(wǎng)站降重,購買相應的字數(shù),就能自動生成;也有提供人工降重服務,聲稱“一對一修改、改到滿意”。價格從幾十元到幾百元不等,常按字數(shù)或目標AI率定價。


記者詢問了幾位“降AI率”服務博主,對方稱一篇1萬字、AI率45%的論文,花80元可以降到個位數(shù),方法是“純?nèi)斯ふ{(diào)整”。另一位按照修改的字數(shù)收費,千字10元。


另外,新京報記者看到,有檢測平臺一邊提供檢測AI率,一邊銷售“降AI率”服務。一家網(wǎng)站智能降AIGC的價格為每千字3-5元,自動改寫AIGC疑似度高的片段;人工降重則需要添加客服微信,根據(jù)論文題目、檢測結果、字數(shù)以及降到多少進行報價。


新京報記者在一個免費進行AI率檢測的網(wǎng)站上看到,有付費進行降AI率的服務。圖源:網(wǎng)絡截圖

“我不再是寫作者,而是信息傳送帶”


在教學實踐的另一端,無需檢測,不少老師也能從論文中察覺出“AI味兒”。


表述奇怪、“不合年級水平”的表現(xiàn)、虛構的參考文獻等——這些線索逐漸構成他們判斷學生是否使用AI的依據(jù)。


陜西一所高校的會計專業(yè)教師彭玉發(fā)現(xiàn),今年有人交上來的初稿結構還算完整、字數(shù)達標,但語言干巴,財務數(shù)據(jù)分析簡單又籠統(tǒng)?!坝悬c兒像在很大的數(shù)據(jù)庫里搜點兒東西拼湊出來?!?/p>


她本擔心誤判,結果學生回復“好的”,答應重寫。她意識到學生也心虛了。她還記得一個學生的致謝里,每個句子都是句號,對方也坦承“整頁都是AI寫的”。


類似的直覺也出現(xiàn)在小語種教學中。一位北京高校的小語種老師嚴遠提到,自己所在的學校尚未啟動AI率檢測機制,但今年答辯時,他明顯感受到,部分學生論文中展現(xiàn)出“與其學習階段不匹配”的知識儲備和表達水準。


他提到,AI對翻譯類作業(yè)的影響尤其顯著。學生提交的外譯中文本中,充滿排比、隱喻和修辭性的陌生表達。而中譯外的文本,又過于流暢和自然。


西南財經(jīng)大學社會發(fā)展研究院副教授陳晶環(huán)的“警覺期”更早。2022年底Chat GPT問世幾個月后,她就注意到學生作業(yè)在質(zhì)量上的明顯躍升。


她最初還欣喜,后來卻發(fā)現(xiàn)許多作業(yè)盡管使用了大量專業(yè)術語和書面表達,但句與句之間缺乏邏輯遞進、語言空洞,甚至彼此相似。她感嘆,如今看到不太流暢的句子,反而高興,覺得是學生自己寫的。她坦言,“老師也很矛盾?!?/p>


對于AI率檢測,老師們態(tài)度不一。


彭玉所在學校今年首次設立AIGC率檢測機制,規(guī)定學生論文中AI生成內(nèi)容不得超過35%,檢測費用每人最多可報銷200元。她認為這項制度“至少能震懾一批人”。


裴煒則認為,即便是目前廣泛使用的“重復率”,也在學位論文評價中存在缺陷。在法學專業(yè)中,很多術語和法律表達是固定的,如果為了“降重”而扭曲表達,反而有損論述的準確性和嚴謹性。相較于重復率,AI率的情況更為復雜,在現(xiàn)有技術和評價標準尚不成熟的情況下,直接予以適用可能制造更大的不公與誤傷。


同時她認為人機協(xié)作的界限非常模糊,如何衡量一個學生在寫作中投入了多少“自己的智力”?從簡單輸入一個標題就生成一整篇論文,到給出完整的研究問題、思路框架,再讓AI完成擴展,或是讓AI協(xié)助潤色和修改文本,這之間很難用一個“率”去界定。


嚴遠提到要警惕新的技術官僚主義。學生們用AI寫論文、用AI查AI率,再用AI降AI率,變成了考察大家誰更會使用AI,變成教育者和被教育者之間的斗智斗勇。


陳晶環(huán)看到有被AI率誤傷的大學生,“防守和進攻都靠AI,誰也沒能真正走出AI的圈子?!彼ㄗh是否可以建立一個溝通解釋機制。讓學生可以提供一些初稿、改動痕跡等內(nèi)容,而不是強硬地根據(jù)檢測數(shù)字決定是否能參與答辯。


而在學業(yè)之外,AI對學生思維習慣的重塑更讓部分教師警惕。


陳晶環(huán)將其稱為“習得性求助”?!斑@是一種有問題第一反應就不再是自己思考,而是立刻去找AI?!边@種習得性求助意味著學生主動思考的過程被跳過了:“我不再是寫作者,而是信息傳送帶?!?/p>


她感受到,工具的過度使用不僅帶來了思維能力的弱化,更削弱了學生的閱讀力、耐心和表達欲望?!坝袑W生甚至連AI給出的內(nèi)容都不愿讀完,只覺得前兩句差不多,就直接復制進論文?!?/p>


而大學階段最核心的成長,就在于是否形成了自主思考的習慣和能力。在她看來,這種被工具牽引和主導、逐漸失去主動權的過程,就是“異化”。


知網(wǎng)個人AIGC檢測服務頁面的常見問題解答中提到,AI特征值與論文質(zhì)量無關,檢測結果僅供參考,可能存在誤差。圖源:網(wǎng)絡截圖

AI無法替代人類對現(xiàn)實的感知與回應


夜里十一點,彭玉的微信又響起,是學生發(fā)來修改完的論文。


這樣的情況她早已習慣。大四不少學生已在實習單位報到,重心不在學術上,而是如何盡快完成學業(yè)、順利畢業(yè)。論文修改是他們在下班后,或者擠出周末的時間趕工出來的。在就業(yè)壓力與工具便利的雙重作用下,論文變成一項需要完成的“任務”。


本科畢業(yè)論文最初的設想,是訓練學生的科研能力與培養(yǎng)探索精神,也就是“能不能提出一個研究問題,并進行系統(tǒng)性的分析”。


但陳晶環(huán)指出,在實踐中,這個目標不斷被“降維處理”?!拔覀円呀?jīng)不苛求本科生做出理論創(chuàng)新了,重點要求學生要有最基本的學術規(guī)范,只要他能用學術語言、說得通、講得順,就算合格。”


而表述結構清晰、語言規(guī)范、格式統(tǒng)一,這恰恰是AI最擅長模仿的領域。


嚴遠直言,在如今的技術面前,傳統(tǒng)的作業(yè)或者考核已經(jīng)失去意義,像一場師生間的互相欺騙,“裝作AI不存在?!?/p>


換句話說,目前高校的教育考核方式,已經(jīng)難以適應人工智能等新工具的廣泛使用。更有老師直言,這相當于用農(nóng)業(yè)社會的考法,應對智能社會的工具。


裴煒認為不可能在AI技術高速發(fā)展的同時,又禁止學生使用。相反地,在未來社會,學生的數(shù)字能力、智能能力將是其核心競爭力。因此問題的關鍵不在于學生使用AI去應對考評,而在于AI時代教育理念、教育方式和人才評價機制需要與時俱進。


陳晶環(huán)認為,技術的變化正要求教育做出結構性調(diào)整——改變考核方式、更新評價指標、重塑教學目標?!斑@是教育的責任,而不是學生的負擔?!?/p>


比起限制或一味禁止AI使用,多位教師提到,重點是在教育中正視工具的存在,并引導學生在使用中保持思維的主動權。嚴遠注意到,一些學生通過AI輔助,能夠更便捷地查閱多語種資料、了解語法細節(jié),尤其是在教師未能覆蓋到的地方,AI反而起到了“補課”作用。


面對這種趨勢,老師們正主動調(diào)整,布置無法被AI完成的作業(yè),或者讓AI只能起到輔助作用。


陳晶環(huán)將課程論文寫作改成口頭匯報對某本社會學著作的理解,并且不使用PPT脫稿講解,這樣學生就必須在理解的基礎上,用自己的語言表達。她還讓學生書寫個人生活史。這種非結構化、貼近生活的寫作,迫使學生自己動手,無法靠AI代勞。在研究生課程上,她則鼓勵學生有意識地探索AI的可能性。


嚴遠嘗試讓學生翻譯文本并配音。學生可以用AI翻譯,但必須親自配音。在小語種學習中,口頭轉(zhuǎn)述比筆頭兒更能檢驗學習質(zhì)量。


此外,嚴遠在講授生態(tài)環(huán)保等復雜議題時,課堂時間限制沒辦法拓展。他鼓勵學生用AI梳理背景知識,再在課堂上討論AI給出的觀點。這種方式不僅拓寬了學生的視野,還激發(fā)了多元思考?!安煌瑢W使用AI,有時會提出意料之外的觀點,這反而讓討論更深入和多元?!?/p>


在裴煒看來,技術帶來的變化是每一代人都要面對的。從更長遠的尺度看,當AI更加深入地介入學術研究,學術誠信的邊界如何劃分,在文章中如何提及AI的貢獻,AI能否列為論文作者,乃至如何定義學術誠信、合作、學術剽竊,可能都需要教育界和學術界一起慢慢探索。


采訪中,陳晶環(huán)提到去大涼山做田野調(diào)查的故事。她長期關注彝族地區(qū)的農(nóng)村基層治理,涉及當?shù)靥赜械奈幕瘋鹘y(tǒng)。這些信息只有通過實地田野調(diào)查才能積累起來,如果把時間線拉長到十年的追蹤,觀察政策如何影響一個具體村莊的變遷,這種深度和系統(tǒng)性AI無法做到。


“AI等待被人類喂養(yǎng)?!彼J為,AI再強大,也無法替代人類對現(xiàn)實的感知與回應,這恰恰是最不該放棄的能力。


(應受訪者要求,文中嚴遠、王子依、趙霖、彭玉為化名)


新京報記者 李聰

編輯 陳曉舒

校對 趙琳