當論文寫作正好落入AI最擅長的范圍時，當前的高?？己耸欠褚呀?jīng)悖離了教育的初衷？

畢業(yè)論文寫完那天，王子依進行第一次AIGC率（人工智能生成內(nèi)容比例，以下簡稱AI率）檢測。結果給了她重重一擊：論文被系統(tǒng)判定70%為AI生成。

過去兩年，湖北大學、福州大學、中國人民大學、中國傳媒大學等多所高校將畢業(yè)論文的AI率納入畢業(yè)答辯流程，并設置比率紅線。

但許多學生發(fā)現(xiàn)，AI率檢測結果并不穩(wěn)定：不同平臺差別大，有時甚至相互矛盾。寫得越規(guī)范、用詞越準確，AI率反而越高。有人引用公式、法條、經(jīng)典文章被判“AI生成”，有人連致謝也被標紅。

一邊是學生想盡辦法“降AI率”“向AI證明自己不是AI”才能參與答辯。模糊的判定標準下，還催生出一條隱秘的灰色產(chǎn)業(yè)鏈。

另一邊是教師在教學中如何感知和把握AI“介入”。查還是不查、用還是不用、在哪個階段使用算“作弊”？這些問題沒有統(tǒng)一答案。

這一學術監(jiān)管難題，正在困擾全球教育系統(tǒng)。AI率檢測似乎在幫助識別“人”與“機器”的邊界，但已有不少教師開始反思，當論文寫作正好落入AI最擅長的范圍時，當前的考核，是否已經(jīng)悖離了教育的初衷？

即將畢業(yè)的大學生們在拍照留念。圖源ic

降AI率，比寫論文還難？

直到答辯前一周，王子依仍深陷AI率的困擾。

她就讀于小學教育專業(yè)，畢業(yè)論文研究主題是“小學游戲化教學”。早在實習期間，她便完成問卷發(fā)放和數(shù)據(jù)收集的工作，原以為只需打磨內(nèi)容、順利答辯即可畢業(yè)。

今年年初學校發(fā)布新規(guī)，論文除查重外，還需接受知網(wǎng)“AI率”檢測，并由個人在答辯前提交檢測報告。檢測結果原則上不得超過40%，若超出可能被認定為學術不端，將可能給予重寫或延畢。

王子依坦言自己在數(shù)據(jù)分析部分使用過AI工具，進行樣本獨立性檢驗。但她發(fā)現(xiàn)，AI檢測報告標出的多是一些格式規(guī)范，“其一”“其二”等分點闡述和名詞解釋被大面積標記，甚至連致謝中引用的一句歌詞也未能幸免。

王子依嘗試修改被標記的句子，但AI率始終在50%上下徘徊。她在社交媒體上發(fā)帖求助，很快涌來上百條評論。王子依注意到，最近一個月，常常會在凌晨兩三點收到新的評論和收藏。

有學生稱自己的論文在不同平臺的AI率相差懸殊，免費網(wǎng)站查詢60%，付費網(wǎng)站查詢只有10%；有學生引用的古詩詞被標注；有學生越改AI率越高；還有學生稱自己將論文里的句號全部改成逗號，AI率降低了20%。

評論區(qū)里還有很多降AI率攻略。使用翻譯軟件，將中文內(nèi)容轉(zhuǎn)譯為其他語種后再譯回，結果語句生硬、邏輯錯亂，連作者自己都讀不下去。有人說可以添加“啊”“呢”“哦”之類的語氣詞。

甚至“魔法對轟”——“用AI降AI率”。王子依采用了這種方法，論文中原本結構清晰的教學設計，被轉(zhuǎn)化成了口語化的“老師說什么、學生怎么回應”的對話體，她說，讀起來像是一本兒童繪本。

新京報記者在評論區(qū)看到，也有學生質(zhì)疑，“憑什么讓AI定義我是不是AI”。來自一所高校首飾設計專業(yè)的趙霖有同樣的疑惑，她的論文是作品說明的一部分，但學校規(guī)定AI率必須低于10%。她原本用AI幫忙潤色語句，系統(tǒng)判定90%的內(nèi)容是AI生成。

“我們是先做出作品，再寫出想法，AI只是順了順語言。”她說，結果系統(tǒng)只看“像不像AI寫的”，卻完全無視思考過程。在她眼中，“抄襲”和“使用AI潤色”是兩回事。前者意味著沒有貢獻，后者則是一種輔助。但在AI率檢測面前，這兩者往往被同等對待。

在一遍一遍的修改和檢測后，王子依覺得自己的論文“千瘡百孔”，而她自己也像個被檢測結果支配的AI。老師建議她先專注于內(nèi)容，不必過分糾結檢測。但她擔心影響答辯，只能不斷刪減被標紅的段落。

早在2024年6月，華東師范大學與北京師范大學聯(lián)合推出《生成式人工智能學生使用指南》，要求確保AI生成內(nèi)容不超過全文的20%；天津科技大學2024年的要求是AIGC檢測不得超過40%；福州大學要求學生答辯前、答辯后進行兩次AIGC檢測，檢測結果將作為成績評定和優(yōu)秀畢業(yè)論文評選的參考依據(jù)。今年以來，又有多所高校加入檢測隊伍。

許多學生開始緊盯每一次檢測后的“數(shù)字”。多位學生表示，他們真正擔憂的，是在一個模糊的系統(tǒng)面前，要想盡辦法通過檢測數(shù)字上的“達標”，才能獲得參加答辯的資格。

王子依社交平臺上收藏的降AI率的“攻略”。受訪者供圖

“像不像AI”誰說了算？

經(jīng)過大半個月的努力，王子依提交了知網(wǎng)檢測AI率為20%的檢測報告。但她卻始終搞不懂AI率到底是怎么計算出來的。

北京航空航天大學法學院教授、數(shù)字正義研究中心執(zhí)行主任裴煒分析，目前多數(shù)AI率檢測系統(tǒng)是基于“語言預測”：通過分析大量AI生成文本，歸納出AI的語言習慣，比如一個詞組后面通常會跟著哪些詞等。再將其與學生論文進行比對，如果發(fā)現(xiàn)與AI生成文本的特征高度相似，就可能判定某段文字為“AI生成”。

然而，人類本來也會使用規(guī)范、重復的表達，尤其在學術寫作、技術報告等規(guī)范性文本中。“AI生成”不是“AI原創(chuàng)”，而是AI基于人類創(chuàng)作的語料，模仿人類思考表達模式的產(chǎn)物?！皳Q句話說，沒有AI，人也可能做出類似的語詞聯(lián)系和表達”。

裴煒提到，當前AI率的判斷技術本身存在不確定性。她試用過一些AI檢測工具，發(fā)現(xiàn)“容易誤傷”，直接使用和認定有可能錯判學生的真實勞動成果。

另外，不同檢測網(wǎng)站的原始數(shù)據(jù)庫不同，也會造成檢測結果的不同。一位人工智能方向的從業(yè)人員向新京報記者解釋，由于大模型的算法內(nèi)部機制和決策過程是黑箱式的，無法解釋為什么這段話被判斷為AI生成，只能給出一個結果，比如“AIGC率為73%”。

此前Open AI也在2023年1月發(fā)布一款AI文本檢測工具“AI Classifier”，旨在確定文本是不是人工智能生成的，但由于準確率只有26%，于當年7月宣布停止。

而即便是人類的語言學專家，也很難分辨二者區(qū)別。

2023年，美國南佛羅里達大學的一項研究，邀請語言學專家區(qū)分AI生成的文字內(nèi)容和人類寫的內(nèi)容，72名專家的正確率為39%。

新京報記者也注意到，多個檢測網(wǎng)站都標注了“免責說明”。“AI生成可能性及被標注的文本，僅表示具有AI生成文本的部分特征，并不確定為AI生成，結果僅供參考?！薄坝捎贏I模型的差異性，檢測結果可能存在誤差?！边€有“AI特征值與論文質(zhì)量無關，檢測結果僅供參考”。

盡管AIGC檢測的原理和準確性是模糊的，但學生們的焦慮很真實。

新京報記者在多個社交平臺上發(fā)現(xiàn)“代降AI率”的廣告，有的是利用AI網(wǎng)站降重，購買相應的字數(shù)，就能自動生成；也有提供人工降重服務，聲稱“一對一修改、改到滿意”。價格從幾十元到幾百元不等，常按字數(shù)或目標AI率定價。

記者詢問了幾位“降AI率”服務博主，對方稱一篇1萬字、AI率45%的論文，花80元可以降到個位數(shù)，方法是“純?nèi)斯ふ{(diào)整”。另一位按照修改的字數(shù)收費，千字10元。

另外，新京報記者看到，有檢測平臺一邊提供檢測AI率，一邊銷售“降AI率”服務。一家網(wǎng)站智能降AIGC的價格為每千字3-5元，自動改寫AIGC疑似度高的片段；人工降重則需要添加客服微信，根據(jù)論文題目、檢測結果、字數(shù)以及降到多少進行報價。

新京報記者在一個免費進行AI率檢測的網(wǎng)站上看到，有付費進行降AI率的服務。圖源：網(wǎng)絡截圖

“我不再是寫作者，而是信息傳送帶”

在教學實踐的另一端，無需檢測，不少老師也能從論文中察覺出“AI味兒”。

表述奇怪、“不合年級水平”的表現(xiàn)、虛構的參考文獻等——這些線索逐漸構成他們判斷學生是否使用AI的依據(jù)。

陜西一所高校的會計專業(yè)教師彭玉發(fā)現(xiàn)，今年有人交上來的初稿結構還算完整、字數(shù)達標，但語言干巴，財務數(shù)據(jù)分析簡單又籠統(tǒng)?！坝悬c兒像在很大的數(shù)據(jù)庫里搜點兒東西拼湊出來?！?/p>

她本擔心誤判，結果學生回復“好的”，答應重寫。她意識到學生也心虛了。她還記得一個學生的致謝里，每個句子都是句號，對方也坦承“整頁都是AI寫的”。

類似的直覺也出現(xiàn)在小語種教學中。一位北京高校的小語種老師嚴遠提到，自己所在的學校尚未啟動AI率檢測機制，但今年答辯時，他明顯感受到，部分學生論文中展現(xiàn)出“與其學習階段不匹配”的知識儲備和表達水準。

他提到，AI對翻譯類作業(yè)的影響尤其顯著。學生提交的外譯中文本中，充滿排比、隱喻和修辭性的陌生表達。而中譯外的文本，又過于流暢和自然。

西南財經(jīng)大學社會發(fā)展研究院副教授陳晶環(huán)的“警覺期”更早。2022年底Chat GPT問世幾個月后，她就注意到學生作業(yè)在質(zhì)量上的明顯躍升。

她最初還欣喜，后來卻發(fā)現(xiàn)許多作業(yè)盡管使用了大量專業(yè)術語和書面表達，但句與句之間缺乏邏輯遞進、語言空洞，甚至彼此相似。她感嘆，如今看到不太流暢的句子，反而高興，覺得是學生自己寫的。她坦言，“老師也很矛盾?！?/p>

對于AI率檢測，老師們態(tài)度不一。

彭玉所在學校今年首次設立AIGC率檢測機制，規(guī)定學生論文中AI生成內(nèi)容不得超過35%，檢測費用每人最多可報銷200元。她認為這項制度“至少能震懾一批人”。

裴煒則認為，即便是目前廣泛使用的“重復率”，也在學位論文評價中存在缺陷。在法學專業(yè)中，很多術語和法律表達是固定的，如果為了“降重”而扭曲表達，反而有損論述的準確性和嚴謹性。相較于重復率，AI率的情況更為復雜，在現(xiàn)有技術和評價標準尚不成熟的情況下，直接予以適用可能制造更大的不公與誤傷。

同時她認為人機協(xié)作的界限非常模糊，如何衡量一個學生在寫作中投入了多少“自己的智力”？從簡單輸入一個標題就生成一整篇論文，到給出完整的研究問題、思路框架，再讓AI完成擴展，或是讓AI協(xié)助潤色和修改文本，這之間很難用一個“率”去界定。

嚴遠提到要警惕新的技術官僚主義。學生們用AI寫論文、用AI查AI率，再用AI降AI率，變成了考察大家誰更會使用AI，變成教育者和被教育者之間的斗智斗勇。

陳晶環(huán)看到有被AI率誤傷的大學生，“防守和進攻都靠AI，誰也沒能真正走出AI的圈子?！彼ㄗh是否可以建立一個溝通解釋機制。讓學生可以提供一些初稿、改動痕跡等內(nèi)容，而不是強硬地根據(jù)檢測數(shù)字決定是否能參與答辯。

而在學業(yè)之外，AI對學生思維習慣的重塑更讓部分教師警惕。

陳晶環(huán)將其稱為“習得性求助”?！斑@是一種有問題第一反應就不再是自己思考，而是立刻去找AI?！边@種習得性求助意味著學生主動思考的過程被跳過了：“我不再是寫作者，而是信息傳送帶?！?/p>

她感受到，工具的過度使用不僅帶來了思維能力的弱化，更削弱了學生的閱讀力、耐心和表達欲望?！坝袑W生甚至連AI給出的內(nèi)容都不愿讀完，只覺得前兩句差不多，就直接復制進論文?！?/p>

而大學階段最核心的成長，就在于是否形成了自主思考的習慣和能力。在她看來，這種被工具牽引和主導、逐漸失去主動權的過程，就是“異化”。

知網(wǎng)個人AIGC檢測服務頁面的常見問題解答中提到，AI特征值與論文質(zhì)量無關，檢測結果僅供參考，可能存在誤差。圖源：網(wǎng)絡截圖

AI無法替代人類對現(xiàn)實的感知與回應

夜里十一點，彭玉的微信又響起，是學生發(fā)來修改完的論文。

這樣的情況她早已習慣。大四不少學生已在實習單位報到，重心不在學術上，而是如何盡快完成學業(yè)、順利畢業(yè)。論文修改是他們在下班后，或者擠出周末的時間趕工出來的。在就業(yè)壓力與工具便利的雙重作用下，論文變成一項需要完成的“任務”。

本科畢業(yè)論文最初的設想，是訓練學生的科研能力與培養(yǎng)探索精神，也就是“能不能提出一個研究問題，并進行系統(tǒng)性的分析”。

但陳晶環(huán)指出，在實踐中，這個目標不斷被“降維處理”?！拔覀円呀?jīng)不苛求本科生做出理論創(chuàng)新了，重點要求學生要有最基本的學術規(guī)范，只要他能用學術語言、說得通、講得順，就算合格。”

而表述結構清晰、語言規(guī)范、格式統(tǒng)一，這恰恰是AI最擅長模仿的領域。

嚴遠直言，在如今的技術面前，傳統(tǒng)的作業(yè)或者考核已經(jīng)失去意義，像一場師生間的互相欺騙，“裝作AI不存在?！?/p>

換句話說，目前高校的教育考核方式，已經(jīng)難以適應人工智能等新工具的廣泛使用。更有老師直言，這相當于用農(nóng)業(yè)社會的考法，應對智能社會的工具。

裴煒認為不可能在AI技術高速發(fā)展的同時，又禁止學生使用。相反地，在未來社會，學生的數(shù)字能力、智能能力將是其核心競爭力。因此問題的關鍵不在于學生使用AI去應對考評，而在于AI時代教育理念、教育方式和人才評價機制需要與時俱進。

陳晶環(huán)認為，技術的變化正要求教育做出結構性調(diào)整——改變考核方式、更新評價指標、重塑教學目標?！斑@是教育的責任，而不是學生的負擔?！?/p>

比起限制或一味禁止AI使用，多位教師提到，重點是在教育中正視工具的存在，并引導學生在使用中保持思維的主動權。嚴遠注意到，一些學生通過AI輔助，能夠更便捷地查閱多語種資料、了解語法細節(jié)，尤其是在教師未能覆蓋到的地方，AI反而起到了“補課”作用。

面對這種趨勢，老師們正主動調(diào)整，布置無法被AI完成的作業(yè)，或者讓AI只能起到輔助作用。

陳晶環(huán)將課程論文寫作改成口頭匯報對某本社會學著作的理解，并且不使用PPT脫稿講解，這樣學生就必須在理解的基礎上，用自己的語言表達。她還讓學生書寫個人生活史。這種非結構化、貼近生活的寫作，迫使學生自己動手，無法靠AI代勞。在研究生課程上，她則鼓勵學生有意識地探索AI的可能性。

嚴遠嘗試讓學生翻譯文本并配音。學生可以用AI翻譯，但必須親自配音。在小語種學習中，口頭轉(zhuǎn)述比筆頭兒更能檢驗學習質(zhì)量。

此外，嚴遠在講授生態(tài)環(huán)保等復雜議題時，課堂時間限制沒辦法拓展。他鼓勵學生用AI梳理背景知識，再在課堂上討論AI給出的觀點。這種方式不僅拓寬了學生的視野，還激發(fā)了多元思考?！安煌瑢W使用AI，有時會提出意料之外的觀點，這反而讓討論更深入和多元?！?/p>

在裴煒看來，技術帶來的變化是每一代人都要面對的。從更長遠的尺度看，當AI更加深入地介入學術研究，學術誠信的邊界如何劃分，在文章中如何提及AI的貢獻，AI能否列為論文作者，乃至如何定義學術誠信、合作、學術剽竊，可能都需要教育界和學術界一起慢慢探索。

采訪中，陳晶環(huán)提到去大涼山做田野調(diào)查的故事。她長期關注彝族地區(qū)的農(nóng)村基層治理，涉及當?shù)靥赜械奈幕瘋鹘y(tǒng)。這些信息只有通過實地田野調(diào)查才能積累起來，如果把時間線拉長到十年的追蹤，觀察政策如何影響一個具體村莊的變遷，這種深度和系統(tǒng)性AI無法做到。

“AI等待被人類喂養(yǎng)?！彼J為，AI再強大，也無法替代人類對現(xiàn)實的感知與回應，這恰恰是最不該放棄的能力。

（應受訪者要求，文中嚴遠、王子依、趙霖、彭玉為化名）

新京報記者李聰

編輯陳曉舒

校對趙琳

202 +1

微博

微信

我要評論

張陸 6天前
AI用多了，腦子容易秀逗。

更多評論請在客戶端查看>

直播

直播中

西北政法大學刑事辯護論壇：如何應對趨利性執(zhí)法
1886人參與

當畢業(yè)論文遇到AI“審判”

我要評論

相關推薦

新聞8點見丨LABUBU為何全球爆火；當畢業(yè)論文遇到AI“審判”

直播

熱點

最新

熱議

當畢業(yè)論文遇到AI“審判”

我要評論

相關推薦

新聞8點見丨LABUBU為何全球爆火；當畢業(yè)論文遇到AI“審判”

直播

熱點

最新

熱議

新聞8點見丨LABUBU為何全球爆火；當畢業(yè)論文遇到AI“審判”