用AI替寫論文涉嫌學術不端,多校宣佈引入AI檢測服務系統——“AI檢測”能否打敗“AI論文”

前不久,一年一度的江蘇省碩士學位論文抽檢工作再次拉開帷幕。據透露,今年的抽檢將首次探索AI評審路徑,提升論文智評水平。利用生成式AI分析數據、用AI工具輔助文獻綜述……生成式人工智能在給科研帶來一定便利性的同時,也給學術道德和規範造成極大衝擊,不少大學生開始嘗試藉助AI改寫文章,甚至直接代寫論文。爲剎住這場席捲而來的學術不正之風,多校宣佈在論文檢測中引入AIGC檢測服務系統,判斷學生論文是否使用AI寫作。

一些大學生論文AI寫作痕跡明顯

近日,在悉尼大學留學的學生小嚴收到了學術委員會的郵件,被判定論文疑似AI寫作的部分佔比高達75%,將面臨被判定爲學術不端的後果。

記者在調查中發現,如今不少大學生都會嘗試用AI輔助論文寫作。南京大學生周瑞告訴記者,自己正在準備碩士畢業論文開題報告,她偶然在社交平臺發現有人在推薦AI整理文獻綜述,便試了一試,“在網上篩選出文獻後,上傳到AI大模型平臺,向AI下達指令,讓其開始撰寫文獻綜述,不到半分鐘,AI就能完成對文獻的閱讀並生成文獻綜述。”

與其他同學一樣,周瑞也嘗試過用AI寫論文,但很快她就發現,AI寫出來的論文具有明顯的“非人類寫作”特徵。比如,AI常常使用大量的首先、其次、最後等表示順序的連接詞,且句式較爲單一,表達較爲機械,缺乏人類語言的多樣性和靈活性。“其實老師能看出來文章是否是AI寫的,而且AI寫的論文較爲死板,不可能拿到高分。”

用AI代替人類寫論文,導致部分大學生對AI過於依賴,降低了思考能力和學術水平。周瑞告訴記者,已經有不少課程教師明令禁止使用AI替寫論文,違者將取消作業成績。

AI寫論文也讓一些商家看到可乘之機,將學術變成“生意”,助長了學術不端之風。記者在某網絡購物平臺檢索發現,有上百家提供AI寫作的服務商,其中一家熱銷店鋪顯示“24小時內97人已買”,而在評論區,也有不少評論反饋“不好用,AI味很重”。

記者聯繫到一家名爲“AI寫作大師”的AI論文寫作服務提供商,對方表示可以提供畢業論文、課程論文、實踐報告等10餘種AI代寫服務,每千字10元,只需要提供論文標題、學歷層次、論文關鍵詞、字數等信息,就可以在20分鐘左右生成範文。記者進一步詢問是否會被檢測出是AI寫作?對方表示,去檢測AIGC率是有概率被檢測出來的,建議可以使用降AIGC率的輔助工具或者自己進行修改,從而降低AIGC率,並且要求消費者能接受機器生成帶來的誤差和侷限性,付款後除非系統生成失敗,否則不接受任何形式退款。

除了生成內容,還有不少大學生使用AI降低論文重複率。近日,南京大學生劉芯在提交課程論文時,發現重複率高達36%,於是便使用某國產大模型“降重”。她對AI發出指令:請將這段話改寫,通過調整語序增減字數,替換同義詞等方式,避免與原文出現連續8個字相同的句子,使這段話更有邏輯,符合論文的規範。“通過一晚上的嘗試,論文重複率降到了15%。”

有專家提醒,由於目前很難判斷AI生成的內容源自何處,是否爲原創,有可能在使用時將虛假信息或是受版權保護的信息摻雜到文中,產生侵犯知識產權的風險。

“寫作神器”還是“偷懶神器”?

記者瞭解到,多數學生使用AI寫論文的原因,是爲了節省時間。爲什麼AI寫作可以這麼快?“這其實與AI寫作系統背後的大數據模型有關。當用戶給出主題詞,AI便會從海量的語料庫採集相關信息,隨後模型會根據用戶需求,推斷出滿足要求的文字。理論上來說,如果語料庫中的信息量足夠大,那麼AI寫出來的文字可以達到真人寫作的效果。”東南大學網絡空間安全學院副教授宋宇波說。

儘管如此,仍然時常有人吐槽AI會“一本正經地胡說八道”。宋宇波認爲,其最主要原因在於,模型的推斷和預測本身並不像人一樣具備思考的能力,而只是基於現有語料庫中的內容重新進行文字組合。“這是目前大模型領域的一個技術缺陷,也被稱爲‘幻象’。換句話說,當用戶所提問的內容與大模型語料庫中的一些內容正好相符,那麼AI寫作生成的內容就會很符合現實;而如果用戶提問的內容與語料庫中的素材不相符,那麼大模型常常會生成一段看上去符合人類表達邏輯的語句,但這些內容很可能是虛假或者錯誤的。”

當AI已經成爲很多大學生的作業幫手時,學校也必須應對AI對教學可能帶來的衝擊。“過去我們在學術寫作的考覈評分中,有50%是針對語言的應用,另外50%針對文章的佈局把控和細節的詳盡程度。”西交利物浦大學語言學院教學副院長夏令表示,由於AI的出現,老師們也針對性地增加了後者的考覈權重。

夏令還發現一個比較有趣的現象,“當學生越來越多使用AI助力時,寫作作業的質量逐漸出現兩極分化的趨勢,強的學生更好了,弱的學生更弱了。”夏令猜測,可能是AI讓平時成績較差的學生有了更多“偷懶”的機會,而成績較好的同學則可以藉助於AI技術更好地提升作業的質量。夏令認爲,人工智能正對教學模式、考覈標準等產生重要影響,“比如我們在嘗試將過去單純的寫作考覈轉變爲項目制考覈,增加紙筆考試、提高口語表達考試的比重等。”

AI確實可以助力很多工作,在日常學習中不可避免地成爲一些學生的“偷懶神器”。夏令說,“AI可以在幾分鐘內快速生成好幾周才能寫出來的文本,一些學生很難不受到誘惑,而且目前傳統的查重檢測方法也無法有效識別,我們在教學上的應對方法非常有限。同時,應該如何評判學生對於AI的使用,學生是否盡到其應盡的努力,目前來看也沒有確切的答案。”

“但是,我們必須提醒學生的是,AI有其先天不足。”夏令以文獻綜述爲例,AI工具所能接觸到的是可以免費訪問的文件,有些收費的文獻庫是搜不到的,這導致文獻綜述的結論往往是不全面且失之偏頗的。夏令表示,做科研,AI只能做到“快速領路”,但每一篇關鍵文獻還是要紮紮實實地閱讀和消化,否則真正的知識會離你越來越遠。

釐清AI寫作邊界遏制學術不端

今年4月26日,十四屆全國人大常委會第九次會議表決通過《中華人民共和國學位法》,將於2025年1月1日起正式施行。學位法第三十七條規定,學位論文或者實踐成果被認定爲存在代寫、剽竊、僞造等學術不端行爲,經學位評定委員會決議,學位授予單位不授予學位或者撤銷學位。有專家分析,AIGC技術可以用於輔助學位論文寫作,但是不能用於代寫。AI寫出的論文並非學生自己撰寫,屬於“代寫”範疇。

在宋宇波看來,適度使用AI技術可以幫助學生快速便捷地尋找答案,並將精力集中在覈心問題的思考上;同時,AI技術還可以對文章進行潤色,使得語句表達更流暢更合理。“然而,一些學生放棄了自我思考,過度依賴AI技術去生成答案,甚至使用AI代寫專業課程所需的論文,這是一種學術不端的行爲。”

宋宇波說,就目前而言,真正想要杜絕AI代寫論文比較難。一般來說,判斷一篇文章是否爲AI代寫的手段主要有兩種,一種是使用AI檢測工具,另一種則依靠人工經驗判斷。“AI檢測工具實際使用下來準確率並不高,且比較容易造成誤判,因此只能作爲輔助。而人工來判斷則費時費力,效率低。”

使用AI檢測工具判斷文章是否爲AI生成,目前已有部分論文重複率檢測軟件開始“試水”。記者瞭解到,多家論文重複率檢測平臺已開通AIGC檢測功能,識別文本是否部分或全部由AI模型生成。但也有用戶反饋,用AI去檢測文章是否爲AI生成難以確保科學性,一些原創的片段也被AI系統認爲是AI寫作而成的,只要是稍顯生硬的文字就可能會被判定爲AI寫作,例如“系統的設計與實現不僅爲銀行帶來了直接的經濟效益,更爲銀行長遠發展策略的制定和執行提供了科學、系統的技術支撐,具有重要的理論價值和廣泛的應用前景”這句話被判定爲疑似AI寫作的概率爲80%,而改爲“系統的設計與實現給銀行帶來了直接的經濟利益的同時,也爲銀行的長遠發展策略的制定與執行提供了科學系統的技術支撐,在理論上具有十分重要的價值,其應用前景十分廣闊”,疑似AI寫作率就降到了0。

不可否認的是,AI創作大模型的精進給高等教育帶來了一定風險。但也有專家認爲,面對技術浪潮,“鴕鳥心態”不可取。與其逃避,不如正視問題,釐清AI論文寫作的邊界,比如可以在文獻綜述等方面適當使用AI提高效率,但在AI代寫論文上嚴加監管。

今年,中國傳媒大學、華北電力大學等高校相繼發佈通知,宣佈將在畢業論文審覈過程中加入對文章使用生成式AI風險情況的檢測。南京工業大學則要求每位學生在畢業論文答辯前原則上均需查重,並將對論文進行AIGC檢測。

宋宇波認爲,之所以一部分學生傾向用AI技術生成答案,甚至代寫論文,其背後的一個重要原因在於這部分學生尚未建立正確的學術道德觀。這也意味着,一方面我們要幫助學生樹立正確的道德觀、價值觀和學術觀,另一方面要建立相應的處罰制度,使得抄襲作假成本提升。“此外,我們還需要進一步完善優化相應的檢測工具,儘可能遏制學術不端現象。”

本文來自中國江蘇網。