中新社東西問》唐詩宋詞能否用大數據解讀?(王兆鵬)
演員吟誦李白的《將進酒》。(中新社)
白居易詩作量位居唐代詩人之首,影響力卻沒進入前十;宋詞名篇最多的不是蘇軾、辛棄疾而是周邦彥;綜合影響指數表明,杜甫高於李白、辛棄疾強於蘇軾;張若虛《春江花月夜》、陸游《卜算子•詠梅》在近現代纔開始受矚目……用大數據來顯示和驗證唐詩宋詞,結論超出很多人的想像。
唐詩宋詞是中國文學史上的兩座高峰,但屬於美學範疇的唐詩宋詞能否用大數據解讀?大數據研究唐詩宋詞取得了哪些新發現,又有什麼侷限?四川大學文科講席教授、中國詞學研究會會長王兆鵬近日接受中新社「東西問」獨家專訪,作出深度解讀。
現將訪談實錄摘要如下:
中新社記者:唐詩宋詞是中國文學史上的兩座高峰。從大數據看,唐詩宋詞是否達到空前的高度?分別有什麼特色?
王兆鵬:數據顯示,唐詩宋詞作家、作品量均達到了空前的高峰。目前流傳下來的唐詩超過5萬首,而東漢到隋末近600年的詩歌一共才5000餘首。唐詩比之前的八代詩增加了7倍多,詩人由600餘位增加到3000多家,詩人和詩作都達到了前所未有的量級。
宋詞是中國詞史上第一座高峰,有詞人1497家、詞作21085首。相較唐五代,詞人詞作都增加了10多倍。宋詞用調近900種,在唐五代詞的基礎上增加了700餘種。詞調多,意味着詞體的豐富。唐五代詞人中唯溫庭筠、馮延巳、李璟、李煜有詞集傳世,而宋代則有300多位詞人有詞集流傳。詞人有詞集傳世,意味著作品多、知名度高,社會需求量大。宋詞之所以流傳數量不如唐詩,其中一個重要原因在於宋詞是通過口頭傳唱,相當於現在的流行歌曲。口頭傳唱的作品,好多已失傳。
衡量文學發展,作品數量是一個重要方面,但最關鍵還是要有精品。要說中國歷史上產生偉大詩人、詞人最多的朝代,無疑是唐宋。雖然現有技術還難以準確衡量作品藝術價值的高低,但可以用大數據來衡量作品影響力的大小,分析出哪一首作品最受大衆歡迎。
中新社記者:唐詩宋詞屬於美學的範疇,爲什麼想到用大數據分析唐詩宋詞?
王兆鵬:給文學作品排座次、定甲乙,並不是今天才有的時尚,而是古已有之。最早給詩人區分品第等級的,是南朝梁代的鐘嶸。他在《詩品》中將漢魏以來詩人分爲上中下三品,以評量其優劣。唐代張爲的《詩人主客圖》,把中晚唐的部分詩人分爲主、入室、升堂、及門等級別,也是一種品第批評。
在中國古代文學批評中,還常常見到稱譽某人爲第一、某詩爲第一的。如《宋書•謝靈運傳》說謝靈運「文章之美,與顏延之爲江左第一」。宋人許𫖮《彥周詩話》說「孟浩然、王摩詰詩,自李杜而下,當爲第一」。
不過,古人的詩學批評,無論是分品第,還是排座次,都是基於個人的主觀好惡。由於每個人的審美趣尚不同,所以對同一個人、同一首作品,品評往往不一樣。比如,金人元好問、趙秉文和王若虛都推許東坡詞「起衰振靡,當爲古今第一」,清代潘德輿卻叫板不認同,認爲「推奉太過」。
現代計量歷史學可以用數據衡量歷史,古代文學也屬於大歷史的範疇。既然歷史可以計量,爲什麼文學不能計量?通過大數據,可以找到一個最大公約數,用模型來分析和衡定,得出相對客觀的答案。
中新社記者:您的十大唐詩、宋詞、詩人、詞人排行榜如何得出?從大數據看,唐詩宋詞裡誰的作品最多?作品量多的詩人詞人,是否影響力大、知名度高?
北京故宮博物院藏蘇軾主題書畫特展。(中新社)
王兆鵬:我們依據詩歌在歷代選本中的入選頻次、被歷代詩論家品評的頻次、被後人追和的頻次和當代學者研究的頻次、被網頁著錄及評論的頻次等數據加權計算,確定一首詩的影響力,並將影響力位居前列的視爲名篇。
現在已無法直接考察出在古代李白、杜甫的詩集有多少種、印數有多大,但可以計算杜甫和李白的詩集分別被刊刻了多少種。據此推算,在宋代,杜甫的影響力比李白大得多,有一種說法叫千家注杜,杜詩韓文是所有讀書人的典範。
數據顯示,唐代詩人綜合影響力排名第一的是杜甫,其次爲李白、王維。作品量第一的白居易,影響力排在十名之外。而宋詞影響力位居第一的是辛棄疾,蘇軾、周邦彥分別居第二、第三。
影響力大的詩人,擁有名篇也多。一百首唐詩名篇,杜甫獨佔16首,李白13首,王維和白居易均享12首。在三百首唐詩名篇中,杜甫豪取52首,佔六分之一,李白有38首,王維和白居易共29首。在宋詞百首名篇中,周邦彥奪得15首,辛棄疾獲12首,蘇軾10首,姜夔7首。擴大到三百首宋詞名篇,周邦彥斬獲40首,辛棄疾和蘇軾各佔23首,姜夔11首。宋詩百首名篇,蘇軾一人佔四分之一,比杜甫在唐詩中的名篇擁有率還高。
中新社記者:詩人張若虛以一首《春江花月夜》「孤篇蓋全唐」,但他只有兩首詩流傳下來。對於這樣的詩人,能用大數據分析嗎?未來會可否用大數據分析外國詩歌?
王兆鵬:現在大家熟悉的陳子昂的《登幽州臺歌》,以及張若虛的《春江花月夜》,其影響力是到20世紀之後才逐漸變大。《春江花月夜》在明清並無影響力,直到王闓運贊其「孤篇橫絕,竟爲大家」,聞一多又稱其爲「詩中的詩,頂峰中的頂峰」,纔將這首詩擡到至高無上的地位。
同樣情況還有陸游的《卜算子•詠梅》(驛外斷橋邊)。毛澤東曾用「風雨送春歸,飛雪迎春到」來和陸游這首詞,一代偉人和領袖以自身政治影響力和詩詞地位,提高了這首詞的影響力。柳永《蝶戀花》(佇倚危樓風細細),在明清之前也幾乎沒有什麼影響力,但自從王國維將「衣帶漸寬終不悔,爲伊消得人憔悴」列爲人生三種境界後,這首詞開始被讀者熟知。
杜甫在盛唐時代幾乎是一個無名小卒。李白出名時,杜甫只是一個普通的文藝青年。他和李白的年齡相差11歲,是李白的「迷弟」,所以可以看到很多杜甫懷念李白的詩,但很少看到李白給杜甫的詩。杜甫去世很多年後,元稹爲其寫墓誌銘時發現了他的光芒。後來韓愈在《調張籍》中說「李杜文章在,光焰萬丈長」,文壇領袖的推薦又進一步擴大了杜甫的影響力。
有些詩人、詞人,在外國的影響力可能比在中國高。寒山的詩曾經在美國風行一時,在國內反倒沒多少人瞭解他。在西方,作品被翻譯最多的中國詩人不是李白、杜甫,而是王維;作品被翻譯最多的詞人不是辛棄疾、蘇軾,而是李清照。
文學的發展有一定的偶然因素,比如李清照的作品在宋代有很多種版本,用今天的話來說,宋代很多出版社出版了她的詞集,但到了明代全部失傳。她的作品只能去選本中找,最終只找到40多首。另外,與李清照同時期的女詞人朱淑真,在當時的影響力並不大,但她的幾百首作品反而全部流傳了下來。
也有很多古代紅極一時的詩詞,今天卻無人問津。如歐陽修《蝶戀花》(海燕雙來歸畫棟)、聶冠卿《多麗》(想人生)、周邦彥《側犯》(暮霞霽雨)、王觀《雨中花令》(百尺清泉聲陸續),它們分別在明代22種詞選中被入選17、18、19、20詞,差不多是明人詞選必選的名篇。可到了20世紀,其影響力和知名度降到了最低。箇中原因,值得思考與探討。
古詩詞的影響力始終處於不斷變化之中,很難通過一兩條材料得出全面、客觀、準確的判斷,而大數據可以完整展現出一首詩詞影響力的變化。
我從1992年第一次用數據分析古代詩詞,現在數據不斷豐富,模型不斷完善。2000年以後,大數據庫中除了中國不同歷史時期的古詩詞選本,還納入了歐美日韓等海外的中國古代詩詞數據。
目前,我們正建設古今中外詩歌的融合大數據平臺。該平臺已經收集了上百萬首中國古典詩歌,正在收集20世紀以來有中文翻譯的外國詩歌,以及五四運動以來的十餘萬首新詩。
沒有一個大數據可以窮盡樣本,但我們希望藉助人工智能得出誤差最小的結論。五四運動後的詩人郭沫若、胡適、聞一多,誰的影響力更大?在中國影響力最大的外國詩人是普希金、泰戈爾還是歌德?我們將用大數據說話。
受訪者簡介:
王兆鵬,四川大學文學與新聞學院文科講席教授、博士生導師。現爲中國詞學研究會會長、中國李清照辛棄疾學會會長、中國宋代文學學會常務副會長,《宋代文學研究年鑑》主編。主要研究唐宋文學和數字人文,主持國家社會科學基金重大項目2項。已出版《全唐五代詞》《唐宋詞史論》《詞學史料學》等專着十餘部,發表學術論文三百餘篇。
(本文來源:中新社「東西問」專欄,授權中時新聞網刊登)
※以上言論不代表旺中媒體集團立場※