【“ZiDongHua”之人文化天下:數(shù)字人文】孫茂松:數(shù)字人文代表了未來(lái)的方向,語(yǔ)言文學(xué)方面的數(shù)字人文研究尤其需要注重機(jī)器與數(shù)字的結(jié)合,是一個(gè)需要團(tuán)隊(duì)的通力合作的工程,如此方能回應(yīng)一些人文社科中的重大問(wèn)題,借以提升中國(guó)在國(guó)際學(xué)界的影響力。

白鈺卓:《“九歌”自動(dòng)作詩(shī)系統(tǒng)的開(kāi)發(fā)與建設(shè)》一文報(bào)告了清華大學(xué)自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室(THUNLP)“九歌”作詩(shī)系統(tǒng)的研發(fā)情況,包括自動(dòng)作詩(shī)、集句、對(duì)聯(lián)等功能與相關(guān)的算法與原理,對(duì)人工智能進(jìn)行詩(shī)歌創(chuàng)作與研究提供了可能的方案。

 

 

 

數(shù)字使人文更新 ——“聲律·網(wǎng)絡(luò)·未來(lái):第三屆清華大學(xué)數(shù)字人文國(guó)際論壇”紀(jì)要
 
 
 
 
 
2022年11月12日至13日,由清華大學(xué)人文學(xué)院、《數(shù)字人文》編輯部主辦,巴克內(nèi)爾大學(xué)中國(guó)研究所協(xié)辦的“聲律·網(wǎng)絡(luò)·未來(lái)——第三屆清華數(shù)字人文國(guó)際論壇”,在清華大學(xué)以線上線下的形式成功舉辦。來(lái)自多個(gè)國(guó)家/地區(qū)的包括20所境外高校在內(nèi)的40多家高校及科研機(jī)構(gòu)的六十多位學(xué)者發(fā)表了他們的最新研究成果。近年來(lái),數(shù)字人文在中文學(xué)界蓬勃發(fā)展,此次論壇正值清華大學(xué)與中華書(shū)局共同創(chuàng)辦的《數(shù)字人文》學(xué)術(shù)輯刊創(chuàng)刊三周年之際,也是三年來(lái)編輯部第二次召集數(shù)字人文專業(yè)會(huì)議。大會(huì)秉承前兩屆論壇的精神,力圖做到翔實(shí)、生動(dòng)、專業(yè)、前瞻,以實(shí)事求是的態(tài)度,避免數(shù)字人文的泡沫化,讓數(shù)字人文的教學(xué)科研范式沉落到傳統(tǒng)人文學(xué)科內(nèi)部,使之真正生根發(fā)芽,開(kāi)花結(jié)果。為此,論壇精心籌備了三個(gè)專題——“聲律與古典詩(shī)歌專場(chǎng)”“網(wǎng)絡(luò)分析專題暨??l(fā)布會(huì)”“未來(lái)學(xué)者專場(chǎng)”,均是水到渠成,瓜熟蒂落的一次集中的成果展示。此次論壇作為清華大學(xué)人文學(xué)院成立十周年系列學(xué)術(shù)活動(dòng)之一,獲得了清華大學(xué)文科處“雙高”計(jì)劃和國(guó)際合作與交流處“國(guó)際化能力提升行動(dòng)計(jì)劃”的支持。作為清華大學(xué)第26次教育工作討論會(huì)人文學(xué)院新文科人才培養(yǎng)研討會(huì)的一部分,與會(huì)專家還就數(shù)字人文教育與交叉學(xué)科人才培養(yǎng)作了研討。
 
 
 
 
Opening Ceremony
 
          開(kāi)幕式         
 
 
在2022年11月12日的開(kāi)幕式上,清華大學(xué)人文學(xué)院院長(zhǎng)劉石、清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng)孫茂松、北京大學(xué)中文系主任杜曉勤三位教授分別致辭。劉石教授首先介紹了以清華為核心的數(shù)字人文跨學(xué)科團(tuán)隊(duì),該團(tuán)隊(duì)在學(xué)校的大力支持下于四、五年前成立,以人文學(xué)院、計(jì)算機(jī)科學(xué)與技術(shù)系和統(tǒng)計(jì)學(xué)中心的師生為主,也得到了來(lái)自社科院、澳門(mén)理工大學(xué)和浙江大學(xué)等高校學(xué)者的支持。受國(guó)家社科基金重大項(xiàng)目資助,幾年來(lái)創(chuàng)建了數(shù)字人文刊物、門(mén)戶網(wǎng)站和“璇琮數(shù)字人文智慧平臺(tái)”,還開(kāi)設(shè)了面向日新書(shū)院本科生的試驗(yàn)性課程。他還強(qiáng)調(diào),數(shù)字人文與傳統(tǒng)學(xué)術(shù)并不脫節(jié),在現(xiàn)在和未來(lái)都是一種趨勢(shì)。孫茂松教授代表計(jì)算機(jī)學(xué)界對(duì)論壇順利召開(kāi)表示熱烈祝賀,他贊許三個(gè)議題具有新意,充分反映了數(shù)字人文的特點(diǎn),帶有濃厚的人文色彩。數(shù)字人文代表了未來(lái)的方向,語(yǔ)言文學(xué)方面的數(shù)字人文研究尤其需要注重機(jī)器與數(shù)字的結(jié)合,是一個(gè)需要團(tuán)隊(duì)的通力合作的工程,如此方能回應(yīng)一些人文社科中的重大問(wèn)題,借以提升中國(guó)在國(guó)際學(xué)界的影響力。杜曉勤教授指出,數(shù)字人文有三個(gè)歷時(shí)性含義,一是上世紀(jì)用數(shù)字手段輔助人文研究;二是二十年前開(kāi)始結(jié)合網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)從事學(xué)術(shù)研究;三是現(xiàn)在將數(shù)字人文視為與理工科交叉的學(xué)科,有了自己獨(dú)特的研究對(duì)象。清華大學(xué)人文學(xué)院已形成自己的學(xué)科特色,在數(shù)字人文研究中占有重要的一席。本次會(huì)議與前兩次相比,呈現(xiàn)出焦點(diǎn)更集中、問(wèn)題更具體、選題更前沿的傾向。既有個(gè)案,又有理論。既有傳統(tǒng)特色,又展望未來(lái),對(duì)當(dāng)下數(shù)字人文研究有積極的推進(jìn)意義。
 
 
 
01
 
清華大學(xué)人文學(xué)院院長(zhǎng)劉石教授致辭
 
02
 
清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng)孫茂松教授致辭
 
03
 
北京大學(xué)中文系主任杜曉勤教授致辭
 
 
 
 
 
Classical Poetry and Prosody 
 
     古典詩(shī)歌與聲律專場(chǎng)     
 
 
“古典詩(shī)歌與聲律專場(chǎng)”下設(shè)“大數(shù)據(jù)與聲律研究”“語(yǔ)言與韻律”“基礎(chǔ)設(shè)施與詩(shī)歌研究”“詩(shī)學(xué)研究的數(shù)字人文應(yīng)用”四個(gè)研討專題。
 
 
 
“大數(shù)據(jù)與聲律研究”專題中,報(bào)告人主要圍繞近體詩(shī)格律與詞調(diào)研究?jī)煞矫嬲归_(kāi)討論。來(lái)自清華大學(xué)人文學(xué)院的韓婭非、陸泉宇和曲一迪的三篇文章著眼于《全唐詩(shī)》、《全宋詩(shī)》等大規(guī)模聲律樣本數(shù)據(jù)對(duì)傳統(tǒng)命題與關(guān)鍵材料的接駁與闡釋。韓婭非《<全唐詩(shī)>七言四句詩(shī)的聲律驗(yàn)證與發(fā)現(xiàn)》一文對(duì)唐代七言絕句的聲律情況作了定量考察和驗(yàn)證;同時(shí),結(jié)合音樂(lè)文學(xué)史的相關(guān)命題,討論了中唐聲詩(shī)的格律化,以及背律七絕的創(chuàng)作與音樂(lè)性的關(guān)系等命題,對(duì)“樂(lè)”與“律”二者的互動(dòng)關(guān)系進(jìn)行了詳細(xì)的闡釋。陸泉宇《永明體到近體中句內(nèi)聲調(diào)規(guī)則對(duì)立嬗變的考察:以“蜂腰”與“二四異聲”為例》一文對(duì)“蜂腰”和“二四異聲”兩個(gè)重要概念進(jìn)行統(tǒng)計(jì)分析,在改進(jìn)統(tǒng)計(jì)學(xué)方法的的基礎(chǔ)上,對(duì)不同版本的“蜂腰”與“二四異聲”觀念作了辨析,對(duì)“初腰”等詩(shī)律學(xué)命題作了解釋,并描繪了兩個(gè)規(guī)則在六朝到唐代的嬗變圖景。曲一迪、韓玉鳳《紹興新制與宋詩(shī)聲律》一文從南宋時(shí)在《禮部韻略》基礎(chǔ)上修訂的《附釋文互注禮部韻略》中一項(xiàng)聲律條目入手,探究了紹興時(shí)期科舉詩(shī)里“平平仄平仄”與“仄仄平仄仄”等句式的使用情況與原因,及其對(duì)唐代試律法式的繼承與拓展并進(jìn)一步討論了這與“拗救”等觀念的關(guān)聯(lián),認(rèn)為“大拗必救”說(shuō)是后人對(duì)二四同仄句式的誤解。文章同樣指出宋代民間與官方的聲律分層,基于不同制度背景,詩(shī)律規(guī)則會(huì)呈現(xiàn)出不同面貌。
 
 
 
 
 伍三土(溫州大學(xué))、曾智聰(香港都會(huì)大學(xué))、王琳夫(華東師范大學(xué))三位的報(bào)告集中圍繞詞律標(biāo)準(zhǔn)的確定與數(shù)字化構(gòu)建方法展開(kāi)。與詩(shī)律研究相比,詞律面臨倚聲填詞與依詞、依譜填詞間的爭(zhēng)議以及一調(diào)多體的問(wèn)題,因而更不容易直接進(jìn)入大數(shù)據(jù)統(tǒng)計(jì)分析的方法之中。伍三土《宋詞行腔理論與樂(lè)譜實(shí)證分析》一文嘗試充分運(yùn)用音樂(lè)與文辭雙方的本體史料,從節(jié)奏、聲字、韻字三個(gè)層面細(xì)化討論宋詞聲辭關(guān)系,與字聲結(jié)合提出一套系統(tǒng)的宋詞行腔法則,并對(duì)其適用范圍加以限定,認(rèn)為這套行腔法則的詞作及同時(shí)代其他歌譜。文章以姜夔詞為樣本,借助數(shù)字人文方法繪制了聲辭關(guān)系對(duì)照曲線并進(jìn)行旋律與字聲數(shù)據(jù)比對(duì),量化驗(yàn)證了文中提出的行腔理論。曾智聰《柳永慢詞聲律與抒情量化研究芻議》一文就柳永慢詞聲律的量化進(jìn)行了綱領(lǐng)性的分析,將平仄句式、韻腳韻部、韻位疏密等聲律要素與文本細(xì)讀結(jié)合,深入分析詞中聲律與抒情的關(guān)系。具體實(shí)現(xiàn)方式為,將柳永約110首慢詞連同詮釋資料(metadata)制作為數(shù)字文本并進(jìn)行標(biāo)記(tagging),建立“柳永慢詞聲律資料庫(kù)”,讓純文字文本變成有意義的資訊,即所謂“數(shù)位文本加值”。王琳夫《詞譜研究的數(shù)字化實(shí)踐》一文指出,目前大數(shù)據(jù)方法應(yīng)用于詞律仍較為謹(jǐn)慎,由于在聲辭配合形式、填詞方法等基本問(wèn)題上目前仍乏共識(shí)。詞譜編撰的三種傳統(tǒng)方法中,相較于詩(shī)律法與例詞四聲譜,應(yīng)用最為廣泛的“互校法”本質(zhì)上就是程序化、規(guī)?;?、精細(xì)化的字聲統(tǒng)計(jì),其思想內(nèi)核與今日的大數(shù)據(jù)理論相合。自動(dòng)箋注字聲、多音字辨析、聲律比較統(tǒng)計(jì)等方法的應(yīng)用也能夠極大地減少文獻(xiàn)比對(duì)中的機(jī)械勞動(dòng)。
 
 
 
 在評(píng)議與討論環(huán)節(jié),劉洋(中國(guó)政法大學(xué))與諸雨辰(北京師范大學(xué))兩位學(xué)者指出,在用大數(shù)據(jù)方法進(jìn)行聲律研究的過(guò)程中,對(duì)于數(shù)據(jù)處理手段以及規(guī)則的解釋十分必要,這體現(xiàn)了科學(xué)研究中的可還原復(fù)現(xiàn)原則。另外,以數(shù)據(jù)對(duì)接某些傳統(tǒng)規(guī)則與概念時(shí),有必要首先廓清基本定義,尤其對(duì)于粘對(duì)、拗救等具有一定爭(zhēng)議的概念范疇。詩(shī)與詞的所謂格律化一定程度是建立在文體案頭化基礎(chǔ)上的命題,然而在聲律研究中,音樂(lè)作為一項(xiàng)重要影響因素所產(chǎn)生的作用是不可忽略的,這關(guān)涉到聲詩(shī)體裁確認(rèn)、詩(shī)題變遷,以及聲辭對(duì)照中的古音還原等一系列問(wèn)題。
 
 
 
“語(yǔ)言與韻律”專題由謝思煒(清華大學(xué))、馮勝利(北京語(yǔ)言大學(xué))、劉麗媛(萊頓大學(xué))、邱冰(清華大學(xué))、張培陽(yáng)(南陽(yáng)師范學(xué)院)、郝若辰(清華大學(xué))等學(xué)者參與發(fā)表與討論,這一專題主要關(guān)注于詩(shī)歌中的韻律句法及其與聲律的互動(dòng)機(jī)制,以及對(duì)漢語(yǔ)史上某些問(wèn)題的具體探討。
 
 
 
謝思煒《白居易七言詩(shī)特殊句式探考》一文討論了白居易詩(shī)中的“節(jié)點(diǎn)變化”問(wèn)題以及格律詩(shī)對(duì)偶句中的“失對(duì)“現(xiàn)象,基于廣泛全面的梳理,對(duì)前人的既有相關(guān)命題進(jìn)行了反思與再考察,并對(duì)古代詩(shī)歌的詞性、句法等重要問(wèn)題加以翔實(shí)細(xì)致的考論。馮勝利《論中國(guó)韻律文學(xué)史上節(jié)律理論的發(fā)明》一文由劉麗媛代為宣讀,文章對(duì)韻律文學(xué)史下的理論進(jìn)行了詳細(xì)梳理,對(duì)屈原、沈約、劉勰等人的韻律理論分別進(jìn)行分析,突出強(qiáng)調(diào)了“節(jié)律”這一因素對(duì)文學(xué)創(chuàng)作的影響,并以探討詩(shī)律與文律誕生的的機(jī)制屬性。邱冰《中古漢譯佛經(jīng)語(yǔ)體色彩的數(shù)字化呈現(xiàn)》一文以人稱代詞、時(shí)間副詞、范圍副詞三類詞為代表,通過(guò)不同作品中不同詞類的文言詞/口語(yǔ)詞使用情況的比較,對(duì)中古佛經(jīng)的漢譯語(yǔ)體與風(fēng)格作了量化分析與可視化展示。張培陽(yáng)《言數(shù):傳統(tǒng)七古體制及其演變研究之一》一文從“言數(shù)”這一角度出發(fā),將分為純七古、近七古、雜言七古和騷體七古四大類,通過(guò)對(duì)先唐及唐代七古的分體裁、分作者考察,對(duì)“七古”這一體式的演變情況及其內(nèi)在作用機(jī)制進(jìn)行了分析。郝若辰《節(jié)奏、聲律與句法:生成詩(shī)律學(xué)視閾下古典漢詩(shī)與英詩(shī)格律比較》一文,由《魯拜集》與傳統(tǒng)七絕的形式對(duì)譯切入,繼而從音步、句長(zhǎng)與用韻三個(gè)方面將英詩(shī)與古典漢詩(shī)進(jìn)行比對(duì),聚焦于生成詩(shī)律學(xué)的“tension”理論與傳統(tǒng)拗救說(shuō)發(fā)生機(jī)制上的共性,嘗試提出以節(jié)奏作為句法與聲律間橋梁的古典漢詩(shī)生成韻律理論。
 
 
評(píng)議與討論環(huán)節(jié)中,謝思煒與張培陽(yáng)先后指出,首先,對(duì)于詩(shī)歌形式要素的研究應(yīng)避免求之太甚與過(guò)度闡釋,詩(shī)作的經(jīng)典性未必等同于某些形式標(biāo)準(zhǔn)或規(guī)則的普適性。其次,節(jié)奏是關(guān)涉多個(gè)方面的重要概念,因而確定音步劃分原則應(yīng)慎之又慎,在前人提出的不同觀點(diǎn)中仔細(xì)甄別,選取能同時(shí)與句法理論及詩(shī)歌誦讀節(jié)律銜接者。第三,關(guān)于詩(shī)句言數(shù)、押韻方式的討論應(yīng)具備歷史性思維,從詩(shī)體生成演進(jìn)等角度切入。
 
 
 
在12日的第三場(chǎng)討論中,陳逸云(微軟亞洲工程院)、李梅霞(中國(guó)人民大學(xué))、白鈺卓(清華大學(xué))、丁唯(美因茨大學(xué))、潘長(zhǎng)在(清華大學(xué))等基于數(shù)字人文基礎(chǔ)設(shè)施建設(shè)與詩(shī)歌研究的相關(guān)問(wèn)題進(jìn)行了報(bào)告,由陳逸云、胡韌奮(北京師范大學(xué))兩位學(xué)者主持評(píng)議。陳逸云《以搜韻網(wǎng)為例談聲律智能化在辨音、校讎和輔助創(chuàng)作上的應(yīng)用》一文對(duì)其建設(shè)的“搜韻網(wǎng)”詩(shī)歌平臺(tái)的功能與應(yīng)用進(jìn)行了詳盡的介紹,通過(guò)展示其對(duì)于詩(shī)律分析、對(duì)語(yǔ)統(tǒng)計(jì)、版本勘定、詩(shī)歌創(chuàng)作等方面的應(yīng)用,展現(xiàn)了智能化詩(shī)歌平臺(tái)對(duì)傳統(tǒng)詩(shī)歌研究的獨(dú)特價(jià)值。李梅霞《易數(shù)、樂(lè)律與古典詩(shī)律融通后的數(shù)據(jù)庫(kù)建設(shè)研究—以Unicode 13.0為中心》一文將樂(lè)律、詩(shī)律與易數(shù)相結(jié)合,分析了“數(shù)”在此三者中的共通作用。文章還討論了三者融通后、以Unicode13.0為中心的數(shù)據(jù)庫(kù)建設(shè)具體方案。白鈺卓《“九歌”自動(dòng)作詩(shī)系統(tǒng)的開(kāi)發(fā)與建設(shè)》一文報(bào)告了清華大學(xué)自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室(THUNLP)“九歌”作詩(shī)系統(tǒng)的研發(fā)情況,包括自動(dòng)作詩(shī)、集句、對(duì)聯(lián)等功能與相關(guān)的算法與原理,對(duì)人工智能進(jìn)行詩(shī)歌創(chuàng)作與研究提供了可能的方案。丁唯《PoemMetaVis:古典詩(shī)歌元數(shù)據(jù)動(dòng)態(tài)交互式可視化探索》一文,以東坡詞為例,進(jìn)行了對(duì)詩(shī)歌主題、動(dòng)態(tài)詞頻、詩(shī)歌時(shí)間線、情感傾向、物象語(yǔ)詞等方面的可視化展示。這有助于基于大數(shù)據(jù)對(duì)東坡詞、以及其他古典詩(shī)歌進(jìn)行多方面、多視角的研究與理解。潘長(zhǎng)在《TopWORDS-Seg分詞方法及其在詩(shī)歌上的應(yīng)用 》一文,介紹了基于古典文獻(xiàn)、醫(yī)療、法律文獻(xiàn)等專業(yè)領(lǐng)域開(kāi)發(fā)的中文分詞工具TopWORDS-Seg。TopWORDS-Seg通過(guò)利用貝葉斯框架將無(wú)監(jiān)督和有監(jiān)督的機(jī)器學(xué)習(xí)方法相結(jié)合,攻破了專業(yè)詞匯占比大且標(biāo)注成本高的語(yǔ)料的分詞難題。中文語(yǔ)料的分詞是文本挖掘的基礎(chǔ)步驟,分詞精度和新詞發(fā)現(xiàn)的表現(xiàn)極大程度地影響到后續(xù)任務(wù)的實(shí)現(xiàn),例如主題模型、關(guān)系提取等,目前TopWORDS-Seg在用于維基百科與《深度學(xué)習(xí)》測(cè)試中均有突出表現(xiàn)。將其用于古典詩(shī)歌分詞,準(zhǔn)確度比原始TopWORDS算法有10%的提升,并且初步回應(yīng)了五言詩(shī)中212和221兩種基本節(jié)奏的大致比例。
 
 
 
 
 
 “詩(shī)學(xué)研究的數(shù)字人文應(yīng)用”討論組于11月13日上午分為兩場(chǎng)開(kāi)展,第一場(chǎng)由李斌(南京師范大學(xué))與陳婧(香港理工大學(xué))負(fù)責(zé)主持及評(píng)議。Jack W Chen(陳威,弗吉尼亞大學(xué))《文學(xué)史、主題模型、散度度量:以閱讀全唐詩(shī)為例》(Reading the Quan Tang shi: Literary History, Topic Modeling, Divergence Measures)一文講述了如何通過(guò)主題模型和趨異測(cè)度兩種遠(yuǎn)讀的方法來(lái)探究《全唐詩(shī)》及相關(guān)文學(xué)史問(wèn)題。Jack W Chen教授指出,傳統(tǒng)文學(xué)史的書(shū)寫(xiě)傾向于反復(fù)書(shū)寫(xiě)或關(guān)注一小部分經(jīng)典作品和讀者,而大數(shù)據(jù)提供了全面探究文本的可能性。Jack W Chen對(duì)《全唐詩(shī)》的內(nèi)容構(gòu)成進(jìn)行了分析,并介紹了LDA主題模型在《全唐詩(shī)》研究方面的有為之處,認(rèn)為只有將數(shù)字人文方法和人類視角交織結(jié)合,才能對(duì)文學(xué)史有更為深入的理解。劉昭麟(臺(tái)灣政治大學(xué))《唐宋格律詩(shī)分詞標(biāo)記的探索》一文圍繞唐宋格律詩(shī)的分詞工作展開(kāi)討論,認(rèn)為詩(shī)歌的創(chuàng)作以美學(xué)抒情為要,基于個(gè)人賞析與詩(shī)人創(chuàng)作原意,詩(shī)歌不見(jiàn)得有如計(jì)算機(jī)領(lǐng)域所想象的唯一分詞。但在這一基本常識(shí)之外,希望能夠通過(guò)構(gòu)建格律詩(shī)數(shù)據(jù)庫(kù)以完成適用于大批量詩(shī)歌的分詞。許建業(yè)(香港樹(shù)仁大學(xué))《數(shù)位人文與明代唐詩(shī)選本研究》集中展現(xiàn)了對(duì)建設(shè)唐詩(shī)選本數(shù)據(jù)庫(kù)的思考。發(fā)言首先簡(jiǎn)述了目前已有的唐詩(shī)選本數(shù)據(jù)庫(kù)平臺(tái)的優(yōu)缺點(diǎn),指出當(dāng)前的常用平臺(tái)存在缺乏歸類、作者時(shí)代錯(cuò)置、OCR校對(duì)、及版本混雜等問(wèn)題,指出理想資料庫(kù)應(yīng)具備全文檢索、排列版本、統(tǒng)計(jì)方法、保留副文本等系統(tǒng)功能,并與智慧古籍平臺(tái)進(jìn)行合作,以便更好助力唐詩(shī)選本研究。王麗麗(哈爾濱工程大學(xué))與郭思文(北京航空航天大學(xué))《音以韻美:“音美”視域下<詩(shī)經(jīng)>英譯的美學(xué)觀照——以<關(guān)雎>的三個(gè)英譯本比較為例》一文基于許淵沖“三美”論中的“音美”原則,從比較視角考察《關(guān)雎》三個(gè)英譯本(許淵沖、Legge、Pound)中音韻美學(xué)的異語(yǔ)建構(gòu)情況。借助Praat 6.0語(yǔ)音軟件比較了譯本與原文的節(jié)奏、聲音和韻律,結(jié)果顯示三個(gè)譯本的節(jié)奏較忠實(shí)原文,元、輔音比例以及超音段特征(音高、音強(qiáng)和音長(zhǎng))與原文擬合度較高。此外,三個(gè)譯本均通過(guò)大量的頭韻、諧元音和諧輔音還原原詩(shī)的疊詞和雙聲。這一通過(guò)譯本的比較分析探究中國(guó)詩(shī)歌英譯過(guò)程中“音美”構(gòu)建,同樣可以為中國(guó)詩(shī)歌在英語(yǔ)世界傳播提供可借鑒的范式。評(píng)議環(huán)節(jié),學(xué)者們對(duì)相關(guān)問(wèn)題進(jìn)行了熱烈交流。本組集中討論了數(shù)字人文研究中字詞、詩(shī)集、韻律處理的三個(gè)主題,認(rèn)為當(dāng)下分詞、建設(shè)數(shù)據(jù)庫(kù)的工作需要目標(biāo)驅(qū)動(dòng),建立古詩(shī)文數(shù)據(jù)庫(kù)也是推進(jìn)研究的基礎(chǔ),具有廣闊前景。
 
 
 
第二組的報(bào)告交流由朱翠萍(中華書(shū)局)與唐宸(安徽大學(xué))主持、評(píng)議。李斌(南京師范大學(xué))、何盈學(xué)(華東師范大學(xué))、高策(清華大學(xué))的合作研究《多源數(shù)據(jù)參照的古典詩(shī)歌立體遠(yuǎn)讀法初探——以乾隆四萬(wàn)余首御制詩(shī)為例》將多源數(shù)據(jù)參照的古典詩(shī)歌“立體遠(yuǎn)讀法”應(yīng)用于乾隆御制詩(shī)的研究中。研究首先通過(guò)版本選擇、結(jié)構(gòu)化整理、數(shù)據(jù)清洗、自動(dòng)標(biāo)點(diǎn)等步驟,構(gòu)建起乾隆詩(shī)全文數(shù)據(jù)庫(kù);進(jìn)而對(duì)創(chuàng)作風(fēng)格與頻率兩個(gè)疑難問(wèn)題進(jìn)行重點(diǎn)分析。這一研究推動(dòng)了對(duì)大規(guī)模文獻(xiàn)乾隆詩(shī)的整體把握,避免對(duì)單一文本數(shù)據(jù)、孤立的統(tǒng)計(jì)分析,具有方法論層面的探索價(jià)值。清華大學(xué)李飛躍與宋佳霏《基于文本相似度分析的<紅樓夢(mèng)>詩(shī)詞溯源研究》一文利用數(shù)字人文方法的“編輯距離”“詞袋模型”“doc2vec”與“LDA主題模型”,篩選出《紅樓夢(mèng)》所化用的唐宋詩(shī)句及其詩(shī)集來(lái)源,分析它們?cè)谠~句、篇章層面的關(guān)系,從而探究曹雪芹的閱讀經(jīng)驗(yàn)與《紅樓夢(mèng)》詩(shī)意風(fēng)格的生成關(guān)系。通過(guò)分析這些詩(shī)句在康乾時(shí)期的所屬詩(shī)歌選本及其版本流傳狀況,認(rèn)為《才調(diào)集》等選本對(duì)《紅樓夢(mèng)》的詩(shī)歌創(chuàng)作或具有直接影響。同時(shí),報(bào)告通過(guò)與傳統(tǒng)文本細(xì)讀方法的比較,指出了文本相似度分析方法的得失并提出了改進(jìn)方法。韓玉鳳(清華大學(xué))《唐宋詩(shī)中的“江湖”書(shū)寫(xiě)》一文以“江湖”的詞旨演變?yōu)榍腥朦c(diǎn),考察唐宋兩代詩(shī)人使用“江湖”的用法差異。通過(guò)構(gòu)建《全唐詩(shī)》《全宋詩(shī)》中與“江湖”一詞的共現(xiàn)矩陣,發(fā)現(xiàn)唐宋“江湖”詩(shī)歌多與送別、貶謫等語(yǔ)用背景相關(guān);相較于唐,宋代“江湖”詩(shī)有著更為強(qiáng)烈的時(shí)空意識(shí)。唐宋言及“江湖”較多的詩(shī)人中,唐代杜甫、白居易偏愛(ài)“隱居”義,宋代詩(shī)人則廣泛使用“江湖”多層含義。唐宋詩(shī)“江湖”指向地點(diǎn)均以南方區(qū)域?yàn)橹鳎拼嘀赶蚪?、荊楚、巴蜀、嶺南等區(qū)域;宋代指涉地多為長(zhǎng)江流域,這與兩代不同的制度和交通背景有關(guān)。吳奕燊(清華大學(xué))與黎泓(倫敦大學(xué)學(xué)院)的《古典詩(shī)詞的空間分析途徑初探——以李杜詩(shī)比較為例》一文以李白、杜甫詩(shī)歌的比較為中心,將現(xiàn)有作家的生平行跡與作品編年系地?cái)?shù)據(jù)、作品寫(xiě)作地與寫(xiě)及地?cái)?shù)據(jù)、作家社會(huì)關(guān)系數(shù)據(jù)、歷史地理地圖基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)化,從而形成后續(xù)研究的參照坐標(biāo),這一研究的意義在于挖掘作家對(duì)文學(xué)史地理意象的貢獻(xiàn),對(duì)現(xiàn)有主流社會(huì)關(guān)系網(wǎng)絡(luò)分析工具的“籍貫定位”局限性起到有效彌補(bǔ)作用,也有助于對(duì)作家文學(xué)書(shū)寫(xiě)的空間距離作個(gè)案分析。在評(píng)議與討論環(huán)節(jié),與會(huì)學(xué)者們指出,基于計(jì)算語(yǔ)言學(xué)及相關(guān)研究的相似度分析與運(yùn)用了GIS等技術(shù)的地理信息空間是本組報(bào)告集中應(yīng)用的兩種手段,關(guān)注于類似的交叉與拓展,對(duì)于傳統(tǒng)文科研究大有裨益。
 
 
 
 
“古典詩(shī)歌與聲律專場(chǎng)”的四個(gè)討論專題,基本包含了當(dāng)前古典詩(shī)歌與數(shù)字人文交叉互動(dòng)的主要可能。聲律研究以其數(shù)據(jù)完備、方法清晰的特征能夠與數(shù)字人文方法較好結(jié)合,因而在此次論壇中給予了更多關(guān)注。然而聲律并非古典詩(shī)歌形式的唯一向度,在闡釋分析數(shù)據(jù)的時(shí)候不僅應(yīng)關(guān)注聲律數(shù)據(jù)本身,同時(shí)也需要著眼于與之緊密相關(guān)的節(jié)奏、句法因素,并且從語(yǔ)言學(xué)、漢語(yǔ)史的視角看聲律因素的生成與變化。在基礎(chǔ)設(shè)施建設(shè)討論組,“搜韻”與“九歌”團(tuán)隊(duì)也帶來(lái)了精彩分享,為用戶提供了知其然與所以然的機(jī)會(huì)。此外,本組關(guān)于分詞、編碼、可視化等細(xì)部問(wèn)題的討論也有益于人文與技術(shù)的深入融通。“詩(shī)學(xué)研究的數(shù)字人文應(yīng)用”組通過(guò)拓展論題,探究了古典詩(shī)歌的遠(yuǎn)讀的諸種可能。“遠(yuǎn)讀”概念最初由Franco Moretti在《世界文學(xué)猜想》一文中提出,主要針對(duì)大量無(wú)法細(xì)讀的非經(jīng)典以及浩如煙海的跨語(yǔ)言文本,討論組里的幾篇報(bào)告文章讓我們?cè)谶@兩個(gè)維度上看到了新的可能,沒(méi)有局限于可視化呈現(xiàn),而是致力于文本挖掘和知識(shí)發(fā)現(xiàn),很好地踐行了“數(shù)字讓人文更新”的理念。
 
 
 
 
 
Network Analysis and the Special Issue Launch
 
 網(wǎng)絡(luò)分析專題暨專刊發(fā)布會(huì)
 
 
“網(wǎng)絡(luò)分析專題暨??l(fā)布會(huì)”以“從隱喻到模型:作為研究與批評(píng)路徑的網(wǎng)絡(luò)分析”為主題,由巴克內(nèi)爾大學(xué)東亞系的陳松副教授和中國(guó)社會(huì)科學(xué)院文學(xué)研究所助理研究員趙薇負(fù)責(zé)召集和組織。來(lái)自清華大學(xué)、社科院文學(xué)所、巴克內(nèi)爾大學(xué)、南京大學(xué)、北京大學(xué)、中國(guó)人民大學(xué)、哈爾濱工業(yè)大學(xué)、陜西師范大學(xué)、南京師范大學(xué)、浙江大學(xué)、南京農(nóng)業(yè)大學(xué)、澳門(mén)理工大學(xué)、嶺南大學(xué)、南洋理工大學(xué)、芝加哥大學(xué)、斯坦福大學(xué)、加州州立大學(xué)、加州大學(xué)爾灣分校、伊利諾伊大學(xué)厄巴納-香檳分校、中央華盛頓大學(xué)、波士頓大學(xué)、阿斯伯里大學(xué)、威廉瑪麗學(xué)院、哥廷根大學(xué)的三十多位跨學(xué)科學(xué)者、二百余位海內(nèi)外聽(tīng)眾齊聚線上,就中文網(wǎng)絡(luò)分析在人文研究和計(jì)算批評(píng)中的新進(jìn)展展開(kāi)研討。
 
 
 
 11月12日上午的“人文網(wǎng)絡(luò)分析的實(shí)踐探索”專場(chǎng)伊始,《數(shù)字人文·網(wǎng)絡(luò)分析??罚?022年第1期)執(zhí)行主編趙薇回顧了與陳松教授一道,歷時(shí)三載的醞釀和籌備過(guò)程,對(duì)各位作者自始至終的信任和支持表示誠(chéng)摯感謝;對(duì)??u(píng)審人及作者、編者在這個(gè)過(guò)程中表現(xiàn)出的遠(yuǎn)遠(yuǎn)超出傳統(tǒng)治學(xué)的嚴(yán)謹(jǐn)態(tài)度和探索熱情致以敬意。同時(shí)也深刻地感到,盡管自1990年代起,網(wǎng)絡(luò)分析便被中國(guó)的社會(huì)學(xué)家,人類學(xué)家用于非正式關(guān)系的研究,但它鄭重地用于實(shí)打?qū)嵉娜宋膯?wèn)題,逐漸進(jìn)入傳統(tǒng)學(xué)者的眼簾,從而成為一種獨(dú)立的研究路向,真正凝聚起一批人,卻是近幾年的事。網(wǎng)絡(luò)分析不僅實(shí)現(xiàn)了從早期作為人際關(guān)系的“隱喻”,到研究關(guān)系結(jié)構(gòu)的“模型”這樣一個(gè)“概念上的飛躍”,也開(kāi)始由建模而走向“批評(píng)”,為人文學(xué)術(shù)帶來(lái)洞見(jiàn)和影響,因而很有必要以??男问綄⑦@一趨勢(shì)勾勒、呈現(xiàn)出來(lái)。
 
 
 
上半場(chǎng)三位報(bào)告者的聚焦點(diǎn)是純文本網(wǎng)絡(luò)的分析與批評(píng)。來(lái)自加州州立大學(xué)薩克拉門(mén)托分校人文與宗教研究系及歷史系的秦穎博士,根據(jù)人物對(duì)話的方向和次數(shù),構(gòu)建了《唐語(yǔ)林》的對(duì)話關(guān)系網(wǎng)絡(luò),對(duì)宋代軼事小說(shuō)中“語(yǔ)”的性質(zhì)和其編纂傾向做了深入探究和反思?;趯?shí)體共現(xiàn),伊利諾伊大學(xué)厄巴納—香檳分校的尚聞一博士提取《世說(shuō)新語(yǔ)》中人物互動(dòng)關(guān)系,運(yùn)用網(wǎng)絡(luò)模擬、指數(shù)隨機(jī)圖模型、社群發(fā)現(xiàn)等多種手段,層層推理、驗(yàn)證了小說(shuō)中門(mén)閥貴族的身份標(biāo)識(shí)是否凝聚成有效社群的問(wèn)題,在社會(huì)史的向度上拓展、深化了對(duì)歷史經(jīng)典論斷的討論。來(lái)自南洋理工大學(xué)的馬昭儀代表“空間人文與場(chǎng)所計(jì)算實(shí)驗(yàn)室”團(tuán)隊(duì)發(fā)言,他們采集155部唐傳奇文本中的OD數(shù)據(jù),以唐長(zhǎng)安城的坊里為節(jié)點(diǎn)、以故事人物在不同坊里間的移動(dòng)軌跡為邊,構(gòu)建出坊里空間交互網(wǎng)絡(luò),將中心度、模塊化的計(jì)算和文學(xué)制圖、空間插值等人文地理的分析手段結(jié)合,對(duì)各個(gè)坊里的重要性及其彼此之間的相互聯(lián)系做分析,探索了社會(huì)權(quán)力結(jié)構(gòu)更迭的空間表征形式。
 
 
 
這一場(chǎng)的評(píng)議嘉賓,南京師范大學(xué)文學(xué)院實(shí)驗(yàn)中心許超主任肯定了秦穎研究對(duì)歷史和文學(xué)因素的謹(jǐn)慎區(qū)分,尤其贊賞其靈活運(yùn)用點(diǎn)擊度分析,從一千多條軼事材料中發(fā)現(xiàn)了“玄宗因素”及其在文本后半部分的“反轉(zhuǎn)”。尚聞一的網(wǎng)絡(luò)不僅基于語(yǔ)義,而且具有現(xiàn)實(shí)的社會(huì)歷史意義,他的分析和做法有很高的借鑒意義,可以進(jìn)一步嘗試不同的聚類算法,找出異常值,同時(shí)擴(kuò)大網(wǎng)絡(luò)規(guī)模、嘗試不同的經(jīng)驗(yàn)性賦值。許超也指出,古代文獻(xiàn)自動(dòng)抽取關(guān)系的準(zhǔn)確率不高,人工提取反而較好;而數(shù)據(jù)如果過(guò)于稀疏,難以分出有意義的網(wǎng)絡(luò),歷史價(jià)值的闡釋較為困難,但是單純的敘事分析卻自有閃光點(diǎn)。評(píng)議嘉賓南京大學(xué)歷史學(xué)院王濤教授高度贊許何捷教授團(tuán)隊(duì)將可見(jiàn)度指標(biāo)引入社會(huì)感知分析的創(chuàng)造性做法,建議進(jìn)一步排除提取節(jié)點(diǎn)異常值影響,并結(jié)合小說(shuō)文本中的具體案例做分析,以增添結(jié)論的說(shuō)服力。
 
 
 
下半場(chǎng)論由《數(shù)字人文》副主編、《澳門(mén)理工學(xué)報(bào)》的桑海主持。來(lái)自陜西師范大學(xué)歷史文化學(xué)院的張光偉主任以西夏文字典《文?!分兴盏淖譃楣?jié)點(diǎn)、以解釋關(guān)系為邊,將整部字典轉(zhuǎn)化為有向網(wǎng)絡(luò),通過(guò)重復(fù)刪除出度為零的節(jié)點(diǎn)找出基本字集,全面發(fā)現(xiàn)《文?!分械难h(huán)解釋現(xiàn)象,從而重建了西夏字的解釋層級(jí)。其后,南京農(nóng)業(yè)大學(xué)人文與社會(huì)發(fā)展學(xué)院李惠副教授對(duì)社會(huì)網(wǎng)絡(luò)分析的常用算法和模型進(jìn)行了細(xì)致評(píng)估,并對(duì)其中可能存在的不足做出說(shuō)明。中國(guó)人民大學(xué)信息資源管理學(xué)院博士后研究員嚴(yán)承希從互文性理論入手,采用編輯距離、字符串匹配等文本復(fù)用算法,建立起基于句串相似度的中國(guó)古代“十三經(jīng)”互文數(shù)據(jù)集,開(kāi)發(fā)出實(shí)用的系統(tǒng),實(shí)現(xiàn)了內(nèi)、外部互文性可視化分析與瀏覽,也初步展示了互文網(wǎng)絡(luò)的生成。
 
 
 
下半場(chǎng)的發(fā)表得到南京大學(xué)歷史學(xué)院王濤教授和邱偉云副教授的熱烈回應(yīng)。王濤認(rèn)為張光偉的研究在人文基礎(chǔ)設(shè)施建設(shè)上具有開(kāi)拓意義,為后續(xù)西夏文研究夯實(shí)了根基,同時(shí)提出算法應(yīng)用于死文字研究的通用性問(wèn)題,以及套用其他語(yǔ)種字典進(jìn)行反證的可能性。評(píng)議嘉賓邱偉云副教授亦非常欽佩張光偉的做法,指出可以進(jìn)一步會(huì)通概念史研究路徑,探析漢人與西夏人在各自字詞典中所體現(xiàn)出的概念分類系統(tǒng)上的異同,進(jìn)行思想觀念的比較與互動(dòng)研究。針對(duì)李惠的發(fā)表,邱偉云建議未來(lái)可嘗試對(duì)中國(guó)特有關(guān)系網(wǎng)絡(luò)社會(huì)模式進(jìn)行探勘和多重建模,并與當(dāng)前已建構(gòu)的全球網(wǎng)絡(luò)模型進(jìn)行比較,推出具有中國(guó)特色的社會(huì)網(wǎng)絡(luò)模式。他也充分肯定了嚴(yán)承希研究的實(shí)踐意義,認(rèn)為可進(jìn)一步關(guān)注中國(guó)傳統(tǒng)經(jīng)典在互文過(guò)程中的傳播與接受問(wèn)題,期待對(duì)先秦典籍在互文網(wǎng)絡(luò)中的分群現(xiàn)象的新探索,進(jìn)而驗(yàn)證乃至商榷目前常見(jiàn)的先秦諸子學(xué)分類的適當(dāng)性;而經(jīng)過(guò)計(jì)算巨量文章中的言說(shuō)修辭的互文,還可探討其背后所隱含的思維框架及意義。
 
 
 
 發(fā)布會(huì)的第二個(gè)專場(chǎng)“海外漢學(xué)中的網(wǎng)絡(luò)分析”于2022年11月13日上午以Zoom Webinar的形式在線上舉辦,由本次??牧硪晃粓?zhí)行主編陳松主持,十余位海內(nèi)外學(xué)者分別做了英文發(fā)言和評(píng)議、討論。中央華盛頓大學(xué)的歷史學(xué)家林如蓮(Marilyn Levine)教授首先展示了近四十年來(lái)綜合實(shí)地訪談、檔案收集和電子化,堅(jiān)持不懈地建設(shè)中國(guó)人物傳記資料庫(kù)(CBD)的辛勞工作。隨后,重點(diǎn)陳述了如何運(yùn)用層次聚類和網(wǎng)絡(luò)分析的方法,將屬性數(shù)據(jù)轉(zhuǎn)化為關(guān)系數(shù)據(jù),構(gòu)建起一戰(zhàn)后中國(guó)旅歐知識(shí)分子群體的社會(huì)網(wǎng)絡(luò),用以考察其組織和活動(dòng)情況。這項(xiàng)數(shù)字人文研究為早期黨史研究貢獻(xiàn)了寶貴資料和全新視角。哥廷根大學(xué)東亞研究系盧嫻立(Henrike Rudolph)助理教授聚焦二十世紀(jì)八十年代出版的一項(xiàng)中國(guó)婦女活動(dòng)家集體傳記,運(yùn)用雙模網(wǎng)絡(luò)分析人物-事件-機(jī)構(gòu)等等傳記節(jié)點(diǎn),將潛隱于正統(tǒng)歷史敘述背后的、被遮蔽的賦權(quán)結(jié)構(gòu)揭示了出來(lái)。斯坦福大學(xué)東亞語(yǔ)言與文化研究系馬杰(Maciej Patryk Kurzynski)博士的研究,則借助詞嵌入、主題模型和網(wǎng)絡(luò)分析,設(shè)計(jì)出一套測(cè)度崇高美學(xué)效應(yīng)的計(jì)算模型,并通過(guò)對(duì)兩部當(dāng)代長(zhǎng)篇小說(shuō)詞匯網(wǎng)絡(luò)的中心度分析與計(jì)算批評(píng),為人們?cè)诟锩蚝蟾锩諊兄匦吕斫獬绺咝揶o的生產(chǎn)機(jī)制提供了量化視角。
 
 
評(píng)議嘉賓Paul Vierthaler (李友仁)助理教授,是來(lái)自威廉瑪麗學(xué)院的青年漢學(xué)家,數(shù)字人文學(xué)者。他認(rèn)為林如蓮運(yùn)用層次聚類的多變量分析手段和網(wǎng)絡(luò)分析結(jié)合的做法值得稱道,這種方法利用成百上千的人物屬性數(shù)據(jù),如籍貫,年齡,留學(xué),機(jī)構(gòu)等等,展現(xiàn)了個(gè)人之間不同尋常的迷人聯(lián)系,這是傳統(tǒng)路徑難以呈現(xiàn)的。同時(shí)他也對(duì)這些基本數(shù)據(jù)的具體樣式感到好奇。李友仁贊賞盧嫻立致力于開(kāi)發(fā)本體來(lái)為數(shù)據(jù)建模的做法,將人物關(guān)系與傳記節(jié)點(diǎn)分開(kāi)后,更便于人們認(rèn)清傳記資料實(shí)際上傳達(dá)了怎樣的思想,女性以什么樣的身份被編織進(jìn)了歷史敘事。而1949年前后網(wǎng)絡(luò)的對(duì)比,則帶來(lái)了更多吸引人的發(fā)現(xiàn)。針對(duì)Kurzynski的報(bào)告,李友仁認(rèn)為作者以一種十分有價(jià)值的方式,不僅將中國(guó)文學(xué)敘事中的崇高時(shí)刻展現(xiàn)出來(lái),而且將它們之間的關(guān)系從敘事框架中突出出來(lái)。在這個(gè)過(guò)程中,Kurzynski使用了高爾基的《海燕》來(lái)引導(dǎo)語(yǔ)義模型,而句子共現(xiàn)的窗口大小,也會(huì)影響最終的提取結(jié)果。在這一場(chǎng)的問(wèn)答和討論環(huán)節(jié)中,兩位發(fā)言人分別做出回應(yīng)。林如蓮教授展現(xiàn)了高維屬性數(shù)據(jù)的編碼方式,Kurzynski博士則回答了嶺南大學(xué)環(huán)球中國(guó)文化高研院黃峪博士關(guān)于文學(xué)遠(yuǎn)讀的問(wèn)題。趙薇與林如蓮教授分享了啟用相同方法構(gòu)建文體網(wǎng)絡(luò)時(shí)遇到的困難,如降維帶來(lái)的數(shù)據(jù)丟失問(wèn)題,還對(duì)這種以屬性相似性為基礎(chǔ)的網(wǎng)絡(luò)中心度計(jì)算的實(shí)質(zhì)究竟為何提出自己的看法。
 
 
 
下半場(chǎng)的“工具、平臺(tái)和基礎(chǔ)設(shè)施”專題由浙江大學(xué)海寧國(guó)際校區(qū)人文社科研究中心姜文濤副主任主持,共有三個(gè)團(tuán)隊(duì)的學(xué)者發(fā)言。作為一個(gè)合作團(tuán)隊(duì),阿斯伯里大學(xué)社會(huì)科學(xué)與歷史系助理教授馬飛立(Alex Mayfield)、波士頓大學(xué)的梅歐金(Eugenio Menegon)和Daryl Ireland博士,認(rèn)識(shí)到目前亞洲研究面臨的問(wèn)題與挑戰(zhàn),著手開(kāi)發(fā)了中國(guó)基督教歷史資料庫(kù)(CHCD)。他們以現(xiàn)今人文數(shù)據(jù)庫(kù)中仍不多見(jiàn)的Neo4j圖數(shù)據(jù)庫(kù)管理系統(tǒng)為底層技術(shù),通過(guò)語(yǔ)義三元組的結(jié)構(gòu)來(lái)儲(chǔ)存數(shù)據(jù),搭建了簡(jiǎn)潔易操作的人機(jī)交互界面,用戶可調(diào)節(jié)參數(shù),檢索并生成有關(guān)數(shù)據(jù)庫(kù)中的人,機(jī)構(gòu)和地點(diǎn)等實(shí)體之間的網(wǎng)絡(luò)。芝加哥大學(xué)Digital Studies項(xiàng)目的康森杰(Jeffrey Tharsen)副主任和ARTFL項(xiàng)目的格拉德斯通(Clovis Gladstone)副主任,采用基因序列比對(duì)和向量空間相似性計(jì)算的辦法,建立了用于文本互文性查詢和交互可視化的TextPAIR平臺(tái),可將“二十四史”中的全部借用、引用,或構(gòu)成影響關(guān)系的相似段落提取出來(lái)并建立關(guān)系網(wǎng)絡(luò),以期發(fā)現(xiàn)不同以往的宏觀模式。最后,加州大學(xué)爾灣分校東亞語(yǔ)言與文學(xué)系榮休教授、著名漢學(xué)家傅君勱(Michael Fuller)教授做了題為“Exploring Multidimensional Relations with the China Biographical Database”的報(bào)告。重點(diǎn)談及如何將CBDB傳記資料庫(kù)中的人物放置在多維屬性數(shù)據(jù)中(如生辰,親屬,師承,任職等),來(lái)構(gòu)建復(fù)雜網(wǎng)絡(luò),進(jìn)行比較研究。
 
 
 
 
評(píng)議嘉賓北京大學(xué)信息科學(xué)技術(shù)學(xué)院袁曉如教授從可視化角度,以及用戶、數(shù)據(jù)和交互性三個(gè)層面,對(duì)現(xiàn)有工具的局限性做了評(píng)估和分析,并呼吁跨學(xué)科合作,建設(shè)用戶使用體驗(yàn)更好的、溝通專家與普通用戶的中介性平臺(tái)。在問(wèn)答環(huán)節(jié),Mayfield團(tuán)隊(duì)回應(yīng)了陳松所關(guān)心的可否將數(shù)據(jù)和結(jié)果導(dǎo)出用于自行分析的問(wèn)題,歡迎更多的學(xué)者來(lái)親自探索這個(gè)交互平臺(tái)。本場(chǎng)由陳松教授做總結(jié)發(fā)言,他對(duì)合作編輯人、各位供稿學(xué)者、技術(shù)支持人員以及專刊主辦方在編纂與發(fā)布過(guò)程中的支持表示感謝,也對(duì)因非學(xué)術(shù)因素而帶來(lái)的出版延遲表示歉意。
 
    兩天的論壇圓滿落幕。誠(chéng)如召集者所說(shuō),他們固然無(wú)法用一場(chǎng)論壇,一期刊物的形式,將國(guó)內(nèi)外從事人文網(wǎng)絡(luò)分析研究的高手一網(wǎng)打盡,但卻希望能夠就此形成一束高質(zhì)量的、具有創(chuàng)新價(jià)值的經(jīng)驗(yàn)集合。不僅對(duì)于推動(dòng)中文文、史網(wǎng)絡(luò)分析的研究和批評(píng)意義重大,同時(shí)也開(kāi)啟了真正自由探討的氣氛。對(duì)他們而言,數(shù)字人文需要這種深入的討論,甚至數(shù)字人文自身更存在于這種充滿了探索,疑問(wèn)和不確定性的過(guò)程之中。
 
 
 
 
 
數(shù)字人文的未來(lái)更在青年學(xué)者身上。專門(mén)面向在校生和青年學(xué)者的“未來(lái)學(xué)者”專欄、專場(chǎng),一直是《數(shù)字人文》的特色,旨在發(fā)掘新人,鼓勵(lì)合作,大膽促成新觀點(diǎn)、新方法。本次專場(chǎng)由清華大學(xué)人文學(xué)院教師嚴(yán)程負(fù)責(zé)召集和主持,分為現(xiàn)代場(chǎng)和古代專場(chǎng),一共有十位來(lái)自清華大學(xué)、南京大學(xué)、復(fù)旦大學(xué)、北京語(yǔ)言大學(xué)等高校的純?nèi)宋谋尘暗谋究粕痛T士研究生分享了他們的個(gè)案研究,可以說(shuō)是近年來(lái)正在實(shí)驗(yàn)中的數(shù)字人文教學(xué)實(shí)踐的一次初步成果集結(jié)。
 
 
 
董曉涵:《性別試驗(yàn)場(chǎng):ABO小說(shuō)中女性意識(shí)初探》利用共詞分析方法,統(tǒng)計(jì)多部ABO小說(shuō)中熱點(diǎn)形容詞與主人公ABO性別和自然性別的共現(xiàn)頻次,構(gòu)建語(yǔ)詞網(wǎng)絡(luò),結(jié)合文本人工泛讀,探討其中反映的性別意識(shí)。王濤、桑海和趙薇老師認(rèn)為該選題很有價(jià)值,是網(wǎng)絡(luò)文化與數(shù)字人文結(jié)合的常識(shí)性探索,但需要有更強(qiáng)的問(wèn)題意識(shí)來(lái)指引;在概念界定和結(jié)果闡釋方面,也要做更精細(xì)的工作。
 
 
 
康吉贏:《數(shù)字時(shí)代的生態(tài)小說(shuō)研究 從概念驗(yàn)證到計(jì)算批評(píng)》設(shè)計(jì)了量化實(shí)驗(yàn),驗(yàn)證了二十世紀(jì)的生態(tài)話語(yǔ)進(jìn)入美國(guó)小說(shuō)敘事體系的過(guò)程中小說(shuō)“生態(tài)程度”的發(fā)展演變。王濤和桑海老師充分肯定了其對(duì)相關(guān)分析的創(chuàng)新應(yīng)用,以公式和曲線的遠(yuǎn)讀方式來(lái)勾勒百年小說(shuō)的生態(tài)化程度也令人耳目一新。不過(guò),關(guān)于生態(tài)文學(xué)的概念仍然需要細(xì)致界定;在論證上,選擇文本和證明方式有循環(huán)論證之虞,也需要注意。
 
 
 
雷征宇:《“Humanist”線上數(shù)字人文研討會(huì):組成、內(nèi)容及展望(1987-2018)》對(duì)歷史上活躍至今的“Humanist”郵件群組的發(fā)展情況做了數(shù)字人文分析。桑海和趙薇老師認(rèn)為其選題意識(shí),以及融宏觀觀察和微觀關(guān)照于一身的角度尤其可嘉,也期待看到更加有機(jī)、全面、深入的延伸性探索。
 
 
 
吳桐:《社會(huì)關(guān)系隔閡與非理性情感宣泄》運(yùn)用詞向量建模,網(wǎng)絡(luò)分析等方法探討《第二十二條軍規(guī)》文本中意象與情感關(guān)系,對(duì)人物處于“非理性”狀態(tài)的語(yǔ)言特征進(jìn)行驗(yàn)證。王濤老師認(rèn)為一個(gè)本科低年級(jí)學(xué)生能運(yùn)用眾多工具比較到位地論證問(wèn)題很不容易。也指出用情感詞典進(jìn)行情感分析的風(fēng)險(xiǎn)。桑海老師認(rèn)為需要多運(yùn)用國(guó)外的研究成果,意象詞匯和情感詞匯需要有明確的界定。姜文濤老師提出“非理性情感”“社會(huì)關(guān)系隔閡”等概念也需明確,同時(shí)社會(huì)性也應(yīng)考慮進(jìn)去。
 
 
 
下半場(chǎng)有五篇論文分享,涉及先秦到明清的論題。
 
 
 
付慧琳的《社會(huì)角色視角下的古代女性書(shū)畫(huà)家群體分析》借助echarts等工具將古代[zw1] 女性書(shū)畫(huà)家群體形象的關(guān)鍵信息進(jìn)行了可視化轉(zhuǎn)譯,從群體特征的角度對(duì)古代女性書(shū)畫(huà)家進(jìn)行形象建構(gòu)。朱翠萍老師認(rèn)為需要明確文章中44位畫(huà)家的代表性,論證“師徒傳承”這一角度的文獻(xiàn)全面性和有效性;邱偉云老師和唐宸老師就數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)量的擴(kuò)充提出期望。許可老師對(duì)文章的具體內(nèi)容進(jìn)行了詳細(xì)評(píng)議,并就明確 “社會(huì)角色”、完善摘要信息給出了具體建議;老師們表達(dá)了對(duì)數(shù)據(jù)和結(jié)論進(jìn)一步完善的期待。
 
 
 
黃煥波的《干支與吉兇——金文所見(jiàn)周人諏日方法的一種模型》一文借助統(tǒng)計(jì)方式對(duì)“初吉”的問(wèn)題進(jìn)行了探索。朱翠萍老師肯定了文章明確的問(wèn)題意識(shí)。唐宸老師認(rèn)為文章創(chuàng)新性強(qiáng),學(xué)術(shù)態(tài)度嚴(yán)謹(jǐn),提示作者要看到歷時(shí)性變化和特定場(chǎng)合吉日的不同,并建議與當(dāng)時(shí)的立法環(huán)境相結(jié)合。邱偉云老師提出,“陽(yáng)日”“陰日”的名詞作為發(fā)明的概念是否會(huì)與傳統(tǒng)的“陰”“陽(yáng)”觀念發(fā)生混淆;“諏日”一詞指的是在哪一天舉行占卜,用這個(gè)詞做標(biāo)題是否會(huì)引起爭(zhēng)議;對(duì)系統(tǒng)做驗(yàn)證時(shí)可以考慮進(jìn)一步擴(kuò)展數(shù)據(jù)量。
 
 
 
劉夢(mèng)涵的《古典詩(shī)詞“參橫”意象的時(shí)令規(guī)律與審美價(jià)值——基于數(shù)字人文天象模擬技術(shù)的探析》借助天文軟件,模擬蘇軾、陸游、朱彝尊等名家作品中的天文現(xiàn)象,歸納古典詩(shī)詞中參橫意象的審美價(jià)值。朱翠萍老師認(rèn)為此文帶有明確的問(wèn)題意識(shí),從科學(xué)入手,再?gòu)臄⑹鲁?。唐宸老師評(píng)價(jià)說(shuō):天文軟件能夠?qū)ξ膶W(xué)考證起作用,本論文創(chuàng)新性強(qiáng)。不過(guò)對(duì)于時(shí)令規(guī)律的邊界可以細(xì)化;學(xué)術(shù)語(yǔ)言可以再多加錘煉。許可老師也建議圖片可以再豐富一些,內(nèi)容會(huì)更完善。
 
 
 
徐藝瑋:《晚清以降中文書(shū)面語(yǔ)中顏色詞的使用與演變》根據(jù)洋務(wù)運(yùn)動(dòng)至今的中國(guó)報(bào)紙數(shù)據(jù),對(duì)顏色及其共現(xiàn)詞進(jìn)行分析,挖掘顏色反映出的歷史環(huán)境變化及與文化發(fā)展的關(guān)系。朱翠萍老師點(diǎn)評(píng)說(shuō):選取的數(shù)據(jù)量大,說(shuō)服力大,相對(duì)可靠,未來(lái)可以嘗試按照專題分開(kāi),延伸到不同領(lǐng)域,使結(jié)論更豐富。邱偉云老師認(rèn)為要說(shuō)明如何分層抽樣及去重。許可老師建議可以進(jìn)一步縮小范圍,比如針對(duì)廣告文獻(xiàn)作相關(guān)探討。
 
 
 
張琳越、鐘鈺婷的《數(shù)字人文視域下湯顯祖“臨川四夢(mèng)”比較分析》借助現(xiàn)代技術(shù)手段,從詞頻、人物社會(huì)網(wǎng)絡(luò)等四方面分析四部作品,對(duì)于學(xué)界目前對(duì)湯顯祖的一些論斷提出新的見(jiàn)解。朱翠萍老師認(rèn)為采用遠(yuǎn)讀的方式,解決了二夢(mèng)與三夢(mèng)的爭(zhēng)端。不過(guò)數(shù)據(jù)量相對(duì)小,可以擴(kuò)大到整個(gè)傳奇來(lái)看;也可以放在跨文化的視野下與西方的文獻(xiàn)對(duì)比探討。唐宸老師認(rèn)為有些論述和分析可再加強(qiáng),《邯鄲記》的情感方面的論述可以展開(kāi);重視原生文本以及傳奇對(duì)它的影響。許可老師認(rèn)為得出的結(jié)論與數(shù)字人文要更加結(jié)合,用數(shù)據(jù)要來(lái)支撐結(jié)論。
 
 
 
獲得了從事數(shù)字人文研究的老師們細(xì)致深入的點(diǎn)評(píng),同學(xué)們紛紛表示受益匪淺。未來(lái)學(xué)者專場(chǎng)圓滿落下帷幕。
 
 
 
Closing Ceremony 
 
          閉幕式         
 
 
持續(xù)兩天的三個(gè)分論壇之后,舉行了簡(jiǎn)短的閉幕式。《數(shù)字人文》副主編桑海代表論壇組委會(huì)公布了第三屆“未來(lái)學(xué)者”優(yōu)秀論文評(píng)選結(jié)果。與以往不同的是,本屆論壇獲獎(jiǎng)文章從全體參加論壇的在校生中產(chǎn)生,不再局限于學(xué)生分論壇。經(jīng)過(guò)與會(huì)專家的投票評(píng)選,陸泉宇獲得“第三屆清華數(shù)字人文論壇未來(lái)學(xué)者優(yōu)秀論文”一等獎(jiǎng),徐藝瑋、黃煥波獲二等獎(jiǎng),劉夢(mèng)涵、康吉贏、曲一迪/韓玉鳳獲三等獎(jiǎng)。其中,陸泉宇、劉夢(mèng)涵、康吉贏等三位同學(xué)的獲獎(jiǎng)?wù)撐亩际窃诒究普n程作業(yè)的基礎(chǔ)上完成的。
 
 
 
 
 
最后,桑海副主編對(duì)第三屆清華數(shù)字人文國(guó)際論壇作了總結(jié)。他首先回顧了三屆數(shù)字人文論壇的歷史,憶及《數(shù)字人文》團(tuán)隊(duì)的創(chuàng)始和發(fā)展過(guò)程。2017 年第一屆論壇是國(guó)內(nèi)首次以“文學(xué)研究”為主題的數(shù)字人文國(guó)際會(huì)議。劉石教授當(dāng)時(shí)就寄予厚望,對(duì)數(shù)字人文在文學(xué)研究中的前景充滿期待,會(huì)議的一些召集人和參與者后來(lái)也成為團(tuán)隊(duì)骨干。時(shí)隔兩年,在第二屆論壇召開(kāi)時(shí),清華大學(xué)數(shù)字人文已發(fā)生了“狂飆突進(jìn)”的變化,在論壇上發(fā)布了《數(shù)字人文》創(chuàng)刊號(hào),成為中國(guó)大陸正式出版的第一本數(shù)字人文學(xué)刊。在這兩屆論壇之間,劉石教授主持的國(guó)家社科基金重大項(xiàng)目“大數(shù)據(jù)技術(shù)與古典文學(xué)文本研究”立項(xiàng),《數(shù)字人文》也在摸索中逐步進(jìn)入狀態(tài)。編輯部始終堅(jiān)持嚴(yán)肅的學(xué)術(shù)精神,不輕易擴(kuò)大數(shù)字人文概念的邊界,努力探索中國(guó)數(shù)字人文研究的學(xué)術(shù)標(biāo)準(zhǔn),對(duì)缺乏問(wèn)題意識(shí)或徒有技術(shù)卻不具人文性的研究持審慎態(tài)度。第三屆論壇體現(xiàn)出團(tuán)隊(duì)在研究和教學(xué)上新的突破,更加具體、接地氣,三個(gè)主題分別聚焦于“聲律”這一研究領(lǐng)域、“社會(huì)網(wǎng)絡(luò)”這一研究方法,以及“未來(lái)學(xué)者”這一關(guān)乎數(shù)字人文后勁的重要面向。聲律是傳統(tǒng)詩(shī)歌研究中的重要問(wèn)題,但因文本量龐大,只能舉例論證,歷來(lái)聚訟紛紜,而數(shù)字人文方法使得對(duì)詩(shī)歌聲律進(jìn)行總體統(tǒng)計(jì)分析和建模成為可能。在論壇中既能看到謝思煒教授這樣造詣精深的古典文學(xué)研究者,也有剛進(jìn)入該領(lǐng)域的新銳學(xué)者,特別是孫茂松教授領(lǐng)銜的“九歌”作詩(shī)團(tuán)隊(duì),雖是計(jì)算機(jī)專家,卻有對(duì)人文的熱愛(ài)和尊重。他在繁忙的計(jì)算機(jī)學(xué)術(shù)工作中分出一脈情懷來(lái)專事研究與開(kāi)發(fā),為數(shù)字人文學(xué)者樹(shù)立了好樣板。網(wǎng)絡(luò)分析論壇展示了網(wǎng)絡(luò)分析方法從隱喻到模型的發(fā)展軌跡,及其應(yīng)用于中國(guó)文史研究所誕生的新成果。網(wǎng)絡(luò)分析專刊執(zhí)行主編陳松和趙薇也為此付出了巨大努力,希望后續(xù)的一系列??环艞墭?biāo)準(zhǔn),越做越有特色。最后,在未來(lái)學(xué)者論壇中,我們真正感受到了后生可畏,對(duì)于數(shù)字原生一代的青年學(xué)生,數(shù)字與人文的關(guān)系更加自然,或許孕育了更多令人驚喜的發(fā)現(xiàn)。