人工智能的文學創作:實踐與問題
在阿蘭·圖靈(Alan Mathison Turing,1912—1954)、馬文·明斯基(Marvin Lee Minsky,1927—2016)和唐納德·米奇(Donald Michie,1923—2007)等先驅者的推動下,人工智能產業已經開花結果,成為今天席卷全球的人工智能革命。人工智能正在對人類的核心領域形成挑戰,因為它揭示了人類從事的許多工作同樣可以由機器出色地完成,甚至完成得更好。在文學領域,人工智能也引發了一場大地震,最新一代的ChatGPT展示出了不弱于人類的想象力和創造力,甚至能應人類要求,以極快的速度創作出高水準的文學作品。這不禁讓人想起德彪西的名言:藝術作品創造規則;規則不創造藝術作品。那么,人工智能是如何影響文學創作的?它思考和創作的密碼是什么?它能與莎士比亞競爭嗎?
人工智能寫作的代碼
通過與藝術互動,了解平凡和偉大的文學作品的區別,機器能不能學會文學創作,像我們為孩子寫故事那樣具有創造性,是作家和科學家一直在探索的課題。
1953年,羅爾德·達爾(Roald Dahl,1916—1990)在短篇故事集《出人意料的故事》(Tales of the Unexpected)中,講述了一個“偉大的自動語法師”的故事。主人公阿道夫·克尼普是一個計算機天才,但一直渴望成為一名作家。然而,他的努力毫無成效。后來他有了一個靈感:語言遵循語法規則,在原則上基本上是數學的。有了這樣的認識,他開始著手創造一個巨大的機器——偉大的自動語法分析器,這個機器能夠在15分鐘內根據在世作家的作品寫出有獲獎潛質的小說。有了這臺機器,克尼普大獲成功,并成立了一家出版公司,作為這種新的大規模生產文學作品的合法機構。他統治出版業的最后一步是收購真正的作者,并付錢讓他們不再寫作。故事的結尾處,敘述者透露,“在用英語出版的所有小說和故事中,有一半以上是由阿道夫·克尼普在大型自動語法儀上創作的”。
用算法生成文學作品并不新鮮。最早為計算機編寫的程序之一就是為了寫情書而開發的。在布萊切利公園破解了英格瑪密碼后,阿蘭·圖靈前往曼徹斯特大學,將他的想法付諸實踐,制造出多用途計算機的物理版本。在他的指導下,英國皇家學會計算實驗室很快就生產出了世界上第一臺商業化的通用電子計算機費蘭蒂·馬克1號,這臺計算機具有浪漫的一面,只要隨機輸入單詞,它就能生成情書。20世紀60年代,法國一些作家和數學家一起使用算法來生成新的寫作文本,這個團體自稱為烏利波(Oulipo),意思是潛在文學工作室(Ouvroir de littérature potentielle),創始人之一雷蒙德·奎諾(Raymond Queneau)認為,約束是創作的重要組成部分,盲目服從每一個沖動的靈感,實際上是一種奴役,而通過對寫作施加準數學約束,可以實現一種新的自由。該團體的早期項目集中在詩歌上。任何寫過詩的人都知道,對詩歌的約束往往會將其推向新的表達方式。
正如烏利波運動所表明的那樣,詩歌創作特別適合算法的方式。詩歌形式的約束性提供了一個模板,算法可以嘗試以一種有意義的方式來填充。例如,選中俳句或十四行詩的模式后,算法的任務就是選擇與模式相匹配的詞,同時想出某種形式的總體一致性。如果用押韻的模式來寫詩,押韻的詞語數據庫就非常有用。這就是20世紀80年代由未來學家雷·庫茲韋爾(Ray Kurzweil)創建的控制論詩人(cybernetic poet)背后的代碼原理。庫茲韋爾以雪萊和T. S.艾略特等有成就的詩人的作品來訓練控制論詩人。這首控制論詩人的俳句,就是根據濟慈的詩歌寫成的:“你打碎了我的靈魂。/永恒的汁液。/我嘴唇的精神?!边€有一首融合了雪萊《西風頌》和艾略特《普魯弗洛克的情歌》風格的詩:“秋天女士的存在。/你,從那天起,不得不關心/現在教我們徹底的渺小和創造。/然后推測?/還有這個,還有我。/還有那未曾說出的話語,那未曾讀過的景象在海灣里的位置。/還有米開朗琪羅的后代?!痹趲炱濏f爾進行的圖靈測試中,控制論詩人創作的詩大多數時候都能騙過人類裁判,冒充人類寫的詩。
算法不僅在創作詩歌方面表現良好,在創作小說方面也有所嘗試。烏利波團隊成員約翰·萊斯庫爾(Jean Lescure)首先產生了將算法應用于現有文學作品的想法。這一想法為全國小說創作月(National Novel Writing Month)的編碼員所實現。他們邀請新銳作家在一個月內敲出5萬字來。軟件開發人員和藝術家達柳斯·卡茲米(Darius Kazmi)當即決定,與其費盡心思每天寫出1667個字,不如在這個月里編寫出可以生成5萬字小說的代碼??ㄆ澝子?013年發布在社交平臺上的這一想法,開啟了一年一度的文學黑客馬拉松。許多參加全國小說創作月的編碼者都通過打亂現有文本來創作新的文本,如通過推特過濾《傲慢與偏見》(Pride and Prejudice);通過科幻算法解釋《白鯨》(Moby Dick);通過代碼對古斯塔夫斯·欣曼·米勒(Gustavus Hindman Miller)的《一萬個夢》(Ten Thousand Dreams)進行解釋和重新排序。但引起人們注意的是一部名為《探索者》(The Seeker)的作品。這部小說記錄了一個算法通過閱讀wikiHow上的不同文章,來了解人類如何運作的過程。該算法有一個元代碼:工作、掃描、想象、重復。在工作模式下,它搜索有關人類活動的概念;在掃描模式下,它從工作期間遇到的種子概念中搜索純文本“記憶”;然后,它使用在掃描模式中沒有識別的概念來想象種子概念周圍的“非視覺”?!短剿髡摺酚涗浟嗽撍惴ㄔ谔剿鱳ikiHow數據庫時從無知到理解的發現之旅。它查閱的第一個頁面是“如何讓一個女孩約你出去”。從這次掃描中發現了“傷害”這個詞,在“想象”模式下,它產生了一個關于“傷害”的超現實翻版。這就是算法生成文學作品的最終目標:讓我們了解一種新興的意識(如果它真的出現的話),以及它與我們人類的意識有什么不同。因此,目前至少可以保守地估計,人工智能離創作偉大的文學作品還有一定距離,但在創作詩歌、暢銷商業書籍方面已經相當成熟了。
人工智能寫作的升級:風格和自由
上述多數例子都依賴于自上而下的編程模式:按照一套明確的規則隨機填寫的詩歌模板;將經典文本轉化為新作品的代碼;通過編程將數據轉化為故事的算法。這些程序其實并不允許有太多的自由。機器學習正在改變這一點?,F在,算法有可能把一個作者的整個作品拿出來,學習他們的寫作方式。通過建立一個關于作者如何用詞的概率圖,算法可以生成某個文本的延續。這就是預測性文本的工作方式。
這種利用機器學習來創作文學作品的想法得到了一個自稱為Botnik的團體的實踐。這個團體由作家杰米·布魯(Jamie Brew)和《紐約客》的前漫畫編輯鮑勃·曼考夫(Bob Mankoff)于2016年創立,現在是一個開放的作家社區。該團體根據對過去對話的數學分析,將《宋飛正傳》(Seinfeld)的劇本制作出了新的劇集,甚至還將七卷本的《哈利·波特》進行了改寫實驗。這種算法的做法是:在已存在的文本基礎上,提供18個詞供你選擇。這給了創作者極大的自由,可以任意發揮自己的想象力。因為這種算法在創建文本時仍需人類的參與,而且它也只能在捕捉作家風格的基礎上做出局部的改變,因此,它暫時還無法取代小說的人類創作者。
講故事的算法Scheherazade-IF成立于2012年,由馬克·里德爾和他在佐治亞理工學院的同事共同開發。它的目標是在可能的故事迷宮中引導出一條更連貫的路徑。該算法的名字來自《一千零一夜》中的蘇丹新娘謝赫拉莎德(Scheherazade),她通過夜以繼日地想出新的故事來吸引和分散殺人的丈夫的注意力,從而挽救了自己的生命;IF則代表“互動小說”(interactive fiction)。另一個在生成童話方面取得成功的算法是PropperWryte。它的童話算法是根據結構主義者弗拉基米爾·普羅普(Vladimir Propp)在1928年確定的俄羅斯民間故事31種敘事原型來進行訓練的。
ChatGPT創作功能和人工智能的缺陷
2022年,美國人工智能研究公司OpenAI開發了聊天機器人ChatGPT,代表著生成性人工智能的最新發展。它通過聊天(對話)的方式進行工作,即用戶只需在ChatGPT界面上輸入指令,可以是一個問題,一個任務,或者是隨意的聊天。ChatGPT系統分析輸入的指令,使用機器學習算法來生成回應,然后以文本的形式返回給用戶,用戶可再次輸入文本,ChatGPT系統再次進行分析和回應,這個過程可一直持續到對話結束。正是基于以上這些特性,ChatGPT的出現讓很多人擔憂文字生產者即將被淘汰。ChatGPT能寫詩,也能創作小說、劇本、隨筆、評論等,雖然創作出來的作品稍顯程序化,但大體上還是能滿足創作規范和要求的。
近日,筆者專門請在英國高校任教的朋友幫忙測試了ChatGPT的創作功能。例一:對ChatGPT輸入指令:以春、江、花、月、夜這五種事物,創作一首七言律詩。結果如下:“春風婉轉吹江岸,花開盛放映月寒。夜色漸深思悠遠,水流漣漪夢逍遙?!贝嗽婋m然難以和唐代詩人張若虛的名篇《春江花月夜》相媲美,但至少在形式和韻味上體現出了唐詩的特色。例二:對ChatGPT輸入指令:請寫一段莎士比亞風格的獨白。結果如下:“生命是如此短暫,我不知道自己還能留在這個世界上多久。也許,我應該像一只孤鳥一樣,飛往遠方,去尋找自己的歸宿。但是,我害怕孤獨,我害怕被遺棄,我害怕面對那個孤獨的夜晚。啊,人生如夢,一切都是虛幻,卻又那么真實。我不知道該如何面對這個世界,但我知道,我必須繼續前行,即使一切都已經毀滅?!边@是不是有點莎士比亞的味道?
不過,ChatGPT的創作也有缺陷,如對數據資源的依賴、創造虛假信息、有立場偏見等。而且ChatGPT人機交互的模式也決定了人是主動提問的一方,而機器只是生成答案;機器也許可以模仿人類的自然語言,卻無法生成人類的自我和意識。自我和意識的概念與人類的創造力密不可分。沒有自我和意識,就沒有創造力。就是說,在機器變得有意識之前,它只是一種擴展人類創造力的工具。人工智能是否最終變得有意識,真正具有創造性?它的意識會和我們的意識一樣嗎?這些都是需要我們思考的問題。
或許,人類的命運將取決于它與有意識的機器的相互理解。但是,正如維特根斯坦所說,如果一只獅子能說話,我們可能不會理解它,這同樣適用于機器。如果它們變得有意識,人類也不太可能理解。最終,將是它們的繪畫、音樂、小說等創造性的產出,甚至是它們的數學,讓我們有機會破解機器的密碼、感受到機器的感覺。
目前,機器的所有創造力都是由人類代碼發起和驅動的。除了我們讓它們做的事情,沒有看到機器主動地表達自己。人類用來想象和創新的創造力是人工智能永遠無法觸及的能力。而且,我們還需要看到,目前人類創造算法的動力,在大多數情況下不是由擴展藝術創作的愿望,而是由產業和公司的利潤所推動。關于人工智能有大量的炒作,對其功能也有夸張夸大的成分。
(作者系《世界文學》編輯)