焦點:數讀
“打字機”的回歸

機器人記者是未來趨勢嗎?
機器人記者是未來趨勢嗎? | Photo: The Cookiemonster, via flickr (CC BY-SA 2.0)

覆蓋多語種、寫作神速:新聞行業使用可自行撰寫文章的軟體越來越普遍。這種所謂的機器人新聞寫作 (Roboterjournalismus)可減輕編輯部的工作負擔,但也可能取代部分工作崗位。有一點可以肯定的是,軟體無法迅速“感受”喜怒哀樂和產 生情感共鳴。不過在不久的將來,它也許就比較能夠令人信服其模仿人類的心理活動。

大多數人看待機器人的心態大抵可以用一個詞來概括,那就是“矛盾”。一方面,人們很喜歡《星球大戰》系列電影裡的R2D2這樣可愛的機器人;另一方面,一 看到拍攝無名工業機器人正在默默工作的照片,人們往往就立刻想到裁員。這樣看來,機器人新聞寫作這個詞倒是恰如其分(儘管聽起來有點蠢),因為它表達的是 一種矛盾心理。

現在,軟體已經可以寫出中規中矩的新聞來:儘管它無法撰寫長篇報導、短評或記者評論,但對於足球比賽簡報或某檔股票走勢的新聞通訊等類型的文章,還 是遊刃有餘。這方面,軟體與人類記者相比,主要具有三大優點:一是速度——不到一秒鐘時間就可生成一篇文章;二是可以根據各種資料庫準確地調整和修改報導 涵蓋的內容;三是機器人記者可以同時將一篇文章寫成多個語種的版本。

編入程式的知識

德國軟體公司艾獅瑪(aexea)就是以這種會寫作的軟體為賣點,它聲稱開發出的軟體目前已掌握了11種語言——其中還包括普通話。這家企業位於斯 圖加特,靠廣告業起家,它推出的寫作軟體最初也是源於廣告:研發這些軟體,是為了幫旅遊網站自動生成度假屋的目錄說明,並且包含多個語種。這樣一來,潛在 的顧客看到的就不再是冷冰冰的表格資料,而是略微有些變化的說明文字。優點還不止於此:像谷歌這樣的搜尋引擎網站也歡迎有個性化的產品說明介紹,產品的排 位因此得以在搜索結果中比較靠前。

現在,這種自動寫作的前提條件是必須梳理好基本資訊(例如列成一張表格),從而使機器可以讀取這些資訊。另外,還必須有明確的規則規定如何評判某項 結果或某個過程。這就是為什麼機器人非常適合用來撰寫體育新聞的原因。這類新聞常常需要數數——例如運動員奔跑了多少米,成功傳球有多少次等等。而且它還 有明確的規則體系。如果能把規則轉化為邏輯演算法,使軟體能夠判斷好壞對錯等,就可以由此生成一篇文章。軟體在寫作時,需要用到在程式中編寫好的關於語法 和正字法的知識,還可以用到短語庫,以便寫出富於變化的文章來。近年來,業界正在大力研究這種語義學軟體,即所謂的“自然語言”程式(natural language)。這種程式能夠“理解”人類語言的語義關聯,並將其複述出來。也就是說,這類軟體通過讀取資料庫,不僅可以知道橡樹是一種樹木,還能得 知這種樹木在森林中很常見,除了冬天外樹上都有葉子。

對細膩情感的敏銳感知

在“自然語言”研究方面,人們不斷取得了進步;事實要作為資料而存在的必要性正在不斷減弱——在可預見的將來,“人工智慧”幾乎可以毫無差錯地從未 經梳理的資料來源中獲取相關資訊:這些來源可以是文章、照片、視頻、音訊等。但是,在許多領域,機器人仍然無法取代記者和某些作者:例如,短時間內,人們 應該不會在副刊中讀到自動生成的戲劇評論。在那些需要有移情能力、幽默細胞和對細膩情感有敏銳嗅覺的地方,在那些無法用數字來把握和表達事件程序的地方, 人類仍將長時間佔據優勢。因此,也不會很快就出現機器人寫的長篇小說霸佔暢銷書排行榜的情況。

但從中長期來看,有軟體能夠很好地分析暢銷小說的語言和主題套路,從而模仿出至少可以一看的小說,也是有可能的。創作這樣一部人工合成的暢銷書的基 礎,是複雜的統計操作:例如字數、句子的長短變化、人名在文中出現的位置等。此外,還可以通過“情感分析”的方法分析亞馬遜和Goodreads等網站平 台上的書評和互動。這種小說也可以做成有聲書的形式。因為自動生成的合成語言的品質同樣在不斷提高:今後,廣播中也將出現機器人寫作的新聞。

真人還是機器?

亞歷山大·西伯特(Alexander Siebert)預言,到2020年,人們無法再分辨一篇文章究竟是人寫的還是機器寫的。西伯特是該專業領域的另一家德國公司雷夫雷斯科 (Retresco)的創始人。這家公司總部坐落於柏林,推出了一款“文本引擎”,現在已被足球門戶網站“足球之友”(FussiFreunde)採用。 老闆西伯特認為,自動寫作的一大優點在於,可以寫出個性化程度較高的新聞通訊:它可以準確地根據讀者的興趣愛好量身定制新聞。

在機器人新聞寫作領域,芝加哥叙事科学公司(Narrative Science)是與同樣來自美國的自動洞察公司(Automated Insights)齊名的、被視為標杆的企業。公司創始人之一的克利斯蒂安·哈蒙德(Kristian Hammond)預測了一項更大的進步。他認為,到2030年,90%的新聞都將直接由電腦生成。不過記者們並不需要由此而擔心自己的飯碗。因為機器寫作 的只是一些不值得投入人力勞動的簡單報導。

有一點可以肯定地作出預測:在數位時代,不久以後,新聞軟體至少可以達到普通助理的水準。它可以幫人類同事準備文章草稿,並承擔無聊的調查工作。不過,自動撰寫報導的發展趨勢會對新聞工作者的就業市場產生哪些影響,還需要另加探討。