當代資訊內容的食安危機

今日的網路使用環境,使得我們日常接觸到的資訊內容危機四伏──而我們卻難以怪罪內容的生產者?

當代資訊內容的食安危機
(圖:《情色初心》劇照)

「如果沒有防止當場翻閱的膠帶,就能用內容取勝了。」
「那也要有內容呀!」

2017 年,日本市佔率僅 3% 的連鎖便利商店 MINISTOP 率先開始停售店內的成人雜誌;不久後,三大超商 7-Eleven、Lawson、FamilyMart 陸續跟進。到了 2019 年,成人雜誌在全日本超商幾乎絕跡,只有在非連鎖的店家比較能發現它們的蹤影。這是因應當時即將舉辦的東京奧運,為了在預期湧入日本的國際人潮面前建立良好形象而採取的措施。2022 年電影《情色初心》(グッドバイ、バッドマガジンズ)就以此為背景,講述一間出版社中發行成人雜誌的第三編輯部在大環境變化下委屈求全、最後仍失敗解體的故事。劇情走到後半段,想要存錢自立門戶的第三編輯部長因盜用公款被解僱,在垃圾場遇見已辭職的業務偷偷摸摸回來撿舊雜誌去賣,因而有了文章開頭的對話。

「這本還很暢銷。好好編輯的書,就算是舊書也有價值。」業務看著左手邊的雜誌說。接著他轉向右手邊:「這本就賣不出去,內容很糟。」

即使是成人雜誌,內容也有好壞之分;而身在其中的專業工作者,也明白什麼樣的內容能夠實踐理念,可惜理念不見得能賣錢。什麼能賣錢?在便利商店販售的雜誌為了防止消費者翻閱不付錢、或避免未成年人閱讀,每本都貼上了膠帶,所以銷量高低必須取決於聳動的封面和附贈的 DVD。

「退書主因之一就是 DVD 收錄時間太短。」
「上個月收錄 8 小時也沒變好啊!」
「封面必須出現『8 小時』這個強力字眼。」
「若照他們說的做,雜誌就是 DVD 的包裝紙。」

編輯部希望做出好看的雜誌內容,然而藏在膠帶後面的內容沒有機會贏得消費者的心,最終雜誌失去了原本引以為傲的本體,把編輯工作外包,能力出眾的新人編輯(即女主角)轉為經營網站素人投稿。這不只是成人雜誌的問題,同集團底下的招牌次文化雜誌收攤後,其副總編輯只能調到第三編輯部從事 DVD 影片剪輯的基層工作,其象徵意義不言而喻。


我想談的不是情色雜誌,甚至也不是雜誌,而是當代的資訊內容生產現象。

簡單來說,自 Web 2.0 的社群與自媒體成為人們交換資訊的核心以來,網路資訊變得非常多元、充滿活力和創意,但同時也十分危險。我說的危險,並非資訊戰、詐騙、釣魚等明顯的惡意行為,反而是源自於眾多素人生產者在缺乏專業訓練和把關下產出的內容依然能獲得流量青睞,使得追求品質所帶來的邊際效用大幅降低,最後導致資訊品質下滑的結果。惡意行為尚能喚起憂患意識,大眾的人性和市場機制則難以阻擋。因此,這篇文章的寫作目的並不在於糾舉特定人士或單位,而比較是抒發個人焦慮、以及提供他人一些自保或自我提升的想法。

讀者或許還記得我在今年年中寫了一篇〈音樂全球在地化:英美退燒,在地當道〉,探討前 Spotify 首席經濟學家 Will Page 和美國數據分析師 Chris Dalla Riva 共同研究的〈歐洲境內與跨境音樂串流的「全球在地化」〉(’Glocalisation’ of Music Streaming within and across Europe)論文。我時常閱讀後者的電子報《Can’t Get Much Higher》,他在數據之外也有不少關於文化的探討和洞見。

有一回 Chris Dalla Riva 訪問音樂記者 Jonathan Bernstein,讓我印象非常深刻。原因是 Bernstein 時常為《滾石雜誌》擔任「事實查核專員」(fact-checker),這是我第一次看到關於這項職位的描述。簡單來說,《滾石雜誌》會聘用許多兼職的事實查核專員,以確保他們的文章經得起讀者檢驗。要查核哪些項目呢?Bernstein 舉了很多例子,包括各種人名地名的拼寫法、數據和歷史事實來源的考證。如果無法 100% 確認事實,可能就需要在文章中加註資料來源或使用保留語氣(「據 xx 指出」之類)。甚至連文章內當事人自己的證詞,有時都不見得正確,需要格外留意。Bernstein 說:

始終維持正確無誤是很重要的事。以出版品而言,你會希望培養屬於自己的一群讀者。想要贏得讀者對於出版品的信任,其中一種方法就是讓他們每天翻開雜誌或上網站時,不會看到他們最喜歡的樂團被拼錯名字。

又說:

這些事對於製作雜誌的人很重要,因為能表現出你推出的是一項極高品質的產品。如果我在閱讀一本書或一份受到高度評價的出版品的文章,卻看到打錯字或名字拼錯,這會讓我對於整篇文章的品質打上問號。

我讀到這段時,心裡非常疑惑:「真的嗎?」因為現實生活中,我很少看到資訊生產者的公信力(credibility)因為未做好事實查核、寫錯字或其他內容品質瑕疵而受影響。通常會影響他們的,第一是政治立場,第二是大眾特別在意的某些道德問題如抄襲、吸毒(最近我們也都分別看到了相關案例)。他們的專業能力、專業態度,一般來說及格即可,多了也很難帶來更多效益。換句話說,當這種新的資訊商業模式被證明可行之後,當然沒有必要為了追求品質而額外增加成本。談話型 Podcast 就算考慮到每個人講話或收音音量的差異,而使用 compressor 或 limiter 來提升聆聽體驗,恐怕也不會因此增加多少聽眾。如果採用組合肉的夜市牛排是合理、合法、能夠獲利的餐飲類型,那麼店家自然不需提升食材品質。或者說,這些本來就不是他們的商業模式該追求的事。

台灣存在許多 fine dining 餐廳,有其高消費市場;然而製作精良的資訊內容並沒有同等的對價關係和消費族群。很大的一個原因,是社群媒體、影音平台、搜尋引擎作為中介者,把持了大眾接觸資訊的管道,也讓規模、品質高低不一的內容生產者一律扁平化。無論是一篇社群貼文或一則影片,在這些平台和服務上都是以同樣的表面規格呈現,透過幾乎相同的管道、成本接觸到大眾。這降低了資訊普及和素人生產內容的門檻,但也使得品質不同、性質不同的內容之間的界線變得難以辨識。比如說你在社群上看到一篇「知識文」,但它的前後可能是某個迷因粉專的哏圖、或朋友忙裡偷閒的牢騷。十之八九的情況,你使用這些平台是想追求娛樂,知識被迫混雜在其中,與娛樂一同競爭你的注意力,它原本應有的嚴謹因此削弱了,思考、研究、論辯的理想環境崩解了。生產者的角色同樣出現混淆,你可以時常看見許多知識網紅前一刻以公知姿態發表對於某條新聞的長篇個人觀點,下一秒就跟朋友聊起極為私人的瑣事。在享受閒聊的愉悅當下,他們很容易忘卻自己身為專業資訊生產者所應背負的責任。畢竟有多少人會一邊聊天一邊做事實查核、做平衡報導呢?(還是有人信手拈來皆專業,但終究是少數。)然而追隨者似乎也習以為常,能夠親近網紅們的私生活、感受其充滿人味的面向,反倒更讓他們感到自在且有趣。

另一方面,平台為了其自身商業模式而設定的內容表現指標,以一種霸道且難以查覺的手段反過來影響內容的生產規格與方向。按讚、留言、分享,不知從何時開始成為所有人評量內容優劣的共識;SEO 的種種規定,從根本上改變了網路文章的寫法,它的目的是要保證最符合搜尋引擎邏輯的文章能夠名列前茅,但這些文章和好文章無法劃上等號。

得流量者得天下,多的是挾流量撈過界大談自己不熟悉領域的人。這與前一段談到的問題關係密切,他們在原本專業上獲得了人氣,又因公私領域混淆而高估自己其他言論的重量。我認為這些名為流量的表現指標綁架了太多生產者,他們太快、太直接得到偏頗的量化回饋,過程中缺乏能夠保護或約束他們的組織、原則、協議。從前的記者之所以能寫出好報導,有很大原因是他們不需要盯著即時流量、且媒體公司會幫他們把外界壓力擋下。如果把數字從後台拿掉,或許有些人會慌了手腳,再也難以得知自己產出的內容究竟為世界帶來什麼意義。

流量反映人們的注意力,注意力源自情緒的擾動。現代人早已習慣手中握有社群媒體的拉霸機,藉由一次次下拉更新,期待滿足情緒的內容躍入眼簾。那種反覆為之、迫不及待的樣子,幾乎像是施打毒品一樣。我在〈在這個時空下,找一種音樂寫作的新方式〉一文中提過:

……我認為能引發大量注意的文字多半帶有強烈情緒,Facebook 的機制鼓勵使用者表達強烈情緒。當各種興奮、憤怒、傷心、狂喜、嫉妒、委屈,不屑……源源不絕湧進這條資訊流,Facebook 就成了一座情緒的煉蠱場。基於這樣的機制,與其花時間好好陳述事情,還不如用兩三句鋒利的語言來抒發情緒,得到的效果往往更好。這類語言在懶人化後,就成了「笑死」、「瘋掉」、「不可能……吧」等沒有太多實質內涵但充滿高漲情緒的社群流行語。

一樣是寫文章,一樣用文字來影響讀者情緒,對於生產者而言,為社群媒體是十分不同於出版書籍的心理狀態。他們會特別留意如何讓讀者在滑動螢幕時願意停下來、刺激他們即時產生情緒反應,做出各種正面或負面的互動行為。


我們每日接收到的海量資訊內容中,可能只有極低比例者經過專業編輯的檢視,更不用說在製作過程中參考所謂的風格指南、包容性原則等成文或不成文規範。然而最令我困擾的問題,或許還是文字和語言的「污染」,因為資訊的正確或專業與否不見得明顯,但文字語言就是清清楚楚地擺在那邊。來自中國的網路內容是一大主因,而且遠比老掉牙的「視頻」、「U 盤」更深入,徹底改變了許多人的句型結構。例如以下這句:

「有一個針對台灣特定語言與文化的大語言模型,才能更好地滿足當地語言處理需求,特別是在產業應用方面。」

大量的英語直譯是當代中國網路語言的一大特色,這個句子的結構和用詞顯然就是受其影響。多數人可能較能辨識出「特別是在……方面」有一種話沒說完的感覺,改為「在……方面更是如此」較為完整,然而魔鬼其實藏在「更好地 + 動詞」。這個結構直接來自於英文「better + 動詞」,卻因其使用起來非常直覺而廣為使用。直覺之處,在於你再也不用思考更精準的形容詞。明明可以用「更全面地滿足」、「更精準地符合」,你卻選用一個意義不明的「更好地」。更別說,這句話改成「才更能滿足當地語言處理需求」才是比較流暢的寫法。

其實我並不覺得中國式的用詞或句型結構比較「差」,很多時候我反而驚艷於他們各種造詞的創意與流動性。大量英語直譯讓中國人面對英語世界的新字、新概念時,無需太煩惱如何在中文語境裡造詞,因此不僅降低大眾接觸新知的門檻,還能率先取得華語世界的話語權,例如「元宇宙」、「插件」等。問題是,台灣人並不真的在中國式語法的脈絡裡,證據是我們只能(耳濡目染)學著用,卻難以進入他們的造詞邏輯,發明如「有一說一」這樣的新流行語來。這使得這兩種中文之間往往存在著明眼人能夠辨識的界線,一旦混著用,很容易出現違和感(當然,再違和也是可以因為長久習慣而漸漸無感的)。

長久以來台灣普遍缺乏優質資訊來源的現象,終於在 AI 爆炸的這一年成為真正要去面對的問題。前陣子中研院推出的繁體中文大型語言模型,在選用訓練資料時就遇到障礙

中研院說,此研究僅用了大約新台幣 30 萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含台灣的碩博士論文摘要、來自中國開源的任務資料集(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答。

且不論後面提到的任務資料集,光是維基百科這類常由業餘者撰寫的內容,就是很大的污染源。中文維基百科的管理群為了增加中文條目數量,審核標準遠不如英文來得嚴謹,可以看到上面有擺明自家人老王賣瓜的、參考來源從缺的、簡轉繁或英文直譯的、文字能力低落未經梳理的。而這些卻是台灣要開發大型語言模型勉為其難得選用的訓練資料,更是一般大眾每日都可能接觸到、容易誤認為專業正確的資訊來源。


在這種資訊環境的讀者,有什麼自保方式?我個人有幾個衡量的面向:

  • 我會注意生產者的用字是否正確、精準,是否願意打磨細節。這代表生產者對於專業的掌握和重視程度。
  • 我會注意生產者是否習慣使用煽動情緒的行文方式。
  • 我會注意生產者是否省略原始資訊來源、習於低層次的知識搬運。這代表生產者可能傾向為了自我利益習於收割他人成果、信口開河禁不起驗證、或漠視職業道德。
  • 我會注意生產者在面對他人指正時的處理態度,看他心底認為是正確謹慎重要,還是面子重要。

除了訓練自己判別資訊好壞,更重要(其實也更簡單)的是去接觸更營養的資訊來源。這跟飲食一樣,與其研究零食怎麼吃比較營養,不如直接去餐廳吃完整的原型食物。多看電影、多讀書、去上一整堂的課程。把讀書當成一生自我教育重要能力

至於生產者,我會說:我能了解在這個環境下,或是基於實務經營的考量,有時必須犧牲品質以換取生存機會,但我還是希望人們有時能回想一下自己曾被頂級的內容震撼到的心情。有能力吸引大眾注意力的人,應該更意識到自己對於他人的影響力。網路流通與科技發達,應該讓內容更接近事實、更具創意、更激發獨特觀點、提供更新鮮或舒適的體驗,而不是更容易做廉價的知識搬運。

最後,希望大家在求知路上都能過得很充實!