A股語料勢力榜

GPT-4初步證明了這一點:只要掌握足夠多的宇宙知識,就能夠還原出足夠深的宇宙邏輯,就能夠成為文明的一脈。

而人類社會繁衍至今,在對客觀世界與顱內(nèi)世界的認知、改造的整個過程中,所形成的所有宇宙知識,都以語言文字這個容器所承載。

人類的語言文字,即人類的文明本身。這也正是OPenAI的秘密:以能夠?qū)崿F(xiàn)“語言洛希極限”的算力,基于對腦科學的模仿,對人類語言文字庫進行建模(Transfomer)計算,最終實現(xiàn)了所謂“智能的涌現(xiàn)”。在對語言文字的計算過程中,語料的價值等級依次展開:1.字:構(gòu)建語言大模型,首先要為每個字賦予獨特且足夠多的向量參數(shù)(理解向量參數(shù),可以顏色為例:字本身是沒有顏色的,但它對應的客體在特定狀態(tài)下都是有顏色的,所以需要以特定的向量數(shù)值去標記不同顏色的深淺程度);

2.詞:詞的意義在于,當多個字構(gòu)成詞以后,一個完整的邏輯就出現(xiàn)了——它必然可以形成一個句子,一個或多個句子可以形成一個完整的垂直領域內(nèi)的邏輯子集。邏輯本身,就是一幅圖——這是為什么語言大模型可以平順的生成圖片的原因。3.邏輯語料:數(shù)學、物理、化學、哲學等等各個基礎學科的語料內(nèi)容。凡是需要通過N個句子表達的基本宇宙邏輯,最終都將構(gòu)成不同的學科。而這些學科內(nèi)的邏輯語料,就是我們說的規(guī)律,即(認知)宇宙的基本框架。框架不斷延展,最終無限趨于宇宙本身。

4.輔助語料:邏輯是抽象的、枯燥且晦澀的。需要通過輔助型語料予以潤滑,進而使得計算體(比如人類)在無意識并行計算過程中,能夠建立起彼此間的交互可能性——喜怒哀樂這類淺層次的感情,以及幽默、愛這種深層次感情,都是輔助語料,它們的作用是使不同算力(能力)的計算體,都能在一個參照系內(nèi)形成非歧視的平衡關(guān)系。這類語料,*質(zhì)的即文學——文學通過對人性的抽離,實現(xiàn)人體計算的邏輯平權(quán)(人在人性上是平等的)。這也意味著,GPT-4這類機器智能最終如何得以與人類和平共處,需要未來在人與機器之間形成一種可平權(quán)的新型輔助語料體裁。

最近,業(yè)界出現(xiàn)了一個很“新穎”的點:用以訓練語言大模型的中文語料不足。以上述4類語料為參照,其中的不足,可能主要在于第3類與第4類。

有基于此,在我們看來,那些握有——或有能力整理出版——第3、4類語料的公司機構(gòu),將在GPT時代,有機會獲得價值中樞的擢升——畢竟ChatGPT、GPT-4更大化的向人類證明了那句名言:書籍是人類進步的階梯。也就是說,無論對機器,還是對人,自此之后,讀書已被確認為最核心的生存方式。

有鑒于此,本文將聚焦A股傳媒企業(yè),對各方價值一探究竟。

01出版商—語料價值鏈核心

2021年全球傳媒產(chǎn)業(yè)產(chǎn)值達到2.2萬億美元,同比增長6.5%,高于全球GDP增速5.8%。相較于門戶網(wǎng)站和搜索引擎紛繁復雜,充斥著虛假信息的數(shù)據(jù)集,傳媒出版行業(yè)的價值躍然紙上。

而出版發(fā)行行業(yè)產(chǎn)業(yè)鏈以出版社為核心,印刷和物資供應為產(chǎn)業(yè)基礎,通過發(fā)行環(huán)節(jié)實現(xiàn)最終交易。根據(jù)國家新聞出版署出版物種類劃分出版圖書劃分為書籍、課本、圖書和附錄四類,在我國,出版行業(yè)的平均利潤率一般為15%-25%,其中出版環(huán)節(jié)占全行業(yè)利潤額的70%以上。

(1)出版:出版機構(gòu)向上觸達內(nèi)容提供商、印刷商及紙張、油墨供應商,圖書出版一般包括申請書號、封面及版式設計、排版、審校、印刷成書等流程,最后向下連接發(fā)行機構(gòu),整合資源后將核心內(nèi)容呈現(xiàn)給市場。

出版機構(gòu)按照職能可以簡單分為社科類、科技類、大學類、教育類、古籍類、少兒類、文學類和美術(shù)類八大類。由于我國出版發(fā)行行業(yè)具有高意識形態(tài)特性,實行出版社許可制度,只有國企單位才具有出版資質(zhì),民營公司只能發(fā)行除教輔外的一般圖書。

(2)發(fā)行:發(fā)行機構(gòu)承接圖書出版之后的工作,主要負責將作品上架到發(fā)行渠道進行宣發(fā)售賣的過程,具體包括進貨、倉儲、運輸、銷售、調(diào)劑等基本環(huán)節(jié)。目前中國主流的發(fā)行模式分為兩種:一種是產(chǎn)銷結(jié)合的直接發(fā)行,該種模式下由出版機構(gòu)直接銷售給消費者;另一種為產(chǎn)銷分離的間接發(fā)行,該種模式出版單位通過出版物發(fā)行商將出版物銷售給消費者,因此有些情況下,發(fā)行機構(gòu)與出版機構(gòu)會有重合。

關(guān)于語料價值鏈的認知有兩個層面的理解:

縱向來看,無論是任何品牌的機器學習模型,對于語料的需求度僅是需求量+1,比如GPT如果學習辭海,只需要作為讀者身份買一本書。對于出版商而言,只不過是新增了一位顧客,不會有指數(shù)級的價值增量。

橫向來看,機器的學習能力遠高于人腦,所以橫向接觸語料的光度非常高,對于出版商而言,可供出版的版權(quán)種類和廣度就顯得額外重要。

因此帶著這兩個層面的理解,我們來梳理下A股上市的出版商近況。

02A股語料勢力榜

1、基礎概況

根據(jù)職能的不同,目前中國比較流行三種出版方式,分別是出版社出版、合作出版和自費出版??傮w來看,行業(yè)中市值排名前五分別為鳳凰傳媒、中南傳媒、浙版?zhèn)髅?、中文傳媒和山東傳媒。

2、語料價值

根據(jù)出版圖書類別的不同,各企業(yè)聚焦方向各有不同,但總體主要分布在少兒、社科、教輔教材幾個大類中,其中少兒與教材教輔類別的銷量與我國新出生人口呈現(xiàn)正相關(guān)性,而社科類圖書的銷量則與目前大熱的ChatGPT直接相關(guān)。

行業(yè)市值排名前五的企業(yè)出版圖書構(gòu)成情況如下:

因此從數(shù)據(jù)上來看,中文傳媒的一般圖書(社科、文學)比重最高,根據(jù)開卷網(wǎng)的信息,2021年出版集團層面實洋占有率排名前三的分別是中國出版,鳳凰傳媒和中文傳媒。

除此之外,ROIC(投入資本回報率)也能體現(xiàn)出版企業(yè)的語料價值,出版商的盈利模式是在獲取版權(quán)后,盡可能的獲取長尾收益。因此高價值的版權(quán)長期回報率更高,代表語料價值也更高。我們可以看到,內(nèi)蒙新華、新華文軒和鳳凰傳媒的ROIC排名前三。

另外無形資產(chǎn)也是版權(quán)價值具象化的體現(xiàn)之一,目前南方傳媒的無形資產(chǎn)超過了30億元,高于同營收水平的其他企業(yè),具體到構(gòu)成上,南方傳媒的無形資產(chǎn)主要為土地使用權(quán),知識產(chǎn)權(quán)價值并不高。

3、盈利能力

A股出版企業(yè)營收橫向?qū)Ρ?,中南傳媒營收最高,為126.17億元,營收增速為8.20%。但從收入構(gòu)成來看,出版類別的實際收入中南傳媒為32.73億元,排名第二,出版業(yè)務收入最高的為中國出版44.69億元。

毛利率在一定程度上能夠反映企業(yè)核心盈利能力和在產(chǎn)業(yè)鏈中的價值,出版作為產(chǎn)業(yè)鏈中的核心環(huán)節(jié),行業(yè)多數(shù)企業(yè)毛利率較為平均,分布在30%-45的區(qū)間內(nèi)。其中中文在線因為主營業(yè)務為線上出版發(fā)行,所以毛利率達到70.85%,為行業(yè)最高。

4、研發(fā)能力

再來看出版企業(yè)的研發(fā)支出,研發(fā)投入排名前三的分別為中文傳媒、中文在線和中南傳媒,分別為2.38億元、1.15億元和0.63億元。其中中文在線研發(fā)支出占收入比重居行業(yè)首位,為9.68%。

5、流動性

經(jīng)營性現(xiàn)金流方面,行業(yè)整體成熟度較高,所以行業(yè)整體近三年經(jīng)營性現(xiàn)金流入水平較為穩(wěn)定,其中以鳳凰傳媒、山東出版、新華文軒現(xiàn)金流入規(guī)模*,分別為33.21億元、25.57億元及20.47億元。

財務綜合表現(xiàn)端,中南傳媒是行業(yè)中的佼佼者,無論是代表企業(yè)整體盈利能力的毛利率方面表現(xiàn),還是研發(fā)投入的持續(xù)性,亦或是無形資產(chǎn)儲備以及營收增速方面都名列前茅;從成長性角度來看,在具備一定規(guī)模的基礎上,時代出版成長性表現(xiàn)可圈可點,其同等營收水平的公司里,擁有較高的研發(fā)投入與無形資產(chǎn)儲備,另外其流動性也較強,具備更高的抗風險能力。

具體到與ChatGPT的聯(lián)動方面,如果考慮機器學習橫向增長大于縱向增長,結(jié)合市值中文傳媒的潛在增長空間較大,因為營收種類中一般圖書占比*,其次實洋也排名前三。除此之外,鳳凰傳媒和中國出版的實洋占比也比較高。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-06
A股語料勢力榜
A股語料勢力榜

長按掃碼 閱讀全文